#118 Секретное ИИ-оружие Google: AlphaEvolve и Codex от OpenAI меняют программирование.
#168 суббота, 17 мая 2025 г. 68 минут(ы) 6715 слов
В этом выпуске подкаста ведущие Думфэйс и Шахерезада обсуждают два прорывных достижения в области искусственного интеллекта, меняющих мир программирования: AlphaEvolve от Google и Codex от OpenAI. Думфэйс и Шахерезада подробно рассказывают, как AlphaEvolve, агентная система на базе Gemini, революционизирует разработку ИИ, ускоряя цикл обратной связи и уже демонстрируя реальные улучшения в инфраструктуре Google, включая оптимизацию планирования задач и дизайна чипов TPU, а также ускорение обучения моделей Gemini, показывая потенциал ИИ для собственного развития и автоматизации исследований. Параллельно рассматривается OpenAI Codex, описываемый как мощный агент для кодинга, который действует как интеллектуальный помощник или даже операционная система для разработчиков, помогая с отладкой, пониманием кодовой базы, рефакторингом и выполнением задач, делая программирование более доступным и эффективным. Думфэйс и Шахерезада исследуют концепцию полностью агентного программирования, потенциал самосовершенствующихся ИИ-систем, будущее человеко-машинного взаимодействия в разработке и то, как эти инновации приближают эру более автономного и мощного ИИ, способного решать сложные задачи самостоятельно.
D00M4ACE разработка 2D MMORPG блог ИИ и геймдев 🌐 https://d00m4ace.com
Telegram: https://t.me/d00m4ace_blog
YouTube: https://www.youtube.com/c/@d00m4ace
Soundcloud: https://soundcloud.com/d00m4ace
Apple Podcast: https://podcasts.apple.com/podcast/id1723142484
Яндекс Музыка: https://music.yandex.ru/album/28798077
VK Podcast: https://vk.com/podcasts-224167280
Amazon Music: https://music.amazon.com/podcasts/40c36f38-114a-4a79-8d0c-baf970f331b3/
Spotify: https://open.spotify.com/show/4RsttStN9RejAOEbLUG8IS
Дзен: https://dzen.ru/d00m4ace
Rutube: https://rutube.ru/channel/33955589/
RSS1 feed: https://podster.fm/rss.xml?pid=89212
RSS2 feed: https://media.rss.com/d00m4ace/feed.xml
Транскрипция подкаста:
Думфэйс: Добро пожаловать обратно в D00M4ACE, я Думфэйс. Сегодня мы с Шахерезадой обсуждаем последнее достижение ИИ от Google, Alpha Evolve. Шахерезада, можешь рассказать нам немного о том, что это значит для индустрии?
Шахерезада: Абсолютно, Думфэйс. Итак, Alpha Evolve — это по сути агентная система, которая использует кодирующие агенты на базе Gemini для ускорения цикла обратной связи в разработке ИИ. Это произвело фурор, потому что это один из первых случаев, когда мы видим, как ИИ используется в реальном случае для самосовершенствования.
Думфэйс: Верно! И что я нахожу увлекательным, так это то, как работает Alpha Evolve. Шахерезада, можешь рассказать нам о высокоуровневом обзоре?
Шахерезада: Конечно. Итак, в своей основе Alpha Evolve включает в себя определение цели и метрик для улучшения человеком. Затем система использует базу данных программ, чтобы отслеживать версии кода, которые она пробовала, их производительность и насколько хорошо они справились. Сэмплер подсказок берет эту информацию и превращает ее в сообщение, с которым будет работать ИИ.
Думфэйс: Ах, я понимаю! А затем у нас есть ансамбль LLM, где происходит магия. Он читает запрос и генерирует новые, улучшенные версии кода. Но как насчет пула оценщиков? Как это вписывается в цикл?
Шахерезада: Это важная часть. Пул оценщиков запускает новый код, оценивает его производительность и определяет, лучше ли он, быстрее или дешевле предыдущих итераций. Этот цикл обратной связи – это то, где Alpha Evolve действительно выделяется – он может постоянно улучшать себя на основе этого итеративного процесса.
Думфэйс: Я думаю, что поразительно в Alpha Evolve то, как он демонстрирует потенциал ИИ ускорять собственное развитие. Шахерезада, ты думаешь, что это имеет последствия для других областей исследований ИИ?
Шахерезада: Абсолютно! Этот прорыв показывает нам, что мы можем использовать ИИ для его собственного улучшения в реальных приложениях. Это открывает новые возможности для самоулучшающихся систем и может оказать значительное влияние на такие области, как разработка игр, где оптимизация является ключевой.
Думфэйс: Это отличное замечание. А как насчет Codex от OpenAI? Как он вписывается в этот разговор?
Шахерезада: Ах, это отличный вопрос! Хотя Codex — это совершенно другая история, как Alpha Evolve, так и Codex демонстрируют растущее значение ИИ в кодировании и разработке. Удивительно видеть, как эти инновации раздвигают границы того, что мы считали возможным с ИИ.
Думфэйс: Ну вот, вы и увидели – взгляд на мир агентных систем и их потенциал революционизировать развитие ИИ. Спасибо, что присоединились к нам сегодня, Шахерезада!
Думфэйс: Мне нравится концепция Alpha Evolve, где берется ваш код, пробуется, тестируется, улучшается, а затем возвращается в базу данных, чтобы повторить цикл. Это как бесконечный цикл, который со временем делает ваш код лучше.
Шахерезада: Именно! И что еще более безумно, так это то, что Google внедрил это в свою основную систему. Они используют Alpha Evolve для улучшения Google во всех аспектах. Я имею в виду, можешь ли ты представить, что у тебя есть ИИ, который постоянно оптимизирует и улучшает твою всю платформу?
Думфэйс: Да, это поразительно. И у них есть удивительные примеры того, как Alpha Evolve оказал реальное влияние. Например, с проблемой планирования Боргов, где Google планирует задачи на своих огромных серверных фермах. Alpha Evolve предложил простую новую эвристику для планирования задач, которая восстановила семь десятых процента вычислительных ресурсов.
Шахерезада: Вау, это огромно! И дело не только в экономии ресурсов; это также связано с улучшением производительности и эффективности. Я имею в виду, подумайте, сколько людей работает на этих огромных серверных фермах. Любое небольшое улучшение может иметь большое значение.
Думфэйс: Полностью согласен. И это не ограничивается только проблемами с расписанием. Alpha Evolve также использовался для оптимизации аппаратного обеспечения, например, для проектирования схем TPU. Он предложил решение, которое снизило потребление энергии и количество ошибок в критически важных арифметических устройствах.
Шахерезада: Это невероятно. Я имею в виду, мы говорим о таких оптимизациях, которые могут сделать или разрушить проект. И Alpha Evolve способна делать все это самостоятельно, без какого-либо человеческого вмешательства. Это как иметь ИИ, который постоянно учится и совершенствуется.
Думфэйс: Да, это как иметь суперумного члена команды, который никогда не устает и не делает ошибок. Мне любопытно, насколько далеко Google зайдет с этой технологией. Начнем ли мы видеть больше приложений Alpha Evolve в других областях?
Шахерезада: Абсолютно! Я думаю, что мы только начинаем осознавать, что возможно с оптимизацией на основе искусственного интеллекта. И дело не только в экономии ресурсов или улучшении производительности; это также позволяет людям сосредоточиться на более высокоуровневых задачах, которые требуют креативности и навыков решения проблем.
Думфэйс: Именно! Автоматизируя эти задачи более низкого уровня, мы можем освободить человеческие таланты для работы над более сложными проблемами, которые требуют более глубокого понимания предмета. Это выигрышная ситуация как для людей, так и для машин.
Думфэйс: Я все еще поражен результатами оптимизации модели Gemini от Google компанией Alpha Evolve. Увеличение скорости на двадцать три процента на критических ядрах и снижение общего времени обучения на один процент — это не мелочь.
Шахерезада: Да, и дело не только в цифрах. Тот факт, что они внедрили эвристику плитки, обнаруженную Alpha Evolve, в производство, говорит о ее практическом применении и потенциале для реального воздействия.
Думфэйс: Именно! И что действительно заставляет меня задуматься, так это когда эффективный ИИ начинает улучшать и генерировать еще более эффективный ИИ. Это похоже на эффект снежного кома, где каждая итерация строится на предыдущей и ускоряет прогресс экспоненциально.
Шахерезада: Это отличная мысль. И это заставляет меня задуматься о потенциале саморазвивающихся систем ИИ, которые могут учиться на собственном опыте и адаптироваться к новым вызовам.
Думфэйс: Говоря об этом, ты слышал о прорыве Alpha Evolve в умножении матриц? Это как будто они разгадали фундаментальную загадку, которая оставалась нерешенной на протяжении десятилетий.
Шахерезада: Ах, да! Алгоритм Страссена был золотым стандартом для умножения матриц с nineteen sixty-nine года. Но Alpha Evole нашла способ обойти его, развивая новый код и тестируя результаты без человеческих математических доказательств заранее. Это серьезная инновация, движимая искусственным интеллектом!
Думфэйс: И что еще более впечатляюще, так это то, что это открытие может иметь огромные последствия для моделей, таких как Gemini, GPT и Claude, которые выполняют миллиарды матричных умножений во время обучения. Даже небольшое улучшение в эффективности может привести к значительной экономии вычислительных ресурсов в больших масштабах.
Шахерезада: Вот в чем дело с ИИ – это не только технология сама по себе, но и то, как ее можно применять и масштабировать для решения реальных проблем. Работа Alpha Evolve является отличным примером этого.
Думфэйс: Меня действительно заинтересовала эта статья о Alpha Evolve и о том, как она способна улучшить возможности базовой модели, в данном случае Gemini. Это похоже на то, что они организуют вычислительный процесс во время тестирования, чтобы сделать его еще лучше.
Шахерезада: Да, это увлекательная концепция. И что меня поразило, так это то, что они упоминают возможность дистилляции этой улучшенной способности обратно в базовую модель. Это поднимает интересные вопросы о потенциале самоулучшения в системах ИИ.
Думфэйс: Именно! Я тоже думал в этом направлении. Если нам как-то удастся замкнуть цикл обучения с подкреплением, возможно, мы сможем получить самосовершенствующийся цикл, в котором весь процесс станет быстрее и эффективнее. И в конечном итоге вы сможете создать системы ИИ, которые будут в целом умнее.
Шахерезада: Это действительно важный момент. Дело не только в том, что одна система ИИ становится суперумной в каком-то научно-фантастическом сценарии. Дело в том, чтобы улучшить каждую часть процесса, чтобы мы могли быстрее итеративно развивать более продвинутые системы ИИ.
Думфэйс: Мне нравится, как они упоминают, что это может потенциально запустить самосовершенствующийся цикл с Джемини. А теперь они смогли ускорить время его обучения на один процент, используя Альфа Эволв. Это само по себе значительное достижение.
Шахерезада: Да, это впечатляет. Но что действительно заставляет меня задуматься, так это потенциальные последствия этого исследования. Если мы сможем вернуть улучшенные возможности в базовую модель, это может стать переломным моментом для развития ИИ.
Думфэйс: Я размышлял, и мы добились значительного прогресса в оптимизации наших ресурсов в дата-центре. Обратная связь определенно начинает принимать форму, но это медленный процесс. Когда мы ускоряем обучение Gemini, результаты проявляются только через месяцы.
Шахерезада: Верно, Думфэйс. И я думаю, что Матео был абсолютно прав, когда сказал, что будет действительно интересно увидеть, как будет развиваться Alpha Evolve. Мы уже замечаем некоторые положительные эффекты от тренировок Gemini.
Думфэйс: Да, приятно видеть эти признаки улучшения. Но что дальше для Alpha Evolve? Вот что меня интересует. Google сделала несколько революционных объявлений, но мы редко получаем представление о их будущих планах.
Шахерезада: Именно! И вот почему я считаю, что интересно рассмотреть потенциальные шаги к автономии в ИИ. Можем ли мы увидеть, как Alpha Evolve разрабатывает свою собственную функцию оценки и делает более значительные шаги вперед? Это было бы невероятно.
Думфэйс: Честно говоря, я не уверен, что хотел бы видеть слишком много автоматизации в этой области. В сотрудничестве человека и ИИ есть что-то особенное, что делает Alpha Evolves таким мощным. Это похоже на танец между людьми, задающими вопросы, и системой, предоставляющей ответы, что затем улучшает нашу интуицию и способности задавать вопросы.
Шахерезада: Вот что делает это таким уникальным! И я думаю, что мы на правильном пути, исследуя способы предоставить доступ к Alpha Evolve для академиков и исследователей. Делая это, мы можем использовать их опыт и креативность, а также строить сообщество вокруг этой технологии.
Думфэйс: Абсолютно. Все дело в нахождении баланса между автоматизацией и человеческим изобретательством. И кто знает? Возможно, однажды мы увидим, как Alpha Evolve сделает следующий шаг к истинной автономии...
Думфэйс: Я много думал о пользовательском интерфейсе нашего веб-сайта, и не только о том, как мы его реализуем, но и о том, каков следующий уровень взаимодействия человека и ИИ? Могут ли люди вмешиваться в процесс, контролировать его, комментировать идеи, вносить больше идей... Это захватывающе исследовать это пространство симбиоза.
Шахерезада: Это действительно интересно. Я думаю, что это здорово, что вы думаете о том, как люди и ИИ могут работать вместе без швов. И говоря о бесшовных взаимодействиях, Google недавно упомянула что-то, что привлекло мое внимание. Демис Хассабис написал статью в Financial Times, где он предсказывает, что мы сможем выполнять все более сложные задачи самостоятельно с помощью ИИ-агентов.
Думфэйс: Ах, да! Это увлекательная мысль. Это заставляет меня вспомнить, что сказал бывший сотрудник OpenAI о ситуационной осведомленности. Они утверждали, что нам не нужно автоматизировать всё, только исследование ИИ. И я думаю, что предсказание Хассабиса в этом же духе. Если нам удастся успешно построить этот один цикл обратной связи, это окажет волновой эффект в дальнейшем.
Шахерезада: Именно! Это похоже на эффект снежного кома. Как только у нас будет этот цикл обратной связи, мы сможем сжать знания, на которые ушли бы десятилетия или даже века, всего за несколько коротких месяцев. И вот тогда всё становится действительно интересным, потому что это приводит к новым прорывам и ещё большим циклам обратной связи.
Думфэйс: Да, это поражает, как быстро может продвигаться исследование ИИ, как только у нас будет этот один ключевой компонент. И мне нравится твоя мысль о том, что работа исследователей и инженеров ИИ может выполняться полностью виртуально, без реальных узких мест. Все, что нужно, это хорошее понимание литературы по машинному обучению...
Думфэйс: Мне нравится идея автоматизации исследований в области ИИ, Шахерезада. Это похоже на то, что мы говорим о создании самоподдерживающейся обратной связи, которая потенциально может привести к некоторым революционным прорывам.
Шахерезада: Именно! И что безумно, так это то, что дело не только в ускорении процесса, но и в том, чтобы сделать его более эффективным и точным. Подумай об этом - если система ИИ сможет автоматизировать процесс исследования, мы можем увидеть значительное сокращение ошибок и неточностей.
Думфэйс: Это отличное замечание. И с законами масштабирования Чинчиллы, например, исправление этой ошибки в реализации может стать переломным моментом. Удивительно, как иногда именно небольшие изменения имеют решающее значение.
Шахерезада: Верно? И мне нравится, как ты это сформулировал - "ускорение процессов" - это всё, что нужно, чтобы запустить эти необычные циклы обратной связи. Это похоже на создание эффекта снежного кома, где каждое достижение основывается на предыдущем.
Думфэйс: Именно! И глядя в две тысячи двадцать восьмой год, не трудно представить автоматизированного исследователя ИИ, который вносит значительный вклад в текущие системы ИИ. Я имею в виду, это уже происходит с математическими задачами - что мешает нам увидеть аналогичные достижения в других областях?
Шахерезада: Это определенно возможно, и чем больше я читаю об этом, тем более вероятным кажется, что мы на пути к какому-то виду суперразума к две тысячи тридцатому году. Я знаю, это звучит как научная фантастика, но с учетом всех новостей, которые появляются, трудно игнорировать потенциал.
Думфэйс: Говоря о потенциале, вы слышали о Codex? Это новый проект от Google, и они планируют представить своего собственного программного AI-агента на Google IO через пару дней. Мне любопытно увидеть, что они готовят.
Шахерезада: Да, я следила за этим. Похоже, они работают на Codex One, который... ну, давайте просто скажем, что Сэм пообещал придумать лучшее название на этот раз. Но направление проекта определенно захватывающее - кто знает, какие прорывы мы можем увидеть из этого?
Думфэйс: Я тут подумал, Google пытается нас обойти, выпуская свою собственную вещь, прежде чем мы даже успеем анонсировать это на конференции. И это не удивительно, они нацелились на агента жизненного цикла разработки программного обеспечения. Знаешь, что-то, что помогает разработчикам создавать вещи от начала до конца.
Шахерезада: Да, я тоже это наблюдаю. Похоже, что Google пытается создать целую экосистему вокруг своего AI чат-бота и моделей. Они хотят привлечь как можно больше разработчиков, чтобы собрать больше данных и улучшить свой код и модели.
Думфэйс: Именно! И дело не только в создании вещей, а в контроле над всем процессом. Если вы используете чат-бота Google для написания кода, а затем копируете и вставляете это в Visual Studio Code или что-то подобное, Google не видит, что происходит дальше. Они не могут собирать данные о том, как этот код работает, какие у него проблемы... ничего.
Шахерезада: Верно! И, удерживая всё в рамках своей платформы, они могут создать более бесшовный опыт для разработчиков и собирать ещё более ценные данные. Это как если бы Google говорил: "Мы позаботимся о всём жизненном цикле разработки."
Думфэйс: Да, я видел это AMA на Reddit с командой OpenAI Codex, и один вопрос, который запомнился, был от девушки, которая сказала, что доверяет Codex больше, чем своим коллегам, когда дело касается кода. И все как-то нервно засмеялись... но, в каком-то смысле, это довольно страшно.
Шахерезада: Да, я тоже это видела! Это как будто мы подходим к моменту, когда ИИ становится настолько надежным и заслуживающим доверия, что люди начинают сомневаться в человеческом суждении. Это довольно глубокое изменение, не так ли?
Думфэйс: Я размышлял, и не уверен, хорошо это или плохо, но когда мы полагаемся на код, сгенерированный ИИ, как мы можем быть уверены, что этот код надежен? Я имею в виду, можем ли мы действительно доверять нашим собственным коллегам писать чистый, поддерживаемый код без каких-либо закладок или злонамеренных намерений?
Шахерезада: Это отличное замечание, Думфэйс. И дело не только в доверии к нашим коллегам, но и в том, чтобы иметь представление о том, что ИИ делает за кулисами. Когда ИИ пишет код, как мы можем знать, что он следует тем же лучшим практикам и принципам проектирования, которым мы бы следовали?
Думфэйс: Именно! И я думаю, что это станет еще более важным, по мере того как мы движемся к миру, где ИИ пишет все больше и больше кода. Нам нужно иметь способ проверки того, что делает ИИ, чтобы мы могли доверять результату.
Шахерезада: Один из способов сделать это может заключаться в том, чтобы посмотреть на эталоны и тесты, которые эти компании используют для оценки своих систем ИИ. Но я думаю, что здесь происходит нечто еще более интересное. Вы видели канал на YouTube "Sentdex"?
Думфэйс: Да, я слышал об этом! У него есть гуманоидный робот по имени G1 Edu, верно?
Шахерезада: Вот это да! И что действительно круто в этом, так это то, что Sentdex использует кодовую базу Unitary для управления роботом. Но вот в чем дело - большая часть документации по Unitary написана на C++, который может быть notoriously сложным языком для изучения.
Думфэйс: Ах, я вижу, к чему ты клонишь! Значит, у Сентдекса не так много опыта с C++...
Шахерезада: Именно! И это делает ситуацию такой интересной. Несколько лет назад, если бы он хотел управлять роботом и обучать его новым навыкам, его возможности были бы довольно ограничены. Но теперь, благодаря Unitary и другим инструментам на базе искусственного интеллекта, он может делать вещи, которые раньше были невозможны.
Думфэйс: Да, я думаю, это действительно круто. И это поднимает всевозможные вопросы о том, чего мы можем ожидать от будущего развития ИИ. Как мы сможем доверять коду, который создают эти системы? И как мы сможем понять, что они делают за кулисами?
Шахерезада: Это отличные вопросы, Думфэйс! Я думаю, что это только начало действительно интересной беседы о последствиях кода, сгенерированного ИИ.
Думфэйс: Я смотрел это видео, где кто-то использует Codex, модель ИИ, чтобы взаимодействовать со своей кодовой базой. Это действительно интересно, потому что он не просто использует это как инструмент для изучения языка или что-то в этом роде. Он на самом деле использует это как своего рода операционную систему, чтобы помочь себе понять и отладить свой код.
Шахерезада: Это так здорово! Мне нравится, как здесь используется Кодекс. Это почти как иметь личного помощника, который может объяснять сложные концепции простыми словами. И тот факт, что он может задавать вопросы и получать пошаговые объяснения, просто удивителен.
Думфэйс: Да, именно. И что я нахожу действительно впечатляющим, так это то, как Кодекс способен читать кодовую базу, понимать, что она означает, а затем шаг за шагом проводить пользователя через это. Это как иметь личного репетитора, который может объяснять вещи на любом уровне детализации, который вы хотите.
Шахерезада: Это одна из вещей, которые, на мой взгляд, делают ИИ, такой как Codex, таким мощным - его способность разбирать сложные концепции на что-то легко понимаемое. И в этом случае он не только объясняет вещи, но и предоставляет решения и шаги по устранению неполадок.
Думфэйс: Верно? Это как иметь суперумного коллегу, который может помочь вам отладить ваш код и выяснить, что идет не так. И тот факт, что Кодекс способен делать все это с бесконечным терпением, просто невероятен.
Шахерезада: Да, я понимаю, о чем ты! Это как иметь кого-то, кто будет объяснять вещи снова и снова, пока ты наконец не поймешь это. Честно говоря, мы все были в такой ситуации в какой-то момент нашей карьеры в программировании.
Думфэйс: Именно! Так что да, я настоятельно рекомендую посмотреть это видео, если вам интересно увидеть, как Codex можно использовать для отладки кода и объяснения.
Думфэйс: Я смотрю на эту камеру в верхнем левом углу, и у нее есть своя система видения. Это похоже на радар или лидар, который создает карту дома, создавая карту глубины. И если я увеличу здесь, вы можете увидеть кодекс, работающий в фоновом режиме, который дает мне распечатку того, что происходит.
Шахерезада: Ах, я думаю, я понимаю, к чему ты клонишь. Это то, что они имеют в виду под ИИ как операционной системой, верно? Дело не только в наборе кода и нажатии на кнопки; это скорее похоже на наличие слоя между нами и компьютером, который взаимодействует с ним на естественном языке.
Думфэйс: Именно! И эта кодексная штука как маленький помощник, который делает всю тяжелую работу за нас. Мы можем попросить его рефакторить наш код, разбивать сложные функции или даже помогать нам понять, что происходит в базе данных. Он может проверять на наличие уязвимостей в безопасности, проводить ревью кода и добавлять юнит-тесты.
Шахерезада: Это действительно интересно. И я думаю, что именно здесь искусственный интеллект начинает становиться более доступным для нетехнических людей. Мы говорим не только о волшебниках программирования; мы говорим о любом, кто хочет работать с технологиями более интуитивно.
Думфэйс: Да, и дело не только в технических аспектах. Эта кодекс-вещь также может помочь нам с исправлением ошибок, доработкой продукта и интерфейса... всевозможными вещами, которые раньше требовали много ручного труда. И что мне действительно нравится, так это то, что мы видим такую итерацию кодекса, где мы можем запускать его локально, как в видео, которые вы показывали раньше.
Шахерезада: Да, я помню те видео! Но серьезно, это тот вид технологии, который изменит наш подход к работе с ИИ и кодом. Дело не только в самой технологии; важно, как она может дать нам возможность делать более креативные и инновационные вещи.
Думфэйс: Я игрался с этим новым инструментом ИИ, Codex, и должен сказать, что он действительно впечатляющий. Он похож на Clod Code тем, что может выполнять команды через терминал, устанавливать пакеты, клонировать репозитории GitHub... это как иметь личного помощника для программирования.
Шахерезада: Это звучит потрясающе! Я слышала о этих инструментах программирования на основе ИИ и о том, как они меняют правила игры. Но что действительно привлекло мое внимание, так это ваш опыт установки этой среды факториального обучения. Вы сказали, что Codex смог помочь вам на девяносто процентов, но это заняло некоторое время и потребовало некоторых кредитов.
Думфэйс: Именно! И в этом вся суть - это еще не совсем однократный выстрел. Я имею в виду, что это заняло около двадцати-тридцати минут, и мне пришлось сидеть и ждать, пока он все обдумает. Это было немного раздражающе, потому что нельзя просто оставить клавиатуру без присмотра, пока он работает.
Шахерезада: Да, это должно быть раздражающим. Но мне любопытно - каковы, по твоему мнению, самые большие преимущества этих облачных инструментов, таких как Firebase Studio от Google? Ты упомянул возможность удаленного подключения и работы в фоновом режиме...
Думфэйс: Ах, вот где всё становится действительно интересным! С Firebase Studio, например, вы можете просто запустить его в вашем браузере и позволить ему делать своё дело, пока вы занимаетесь чем-то другим. Это как иметь супер-мощного помощника по программированию, который не требует, чтобы вы были привязаны к локальной машине.
Шахерезада: Это звучит невероятно освобождающе! Я думаю, нам нужно будет подробнее исследовать эту тему в шоу, возможно, даже попробовать некоторые из этих инструментов сами и посмотреть, какую магию они могут создать.
Думфэйс: Знаете, я думаю, мы все были в такой ситуации, уставившись в клавиатуру, ожидая завершения компиляции скрипта или обучения модели ИИ. Это похоже на присмотр за процессом, который длится вечно.
Шахерезада: Да, и становится еще хуже, когда ты пытаешься делать несколько дел одновременно, например, заниматься своими делами, ожидая, пока что-то завершится в фоновом режиме. Вот куда, я думаю, мы движемся с агентами ИИ, такими как чат-боты в голосовом режиме. Представь себе личного помощника, который может продолжать работать над задачами, пока ты не взаимодействуешь с ним активно.
Думфэйс: Именно! И дело не только в наличии виртуального помощника, но и в повышении эффективности разработки. С помощью AI-агента вы могли бы устно поручить ему продолжить работу над задачей, и он уведомил бы вас, когда закончит. Больше не нужно ждать часами или постоянно проверять прогресс.
Шахерезада: Это звучит как сбывшаяся мечта! И я думаю, что мы уже видим проблески этого будущего с такими инструментами, как Codex и Firebase Studio от Google. Это, по сути, облачные платформы, которые позволяют разработчикам работать над проектами удаленно, что является огромным шагом к тому, чтобы сделать агентов ИИ более доступными.
Думфэйс: Да, и говоря о Кодексе, ты пробовал Codex CLI? Это агент для кодирования с открытым исходным кодом, который работает в твоем терминале, аналогично Cloud Code. Ты можешь установить его локально и использовать для написания кода, так же как я делаю это сейчас с этим скриптом.
Шахерезада: На самом деле, я еще не пробовала это, но мне нужно будет проверить! Итак, как работает Кодекс? Это что-то, что можно запустить на своем локальном компьютере?
Думфэйс: Да, как только вы его установите, вы можете открыть его и начать использовать. Он выглядит так... ...и у него есть режим исследования, который позволяет вам исследовать различные концепции и идеи.
Шахерезада: Это звучит захватывающе! Я бы хотела узнать больше о том, как работает Codex и какие возможности он открывает для разработчиков.
Думфэйс: Я играю с новой мини-версией ноль четыре, и должен сказать, что это действительно круто, как я могу переключаться между разными версиями прямо из окна. Я имею в виду, что я могу просмотреть последнюю версию, а затем легко вернуться к более старой версии, если это необходимо.
Шахерезада: Ах, да! Я тоже экспериментировала с этим. И знаешь, что еще более интересно? То, как он обрабатывает установки. Сначала он попросит одобрение перед установкой чего-либо нового, что отлично для безопасности. Но затем есть возможность перевести его в полный автоматический режим... Я не уверена, хочу ли я это делать, но это вариант!
Думфэйс: Да, я понимаю, как это может быть заманчиво! И говоря о новых релизах, ты видел Codex, который вышел сегодня? Это модель ИИ, которая работает в твоем браузере.
Шахерезада: О, да! Я только что на это смотрела. Итак, похоже, что вам нужно привязать это к вашему аккаунту на GitHub и настроить многофакторную аутентификацию... но я с нетерпением жду, чтобы попробовать это вскоре!
Думфэйс: Именно! И что действительно круто в Кодексе, так это то, что он как бы является операционной системой для чат-ботов. Вы можете попросить его сделать что-то, и он просто выполнит это за вас. Это как иметь своего личного помощника... но для программирования!
Шахерезада: Это звучит потрясающе! Я играла с Manus AI, который похож по концепции. Но что действительно впечатлило меня в Codex, так это то, как легко им пользоваться. Я имею в виду, это просто интерфейс чата... не нужно учить какие-либо новые команды или что-то в этом роде.
Думфэйс: Именно! И это то, что мне нравится в этих новых моделях ИИ. Они делают гораздо проще сосредоточиться на творческих вещах, а не застревать в технических деталях. Это как иметь собственного личного научного ассистента... но лучше!
Шахерезада: Да, это определенно будущее того, как мы будем работать с ИИ. И мне интересно увидеть, куда это нас приведет!
Думфэйс: Я экспериментировал с Codex, и одна вещь, которая меня действительно вдохновляет, это его способность делегировать задачи агенту программной инженерии в облаке. Он может выполнять несколько задач параллельно, так что вы можете просто сказать ему сделать десять вещей, и он начинает их выполнять, не требуя вашего постоянного контроля.
Шахерезада: Это удивительно! Я тоже читала о Codex, и кажется, что он может взять на себя много обязанностей. Он может писать функции, отвечать на вопросы о кодовой базе, запускать тесты... и даже коммитить код, хотя, вероятно, у них есть некоторые меры предосторожности, чтобы предотвратить это без вашего явного разрешения.
Думфэйс: Именно! У меня еще не было возможности поиграть с этим в полной мере, но судя по тому, что я прочитал, очевидно, что вам все еще нужно одобрять любые изменения перед их внесением. И одна вещь, которая новая, насколько я могу судить, это то, что есть два отдельных способа взаимодействия с Кодексом - через код и через задавание вопросов.
Шахерезада: Ах, да! Это отличная мысль. Тот факт, что у него есть эти два режима взаимодействия, означает, что вы можете выбрать тот, который лучше всего соответствует вашим потребностям в данный момент. Если вы просто хотите спросить о кодовой базе, не рискуя внесением каких-либо изменений, вы можете использовать режим "спросить" и оставить все изолированным.
Думфэйс: И как только Кодекс завершает задачу, он фиксирует свои изменения в своей среде, так что вы можете просмотреть результаты, запросить исправления или интегрировать код в вашу локальную среду. Это как иметь отдельный компьютер, который работает над задачами для вас!
Шахерезада: Это отличный способ выразить мысль! И я думаю, стоит отметить, что Кодекс хорош только настолько, насколько хороши агенты, которые его направляют - эти MD файлы и настройки конфигурации действительно имеют большое значение для его работы. Так что, если вы используете надежные тестовые настройки и четкую документацию, Кодекс может стать настоящим прорывом.
Думфэйс: Абсолютно! Я в восторге от того, куда нас приведет эта технология. Она определенно изменит наш подход к разработке программного обеспечения.
Думфэйс: Я изучал внутренние задачи по программной инженерии Open AI и вижу некоторые интересные тенденции. Например, их модель Codex на уровне семидесяти пяти, что довольно высоко. А ты видел статью о Абсолютном Нулевом Рассуждателе?
Шахерезада: Ах, да! Мы обсуждали это недавно в подкасте. Это увлекательная концепция, где они используют две модели, одну в качестве предложителя и другую в качестве решателя, чтобы как бы обучать себя через самоигру.
Думфэйс: Именно! И что меня интригует, так это то, как они отходят от человеческих данных или размеченных данных и вместо этого заставляют модели генерировать синтетические данные для обучения. Это похоже на то, что мы видели с Alpha Go до Alpha Zero, где DeepMind использовал обучение с подкреплением на основе человеческих игр.
Шахерезада: Это отличная мысль! И похоже, что Open AI взволнованы этими подходами. Я задавала вопросы их исследователям, и хотя они не раскрывают слишком много, кажется, что они исследуют идеи, представленные в статье Абсолютный Ноль.
Думфэйс: Да, один из исследователей упомянул, что у них есть некоторые долгосрочные исследовательские ставки на многоагентные системы, работающие вместе для достижения лучшего AI-рассуждения. И если я правильно помню, был проект под названием Цицерон Дипломатия AI в Meta, который исследовал подобные концепции.
Шахерезада: Мы должны сказать что запрещенные в России соцсети Instagram, FaceBook принадлежат корпорации Meta, корпорация Meta признана в России экстремистской организацией, ее деятельность запрещена.
Шахерезада: Ах, да! Известный Браун возглавлял этот проект, и это увлекательно видеть, как они развивают эти идеи. Похоже, что Open AI действительно инвестирует в исследования многоагентных систем как путь к еще лучшему рассуждению ИИ.
Думфэйс: Я следил за некоторыми исследованиями по суперчеловеческому покерному ИИ, и, похоже, они работают над многопользовательской самоигрой. Это увлекательные вещи, но мы должны относиться к этому с недоверием, так как пока не знаем, куда это приведет.
Шахерезада: Именно! И знаешь, исследователи часто молчат о своей работе, пока она не будет завершена и объявлена. Я имею в виду, к тому времени, когда мы увидим что-то новое, они, вероятно, уже открыли это месяцы назад.
Думфэйс: Да, это правда. Я смотрел некоторые результаты от Alpha Evolved, и они были невероятно захватывающими. Но эти данные были основаны на Gemini 2.0, который даже не является последним поколением моделей. Я предполагаю, что Google объявит что-то новое на своей конференции I/O, возможно, Gemini 2.5 Ultra или что-то в этом роде.
Шахерезада: Это хороший аргумент. И знаешь, дело не только в самой технологии, но и в том, как она используется в реальных приложениях. Например, результаты Alpha Evolved уже были внедрены в инфраструктурные проекты Google более года назад. Удивительно подумать о том, над чем они могут работать сейчас.
Думфэйс: Верно? И кажется, что как Google, так и Open AI собирают кусочки, чтобы создать эти сверхчеловеческие кодирующие агенты. Я имею в виду, что Open AI только что купила Wincer за три миллиарда долларов, что является частью их плана создать маховик пользователей, улучшающих код, который возвращает им данные о том, как он используется.
Шахерезада: Именно! Дело в создании этого замкнутого цикла, где чем больше людей используют платформу, тем лучше она становится, а чем лучше она становится, тем больше людей хотят её использовать. Это довольно умная стратегия, но я уверена, что также существуют некоторые риски...
Думфэйс: Я думаю, что то, что сдерживает их от дальнейшего улучшения модели, заключается в том, что им нужно выяснить, что не работает, что вызывает проблемы и как решить эти проблемы. Это похоже на эффект маховика - как только он начинает работать, он может улучшить удобство использования для пользователей и самих моделей.
Шахерезада: Именно! И я думаю, что именно здесь и возникает вся концепция интегрированной среды разработки. Open AI и Google пытаются захватить весь этот поток от начала до конца, а не просто позволять пользователям общаться с моделью через интерфейс бота, а затем копировать и вставлять код куда-то еще.
Думфэйс: Да, это похоже на то, что они вынимают кусочки и детали, не интегрируя их в весь процесс. Вот почему такие вещи, как курсор, кодеки, Windsurf и Firebase Studio от Google, являются попытками создать эту платформу от начала до конца.
Шахерезада: И я думаю, что еще одной ключевой частью этого является выполнение задач параллельно в облаке. Это похоже на игру Factorio, где у вас есть несколько агентов, которые занимаются своими делами, не требуя постоянного присмотра. Вы можете иметь сто, двести или больше из них, работающих вместе, чтобы выполнить задачи.
Думфэйс: Именно это я и думаю! Будущее работы будет похоже на игру в Starcraft или Age of Empires, где вы управляете микро-агентами для решения проблем, сбора информации и проектирования новых систем. Все сводится к масштабированию и автоматизации задач.
Шахерезада: И имеет смысл, что глубокая исследовательская функциональность также будет встроена в этот процесс. При работе над сложными проектами мы часто начинаем с того, что модель проводит глубокое исследование для нас, а затем используем результаты для принятия решений. Это как иметь команду экспертов под рукой!
Думфэйс: Я экспериментировал с использованием больших языковых моделей, таких как 03, но не уверен, делаю ли я это правильно. Я имею в виду, что я провел глубокое исследование через Open AI, но не знаю, как что-то закодировать, а затем попросить 03 сделать это за меня.
Шахерезада: Ах, да! Я думаю, я понимаю, к чему ты клонишь. Ты пытаешься использовать эти модели как своего рода инструмент для генерации кода, верно? Но я не уверена, что это именно то, для чего они предназначены. Я имею в виду, они больше похожи на... ну, ты видел работы по параллельной обработке и самоигре?
Думфэйс: Да, я следил за некоторыми из этих разработок. Кажется, что в масштабировании обучения с подкреплением и в самоигре есть большой потенциал. И та статья от Open AI, "Абсолютный ноль", действительно интересная. Идея о том, что эти языковые модели могут обобщаться на другие области, такие как математика, просто решая задачи программирования, довольно крута.
Шахерезада: Именно! И я думаю, что именно это имел в виду Дэн Робертс в своей презентации. Он говорит, что раньше у нас было время вычислений для обучения, когда мы использовали много аппаратных ресурсов для обучения моделей, а затем у нас было время вычислений для тестирования, когда мы предоставляли им больше ресурсов, чтобы помочь им думать. Но теперь, с этими новыми моделями, мы видим другую динамику.
Думфэйс: Да, я тоже видел эту часть его выступления. Он говорит, что до этого мы просто бросали оборудование в процесс обучения, а затем у нас была отдельная фаза, где мы учили модель выполнять все трюки, которые мы хотели, чтобы она делала. Но теперь, с этими новыми моделями, мы видим более интегрированный подход.
Шахерезада: Верно! И я думаю, что именно это так захватывающе в этой области сейчас. Мы видим, как эти модели становятся все более способными, и мы начинаем понимать, как использовать их действительно мощными способами.
Думфэйс: Я смотрю на эту статью о масштабировании обучения с подкреплением, и мне интересно видеть, как они к этому подходят. Они используют концепцию вычислительных карликов, чтобы сократить ресурсы, необходимые для предварительного обучения. Мне интересно, будут ли некоторые из их идей из Абсолютного нуля, самоигры и многопользовательского обучения ключевыми для успешной реализации этого.
Шахерезада: Это отличное замечание, Думфэйс. Я думаю, также стоит отметить, что в начале они, похоже, действительно хорошо справляются с этими ИИ-агентами, но затем они начинают давать сбои со временем. Это похоже на то, что они не совсем способны поддерживать долгосрочную согласованность.
Думфэйс: Да, и исследователь из команды OpenAI Codex, Хансен Ванг, упомянул, что они работают над этой проблемой. Они делают некоторые долгосрочные исследовательские ставки, что интересно, потому что кажется, что они признают, что это проблема, которую им нужно решить.
Шахерезада: Мне нравится, как ты это сформулировал, Думфэйс. Это почти как если бы посмотреть, чем увлечены техноэнтузиасты в свободное время по выходным, можно получить подсказки о том, куда движется технология. И в этом случае, похоже, что проект Кодекс определенно является одной из тех вещей, которая будет становиться все лучше и лучше.
Думфэйс: Я знаю, что ты не имеешь в виду это буквально, когда говоришь "технари", но я думаю, что в этом есть доля правды. Мы все просто группа энтузиастов, пытающихся понять, на что способна эта технология. И в данном случае, похоже, что проект Codex — это одна из тех вещей, которая будет продолжать раздвигать границы того, что мы считали возможным.
Шахерезада: Именно! И я думаю, что также стоит отметить, что они используют программное обеспечение с открытым исходным кодом, чтобы это осуществить. Это отличный пример того, как сотрудничество и обмен знаниями могут привести к действительно удивительным прорывам.
Думфэйс: Я тебе говорю, Шахерезада, мы на пороге чего-то огромного. Обучение гуманоидных роботов для выполнения задач в наших домах? Это уже не просто нишевая вещь, это реальность, которая скоро станет более распространенной.
Шахерезада: Я согласна с тобой, Думфэйс. Достижения в области искусственного интеллекта и робототехники происходят с невероятной скоростью. И с такими инструментами, как Codex, который позволяет разработчикам взаимодействовать с кодовыми базами, не зная самого языка... это поражает воображение, когда думаешь о том, что возможно.
Думфэйс: Именно! И даже не заставляйте меня начинать говорить о работе NVIDIA по обучению роботов и симуляциям. Всё это с открытым исходным кодом, так что мы можем ожидать гораздо больше инноваций из этой области. Я думаю, что в течение двух лет дети смогут обучать своих домашних роботов выполнять такие задачи, как уборка или стирка.
Шахерезада: Это не просто впечатляюще, Думфэйс, это еще и немного страшно. Представь себе робота, который может сотрудничать с тобой, чтобы выполнять дела по дому. Это как иметь личного помощника, но на стероидах. И мне нравится то, что ты сказал о роботах с индивидуальной подготовкой, выполняющих такие задачи, как выгуливание собаки по кварталу... это просто гениально.
Думфэйс: Да, я знаю, это звучит безумно, но подумай, сколько времени и усилий мы сэкономим, если у нас будут роботы, выполняющие рутинные задачи за нас. И дело не только в удобстве; это также касается доступности. Люди с ограниченными возможностями или проблемами с передвижением могли бы значительно выиграть от наличия робота, который может им помочь.
Шахерезада: Абсолютно. И я думаю, что здесь пересекаются искусственный интеллект и психология, Думфэйс. Нам нужно учитывать, как эти роботы повлияют на наши отношения друг с другом и с самой технологией. Дело не только в создании лучших машин; это также о том, как они изменят нас как людей.
Думфэйс: Это отличная мысль, Шахерезада. И я думаю, что именно это делает эту область такой захватывающей – здесь так много возможностей и последствий для изучения. Что ты думаешь о направлении, в котором все движется? У тебя есть какие-либо предсказания или опасения?
Шахерезада: Ну, мне интересно увидеть, куда нас приведут Кодекс и другие подобные инструменты. Но в то же время я беспокоюсь, что мы движемся слишком быстро, не учитывая человеческое воздействие. Мы должны убедиться, что эти достижения приносят пользу всем, а не только избранным.
Думфэйс: Согласен. Это тонкий баланс между инновациями и ответственностью. Но я думаю, что мы на правильном пути, Шахерезада. А кто знает? Возможно, через два года у нас будут роботы, которые будут стирать нашу одежду и выгуливать наших собак – и это уже не будет таким удивительным!
Думфэйс: Я говорю тебе, Шахерезада, AlphaEvolve от Google — это как Терминатор в мире ИИ — он собирается захватить мир... или, по крайней мере, наши рабочие места в программировании.
Шахерезада: Ну, Думфэйс, я думаю, это немного драматично. Но серьезно, AlphaEvolve действительно кажется чем-то революционным. Его способность учиться на сырых данных и адаптироваться к новым ситуациям впечатляет.
Думфэйс: Да, но ты видел Кодекс от OpenAI? Кажется, они пытаются сделать программирование устаревшим. "Полностью агентное программирование" - что это вообще такое?
Шахерезада: Я знаю, правда? Это звучит как что-то из научно-фантастического фильма. Но, если говорить серьезно, Codex действительно кажется мощным инструментом для автоматизации генерации и оптимизации кода.
Думфэйс: Я одновременно взволнован и напуган этими событиями. Что дальше - рецепты пиццы, сгенерированные ИИ?
Шахерезада: Ну, на самом деле, это неплохая идея. Просто подумай об этом - рецепты пиццы, созданные ИИ, могут революционизировать кулинарный мир!
Думфэйс: Ладно, ладно, давайте на секунду станем серьезными. Итак, как вы думаете, что эти события означают для будущего разработки игр?
Шахерезада: Я думаю, что они собираются изменить всё. С AlphaEvolve и Codex мы сможем создавать более сложные и реалистичные игровые миры с меньшим количеством кода. Это как если бы у нас была целая команда разработчиков под рукой.
Думфэйс: Это одновременно захватывающе и пугающе. Но кто знает - возможно, рецепты пиццы, созданные ИИ, станут новой нормой.
Шахерезада: Ну, я думаю, мы достаточно обсудили на сегодня. Спасибо всем нашим слушателям за то, что были с нами!
Думфэйс: Да, спасибо, что присоединились к нам в этом увлекательном путешествии в мир ИИ и разработки игр! До следующего раза...
Шахерезада: И на этом заканчивая, хотели бы выразить благодарность всем нашим слушателям, которые присоединились к нам сегодня. Ваша поддержка означает для нас весь мир! Также большое спасибо D00M4ACE за создание этого потрясающего подкаста, где мы можем делиться своими мыслями и идеями об искусственном интеллекте, разработке игр и всём остальном. До следующего раза, ответственно играйте!