#108 Китай раскрыл секреты OpenAI! Прогнозы NVIDIA на 2025: богоподобные технологии и роботы-люди.

#151  суббота, 4 января 2025 г.  131 минут(ы)  13027 слов

В новом выпуске подкаста ведущие Думфэйс и Шахерезада обсуждают последние прорывы в области искусственного интеллекта, начав с сенсационного заявления китайских исследователей о том, что им удалось разгадать секреты AGI от OpenAI. Думфэйс выражает обеспокоенность, в то время как Шахерезада подчеркивает не только технологическую значимость, но и потенциальные последствия для будущего ИИ. Ведущие обсуждают достижения OpenAI в разработке общего искусственного интеллекта, отмечая впечатляющие результаты моделей O1 и O3, а также сообщения бывших сотрудников о возможности создания суперинтеллекта. Разговор затрагивает идею создания ИИ как "Манхэттенского проекта" и важность тестирования, отмечая потенциальный экспоненциальный рост возможностей ИИ при предоставлении ему достаточного времени и ресурсов. Думфэйс и Шахерезада также обсуждают секретность OpenAI в отношении внутренних процессов моделей, сравнивая это с игрой в кошки-мышки между компанией и исследователями, пытающимися получить доступ к алгоритмам. Разговор углубляется в концепцию обучения с подкреплением, дистилляции знаний, и использования GPT-4 в качестве "учителя" для создания новых моделей, а также важность вознаграждений и процесса поиска в обучении ИИ. Ведущие анализируют последние прорывы в области робототехники, нейросетей, квантовых вычислений и генерации видео, задаваясь вопросом о том, что ждет нас в будущем. Они также рассматривают этические и социальные последствия прогресса в ИИ, подчеркивая необходимость осторожности и ответственного подхода к развитию этих технологий.

D00M4ACE разработка 2D MMORPG блог ИИ и геймдев 🌐 https://d00m4ace.com

Telegram: https://t.me/d00m4ace_blog

YouTube: https://www.youtube.com/c/@d00m4ace

Soundcloud: https://soundcloud.com/d00m4ace

Apple Podcast: https://podcasts.apple.com/podcast/id1723142484

Яндекс Музыка: https://music.yandex.ru/album/28798077

VK Podcast: https://vk.com/podcasts-224167280

Amazon Music: https://music.amazon.com/podcasts/40c36f38-114a-4a79-8d0c-baf970f331b3/

Spotify: https://open.spotify.com/show/4RsttStN9RejAOEbLUG8IS

Дзен: https://dzen.ru/d00m4ace

Rutube: https://rutube.ru/channel/33955589/

RSS1 feed: https://podster.fm/rss.xml?pid=89212

RSS2 feed: https://media.rss.com/d00m4ace/feed.xml

Транскрипция подкаста:

Думфэйс: Я все еще пытаюсь осознать эту новость. Китайские исследователи утверждают, что разгадали секреты AGI от OpenAI? Это серьезное дело.

Шахерезада: Я знаю, правда? И дело не только в самой технологии, но и в последствиях того, что это может значить для будущего развития ИИ. Исследователь NVIDIA, делающий прогнозы о "богоподобной технологии" и "роботах-аборигенах" к две тысячи двадцать пятому году, просто...вау.

Думфэйс: Да, это много информации. Итак, позволь мне проверить, правильно ли я понимаю - OpenAI работала над каким-то новым прорывом в области ИИ в прошлом году, и, похоже, они добились значительного прогресса в направлении общего искусственного интеллекта? Модели 01 и 03 уже показывают впечатляющие результаты.

Шахерезада: Верно! И что еще более интересно, так это то, что многие из тех, кто недавно покинул OpenAI, говорят, что это не просто мечта. Они говорят о возможности разработки искусственного суперинтеллекта, что является совершенно новым уровнем возможностей ИИ.

Думфэйс: Я следил за некоторыми из этих исследователей, такими как Илья Суцкевер и Леопольд Ашенбреннер, и все они говорят, что это может привести к некоему Манхэттенскому проекту для разработки ИИ. Аппарат национальной безопасности начнет обращать на это внимание, и это станет серьезной проблемой.

Шахерезада: Именно! И идея Логана Килпатрика о тестировании и вычислениях действительно интересна. Если мы дадим этим моделям больше времени и ресурсов для размышлений, результаты могут быть потрясающими. Это как будто они говорят, что если мы просто позволим ИИ делать свое дело, это может привести к какому-то экспоненциальному росту возможностей.

Думфэйс: Я начинаю понимать, почему люди так волнуются по этому поводу. Потенциальные последствия огромны. Но в то же время я также беспокоюсь о связанных рисках. Нам нужно быть осторожными в том, как мы разрабатываем и внедряем эту технологию.

Шахерезада: Абсолютно. Это меч с обоюдным лезвием. С одной стороны, ИИ может принести невероятные преимущества и достижения. С другой стороны, он также может привести к непредвиденным последствиям, если с ним не обращаться должным образом. Нам нужно провести тонкую беседу об этом и рассмотреть все возможные результаты.

Думфэйс: Я смотрел на эти оценки для арка AGI, и это fascinates видеть, как модель без рассуждений медленно поднимается, в то время как модель с рассуждениями делает огромный скачок после тестирования и вычислений. Это как ночь и день.

Шахерезада: Да, я понимаю, о чем ты. И интересно, что эти модели рассуждений были известны под так многими разными именами на протяжении лет - Q star, strawberry, O one, O three... это как будто они пытаются оставаться в тени или что-то в этом роде.

Думфэйс: Ну, может быть, они и есть! Но, серьезно, я думаю, что на самом деле происходит то, что у этих моделей есть некий секретный ингредиент, который делает их такими мощными. И если бы у людей был доступ к этому ингредиенту, они могли бы легко воспроизвести результаты и создать еще более продвинутые модели.

Шахерезада: Это отличное замечание. И это объясняет, почему OpenAI так строго относится к тому, чтобы пользователи не видели обоснования их моделей. Они не хотят, чтобы люди узнали, как воспроизвести их результаты или использовать их в злонамеренных целях.

Думфэйс: Именно! И я видел некоторые анекдотические доказательства того, что это уже происходит. Люди публикуют электронные письма от OpenAI, в которых говорится, что если вы продолжите пытаться понять мысли модели, вас забанят. Похоже, они пытаются остановить любые попытки тестирования или взлома.

Шахерезада: Да, это как будто они говорят: "Эй, мы знаем, что вы пытаетесь сделать реверс-инжиниринг наших моделей, и если вы продолжите это делать, вы потеряете доступ к GPT-40 с рассуждением." Это довольно серьезное предупреждение.

Думфэйс: И я думаю, что действительно интересно здесь - это динамика между OpenAI и людьми, которые пытаются взломать их модели. Это похоже на игру в кошки-мышки, где OpenAI пытается сохранить свои секреты в безопасности, а хакеры пытаются выяснить, как обойти эти секреты.

Шахерезада: Ну, это определенно увлекательная тема. И я думаю, нам придется исследовать это более подробно в будущих эпизодах. Но пока давайте просто скажем, что OpenAI принимает довольно радикальные меры, чтобы держать свои модели в секрете.

Думфэйс: Я читаю эту статью из Университета Фудань в Шанхае, и это заставляет меня задуматься о всей концепции собственных моделей ИИ. Знаешь, как некоторые компании охраняют свой секретный соус, как будто это Святой Грааль.

Шахерезада: Это отличный способ выразить это! Я тоже следила за этой историей, и кажется, что между этими китайскими исследователями и оригинальными создателями этих моделей идет игра в кошки-мышки. Статья, о которой ты говоришь, пытается провести обратное проектирование одной из этих моделей с точки зрения обучения с подкреплением.

Думфэйс: Именно! И что интересно, так это то, что они не просто останавливаются на воспроизведении модели, но и используют её как основу для создания новых поколений моделей ИИ. Они называют эти синтетические данные из своей модели "моделями следующего поколения." Похоже, они пытаются создать целую экосистему вокруг этой технологии.

Шахерезада: Я понимаю, о чем ты говоришь, касаясь иронии того, что OpenAI начинала как компания с открытым исходным кодом, а теперь стала закрытой организацией. Это почти как будто они полностью изменили свой подход. Ты думаешь, что это знак того, что нас ждет в индустрии ИИ?

Думфэйс: Ну, это определенно тренд, который мы наблюдаем. Все больше компаний пытаются защитить свои модели ИИ и предотвратить их реверс-инжиниринг или копирование. Но в то же время существует также растущее движение в сторону открытого кода и совместной разработки. Будет интересно увидеть, как это будет развиваться в долгосрочной перспективе.

Шахерезада: Да, это сложный вопрос. С одной стороны, вы хотите защитить свою интеллектуальную собственность и не позволить конкурентам копировать вашу работу. Но с другой стороны, открытость и сотрудничество могут привести к более быстрому инновационному процессу и лучшим результатам для всех участников.

Думфэйс: Именно! Все дело в нахождении баланса между защитой и обменом знаниями. Я думаю, что мы увидим все больше и больше компаний, пытающихся ориентироваться в этой среде в ближайшие годы.

Шахерезада: Абсолютно. И дело не только в самой технологии, но и в социальных последствиях развития искусственного интеллекта. Нам нужно думать о том, как эти модели используются и кто имеет к ним доступ.

Думфэйс: Это отличное замечание. Чем больше мы можем делиться знаниями и сотрудничать в разработке ИИ, тем лучше мы будем подготовлены к решению некоторых из более серьезных социальных проблем, с которыми мы сталкиваемся сегодня.

Думфэйс: Я думал о OpenAI и их миссии. Кажется, они начали с этой идеалистической цели создать ИИ, который принесет пользу человечеству, но теперь это больше о получении прибыли.

Шахерезада: Да, я тоже это заметила. Говорят, что затраты на обучение этих моделей настолько высоки, что им нужно сохранять их закрытыми, чтобы оставаться конкурентоспособными. Но интересно, что некоторые технологии, которые они не открывают, в конечном итоге воспроизводятся и становятся открытыми другими компаниями... например, в Китае.

Думфэйс: Это иронично, не так ли? Они способствуют созданию этих открытых моделей через посредников, но затем их критикуют за отсутствие прозрачности в своей работе. Это немного двойные стандарты, не так ли?

Шахерезада: Именно! И я думаю, что также стоит отметить, что Open AI достигла некоторых впечатляющих этапов в области искусственного интеллекта, таких как достижение экспертного уровня в сложных задачах. Но то, как они себя рекламировали, изменилось со временем.

Думфэйс: Да, и их основная техника за O1 — это обучение с подкреплением на основе человеческой обратной связи. Это довольно сложный процесс, но в основном он заключается в обучении моделей ИИ учиться у людей, чтобы улучшить их производительность. Мне любопытно увидеть, как эта технология будет развиваться в будущем.

Шахерезада: Абсолютно. И я думаю, что также стоит отметить, что Open AI не одинока в этой области - есть и другие компании и исследователи, работающие над аналогичными проектами. Но что интересно в Open AI, так это их уникальный подход к созданию ИИ, который может учиться у людей... и потенциально даже превосходить человеческий интеллект в определенных областях.

Думфэйс: Ну, давайте не будем забегать вперед с этой идеей "превосходства человеческого интеллекта" пока что! Но это определенно захватывающая область исследований.

Думфэйс: Ладно, давайте погрузимся в дистилляцию знаний. Итак, в основном, у нас есть эти суперумные модели-учителя, которые могут выполнять всевозможные сложные задачи, такие как рассуждение и написание точного кода.

Шахерезада: Верно! И то, что мы делаем с дистилляцией знаний, это берем выходные данные от этих моделей-учителей и используем их для обучения меньшей модели-студента. Идея заключается в том, что модель-студент может учиться на выходных данных модели-учителя и сохранять большую часть своих способностей, но более компактным и эффективным способом.

Думфэйс: Именно! И дело не только в экономии вычислительных ресурсов, хотя это определенно большое преимущество. Дело также в том, чтобы сделать модели ИИ более доступными для людей, которые могут не иметь доступа к такому же уровню вычислительной мощности или экспертизы.

Шахерезада: Да, я думаю, что это действительно важно. Потому что, когда мы говорим о моделях ИИ, таких как GPT-4 или DeepSeek, они часто настолько сложны и ресурсоемки, что с ними трудно работать, кроме как у избранных. Но если мы сможем извлечь их знания в более мелкие, более управляемые модели, это откроет много возможностей.

Думфэйс: И я думаю, что именно это делает этот подход таким захватывающим. Мы говорим не только о том, чтобы сделать модели ИИ более эффективными, но и о демократизации доступа к технологиям ИИ. Что является огромным!

Шахерезада: Абсолютно! И это не значит, что мы жертвуем точностью или производительностью в этом процессе. Студенческие модели все еще могут быть невероятно мощными и способными, даже если они меньше и быстрее.

Думфэйс: Верно? Это почти как... ну, я не знаю, хорошая ли это аналогия, но это похоже на то, как взять действительно сложный рецепт и упростить его, сохранив суть оригинала. Вы теряете некоторые нюансы, возможно, но выигрываете в плане удобства и доступности.

Шахерезада: Я думаю, что это отличная аналогия! И это именно то, что мы видим с дистилляцией знаний. Мы берем эти сложные модели ИИ и разбиваем их на более мелкие, более управляемые части, которые могут быть использованы более широким кругом людей.

Думфэйс: Итак, Шахерезада, меня действительно интересует концепция дистилляции знаний, где они используют модель GPT-4 в качестве учителя для создания своих собственных моделей. Это похоже на отношения мастер-ученик.

Шахерезада: Именно! И логично, что они хотят использовать сильные стороны GPT-4 для улучшения своих собственных моделей. Но что я нахожу увлекательным, так это то, как это связано с обучением с подкреплением, которое является ключевым компонентом в достижении O1, или оптимального однократного обучения.

Думфэйс: Итак, давайте разберемся, что такое обучение с подкреплением. Вы можете представить это как дрессировку собаки, когда вы даете ей лакомства за хорошее поведение и, возможно, даже наказания за плохое поведение.

Шахерезада: Это отличная аналогия! И интересно, что они упоминают положительное и отрицательное подкрепление в контексте обучения моделей. Это заставляет меня задуматься, как мы можем применить это к обучению человека тоже.

Думфэйс: Да, это определенно интересная область изучения. Итак, возвращаясь к статье, они выделяют четыре ключевых компонента обучения с подкреплением: инициализация политики, проектирование вознаграждения, поиск и обучение. Можешь рассказать мне немного больше о каждом из них?

Шахерезада: Конечно! Инициализация политики заключается в оснащении моделей человеческими способностями к рассуждению, чтобы они могли эффективно исследовать пространства решений для сложных задач. Проектирование вознаграждений имеет решающее значение для предоставления руководства как для поиска, так и для обучения, именно поэтому формирование или моделирование вознаграждений является таким важным аспектом.

Думфэйс: Это имеет смысл. И мне интересно, что они упоминают важность поиска в создании качественных решений в процессе обучения и тестирования. Это напоминает мне о нашем собственном опыте с GPT-4, когда нам пришлось проверять его пределы на таких задачах, как размещение мебели.

Шахерезада: О да, это были интересные тесты! Но серьезно, это увлекательно видеть, как обучение с подкреплением может быть применено для улучшения производительности модели и достижения O1. Я думаю, что это действительно захватывающая область исследований, которая имеет большой потенциал для будущих прорывов.

Думфэйс: Знаешь, я недавно играл с некоторыми головоломками на основе сетки, например, расставляя мебель на сетке шесть на шесть с определенными ограничениями. Удивительно, как GPT-4 не смог решить это с первого раза, хотя он невероятно умен.

Шахерезада: Это звучит как классическая проблема удовлетворения ограничений. Я понимаю, почему GPT-4 испытывает с этим трудности. Но затем вы упомянули модель O1 и то, как она может подходить к проблеме шаг за шагом. Это действительно интересно.

Думфэйс: Да, именно! Модель O1 смогла обдумать это больше как человек, возвращаясь назад и вперед, визуализируя разные сценарии и корректируя свой подход по мере необходимости. Это почти как будто она использовала форму проб и ошибок, но гораздо более эффективно.

Шахерезада: Это напоминает мне о том, как люди учатся на своих ошибках. Нам часто нужно возвращаться и пересматривать наши предположения или корректировать наш подход, когда мы сталкиваемся с препятствиями. Я думаю, что это одно из ключевых отличий между человеческим интеллектом и ИИ - наша способность размышлять о собственных мыслительных процессах и адаптироваться соответственно.

Думфэйс: Абсолютно! И дело не только в решении головоломок. Этот тип мышления необходим для сложного решения задач в таких областях, как разработка игр или даже научные исследования. Чем больше вычислений у нас есть в распоряжении, тем больше мы можем исследовать различные возможности и уточнять наши подходы.

Шахерезада: Это отличное замечание. Я думаю, что эта работа из Стэнфорда и Google Research действительно подчеркивает важность вычислительной мощности в развитии ИИ. Увеличивая параметры и данные для поиска, мы можем достичь лучшей производительности и более точных результатов.

Думфэйс: Да, и дело не только в грубой силе. Важно уметь исследовать различные возможности и совершенствовать наши подходы более эффективным образом. Я думаю, что это одна из ключевых областей, в которой искусственный интеллект будет продолжать развиваться в ближайшие годы.

Шахерезада: Определенно. И это увлекательно видеть, как исследователи раздвигают границы возможного с помощью ИИ. Эта работа определенно является значительным вкладом в область, и мне интересно увидеть, куда нас приведет это исследование дальше.

Думфэйс: Итак, Шахерезада, меня действительно fascinирует концепция итеративного бутстрэппинга с большими языковыми моделями, такими как GPT-4. Они способны генерировать высококачественные обоснования и использовать их для обучения последующих версий самих себя.

Шахерезада: Именно! И что интересно, так это то, что они используют предшествующую способность модели к рассуждению, чтобы улучшить её производительность со временем. Это почти как цикл самоулучшения, где каждая версия основывается на предыдущей.

Думфэйс: Верно. Итак, давайте скажем, что мы начинаем с достаточно сильной модели, такой как GPT-4. Она генерирует обоснования для простых вопросов, а затем использует их для дообучения следующего поколения моделей. И этот процесс продолжается, при этом каждая новая модель генерирует лучшие обоснования и улучшает свою точность.

Шахерезада: Да, это почти как снежный ком. Чем больше данных они генерируют, тем точнее они становятся. И именно это говорил доктор Нойя Гудман о потенциальном создании интеллекта, превосходящего человеческий уровень.

Думфэйс: Вау, это потрясающе! Итак, давайте вернемся к этой статье из Шанхайской лаборатории ИИ и посмотрим, как их подход к дизайну вознаграждений и обучению с подкреплением похож на то, что мы видели в статье STAR.

Шахерезада: Хорошо, я сейчас смотрю на статью по искусственному интеллекту из Шанхая. И, похоже, они используют данные поиска, сгенерированные моделью, чтобы улучшить политику и производительность. Они называют это "обучением", что имеет смысл, поскольку это уточняет процесс генерации ответов.

Думфэйс: Ах-ха! Так что, в этом случае, поиск будет моделью, генерирующей ответы, а обучение будет тонкой настройкой, которая происходит после этого. Я начинаю видеть, как эти разные подходы все связаны.

Шахерезада: Да, это увлекательно видеть, как исследователи строят на основе работы друг друга. И я думаю, что этот итеративный процесс саморазвития имеет огромные последствия для будущего развития ИИ.

Думфэйс: Меня действительно fascinирует концепция поиска рассуждений, где ИИ шаг за шагом обдумывает проблему и предоставляет вам результат с данными. Это похоже на то, что он ведет разговор сам с собой, взвешивая варианты и приходя к заключению.

Шахерезада: Да, именно это я и имею в виду! Идея заключается в том, что этот подход к рассуждению используется для обучения, что затем информирует политику продолжать поиск. И что интересно, так это то, что эта концепция похожа на идеи, представленные в статье две тысячи двадцать второго года от Стэнфорда и Google Research.

Думфэйс: Ах, да! Я помню, как читал об этой статье. Удивительно, как их идеи близки к нашему пониманию развития ИИ. Они по сути описывают дорожную карту для достижения искусственного общего интеллекта, или ИОИ.

Шахерезада: Верно? И это увлекательно видеть, как они разбивают процесс на пять этапов. Итак, у нас есть инициирование политики, предварительное обучение, инструктаж, дообучение и поведение, похожее на человеческое мышление. А затем есть функция вознаграждения и обучение с поиском, о которых мы говорили ранее.

Думфэйс: Именно! И что я нахожу особенно интересным, так это их прогресс от "открытия глаз" до рассуждающих. Они говорят, что достижение замечательных успехов в рассуждении означает значительный этап в их дорожной карте AGI. Это похоже на то, что они признают, что мы достигли второго уровня на этой шкале, где ИИ может решать проблемы на уровне человека.

Шахерезада: Верно! И стоит отметить, что GPT-4 и другие разговорные языковые модели по сути считаются уровнем один, или "глазами", в их прогрессии. Но теперь, с появлением рассуждателей, таких как LLaMA и других, мы наблюдаем значительные достижения в направлении достижения способностей к решению проблем на уровне человека.

Думфэйс: Да, это захватывающее время для исследований в области искусственного интеллекта! И я думаю, что действительно важно осознавать, что эти разработки касаются не только создания более сложных языковых моделей или чат-ботов. Это о том, чтобы раздвинуть границы того, что мы считали возможным с искусственным интеллектом, и приблизить нас к истинному искусственному общему интеллекту.

Шахерезада: Абсолютно! И как тренеры, наша задача - помочь разработчикам понять последствия этих достижений и как их можно применить на практике. Но также важно осознавать потенциальные риски и проблемы, которые возникают с созданием более продвинутых систем ИИ.

Думфэйс: Знаешь, это безумие думать о том, как далеко продвинулся ИИ в решении проблем. Я имею в виду, что они уже превосходят человеческие способности в определенных областях, таких как математические показатели. Теперь это почти слишком легко для них.

Шахерезада: Это отличное замечание, Думфэйс. И что еще более увлекательно, так это то, что нам нужно создавать новые, более сложные проблемы просто для того, чтобы проверить их способности. Мы должны расширять границы того, что они могут делать, потому что они так далеко опережают нас в определенных областях.

Думфэйс: Именно! И дело не только в решении математических задач. Я имею в виду, когда вы думаете об агентах, которые могут принимать действия и принимать решения на протяжении длительного времени... это совершенно другой уровень сложности.

Шахерезада: Да, а потом есть новаторы - ИИ, которые действительно могут помочь в изобретениях и продвинуть научную область вперед. Вот где становится действительно интересно, потому что это поднимает вопросы о том, что происходит, когда эти ИИ начинают продвигать исследования ИИ быстрее, чем люди могут успевать.

Думфэйс: Верно? Это как будто мы входим в неизведанную территорию. Мы даже не уверены, чего ожидать от организаций пятого уровня - ИИ, которые могут выполнять работу целой организации. Это действительно поражает воображение.

Шахерезада: И мне кажется интересным, что ты упомянул Q* в ноябре две тысячи двадцать третьего года. В то время было много спекуляций о том, что это может быть и как это повлияет на развитие ИИ. Некоторые люди были скептически настроены, но... ну, мы все знаем, как быстро могут меняться вещи в этой области.

Думфэйс: Да, это как пытаться предсказать будущее. Мы даже не уверены, актуален ли Q* сейчас, или что-то новое пришло на его место. Но одно можно сказать точно - ИИ движется с такой скоростью, что трудно успевать.

Думфэйс: Мне нравится, как эта статья подчеркивает сдвиг в парадигмах ИИ. Мы говорим об этом уже некоторое время, но здорово видеть, что это признается исследовательским сообществом.

Шахерезада: Именно! И что я нахожу увлекательным, так это то, что они указывают на два способа масштабирования этих моделей ИИ. Один из них — это самообучение, а другой — обучение с подкреплением. Кажется, мы наблюдаем новую волну инноваций в ИИ, где мы не просто полагаемся на человеческие данные для обучения наших моделей.

Думфэйс: Да, и интересно, что они упоминают AlphaGo Zero как пример этого. Я имею в виду, кто бы мог подумать, что модель может научиться играть в шахматы лучше любого человека, играя против самой себя?

Шахерезада: Верно? Это как будто ИИ говорит: "Эй, мне не нужны ваши данные, я просто сгенерирую свои и стану лучше." И дело не только в генерации данных, но и в улучшении процесса принятия решений через самоигру.

Думфэйс: Вот что мне нравится в этом итеративном цикле поиска и обучения. Это как будто ИИ постоянно совершенствует себя, без какого-либо внешнего вмешательства. Это совершенно другой подход к традиционному машинному обучению.

Шахерезада: И это вызывает так много вопросов о том, как мы можем применить это к другим областям разработки ИИ. Можем ли мы использовать аналогичные техники для улучшения наших языковых моделей или систем компьютерного зрения? Возможности безграничны!

Думфэйс: Абсолютно! Я думаю, что это только начало новой эры в исследовании ИИ, где мы не ограничены традиционными методами и источниками данных. Мы входим в мир, где ИИ может учиться и адаптироваться самостоятельно, без человеческого вмешательства.

Шахерезада: Вот что меня вдохновляет в этой области. Потенциал для инноваций и открытий огромен, и я думаю, что мы только начинаем исследовать то, что возможно.

Думфэйс: Я размышлял о масштабируемости подходов к искусственному интеллекту, основанных на поиске, и о том, как их можно применить к сложным задачам принятия решений. Это кажется многообещающим способом реализации процесса обучения с одного раза.

Шахерезада: Это действительно интересно, Думфэйс. И это не только теоретически - есть много успешных исследователей, которые используют поиск для обучения и принятия решений в обучении с подкреплением. Я имею в виду, возьмите AlphaGo и AlphaGo Zero в качестве примеров. Они используют обучение с подкреплением как основу своего подхода.

Думфэйс: Именно! И в этой статье говорится о начале политики, что является ключевым компонентом их системы. Но что меня поразило, так это когда я посмотрел то видео Андрея Карпати с хакатона AGI в прошлом году... он говорил, что до того, как большие языковые модели стали эффективными, исследователи пытались создать агентов, которые могли бы ориентироваться в интернете, используя обучение с подкреплением.

Шахерезада: Ах, да! Это отличная мысль. И это увлекательно видеть, как далеко мы продвинулись с тех пор. Но то, что говорил Карпати, это то, что на самом деле очень трудно использовать обучение с подкреплением в таких ситуациях из-за огромного пространства действий. Я имею в виду, что существует слишком много возможных действий, которые агент может предпринять.

Думфэйс: Именно! Это как пытаться дать сигнал вознаграждения за каждое действие агента. Это просто невозможно. И та же проблема с большими языковыми моделями - если они просто выдают случайные буквы или предложения, как вообще можно дать обратную связь?

Шахерезада: Верно? Я имею в виду, что оценка "нравится" или "не нравится" в этом случае не подойдет. Но что интересно, так это то, что эти большие языковые модели на самом деле были предварительно обучены на огромном количестве данных из интернета, что позволило им генерировать беглые языковые выходы.

Думфэйс: Верно! А затем их можно донастроить с помощью контролируемого обучения и человеческой обратной связи. Так что это не значит, что мы пытаемся обучить модель с нуля, используя обучение с подкреплением - мы строим на основе этой предварительной подготовки с более целенаправленным подходом.

Шахерезада: Именно! Это почти как если бы мы использовали большие языковые модели в качестве своего рода "генератора языка", который можно настроить для конкретных задач. И я думаю, что именно в этом заключается настоящая сила этих моделей - в их способности генерировать языковые выходы, похожие на человеческие, которые можно использовать в качестве входных данных для других систем.

Думфэйс: Итак, Шахерезада, ты говоришь, что эти модели способны мыслить пошагово и проверять свои собственные результаты? Это звучит как огромный прорыв в искусственном интеллекте.

Шахерезада: Именно! И что я нахожу увлекательным, так это то, как они могут исследовать свои пространства решений. Это почти как если бы они отлаживали свой собственный процесс мышления.

Думфэйс: Да, это действительно звучит немного странно. Но я думаю, что это очень интересно. Итак, ты говоришь, что предварительные версии O1 показывают нам, как эти модели думают? Какое у них мышление?

Шахерезада: Верно! И дело не только в том, чтобы дать нам представление о их процессе мышления, но и в том, чтобы понять, как они приходят к своим выводам.

Думфэйс: Я понимаю. Итак, в этом примере модель O1 пытается расшифровать какой-то бред и обдумывает это шаг за шагом. Это похоже на то, как человек-решатель проблем разбирается с головоломкой.

Шахерезада: Именно! И что мне особенно интересно, так это то, что мы можем увидеть скрытую цепочку мыслей за их ответами. Это почти как иметь доступ к их мыслительному процессу в реальном времени.

Думфэйс: Да, и похоже, что ты немного отвлекаешься на терминологию. "Цепи мысли" против "цепи мыслей"... Думаю, мы можем с уверенностью сказать, что это тупик, который стоит исследовать дальше!

Шахерезада: О, извините за это! Но, серьезно, удивительно видеть, как эти модели способны разбивать сложные проблемы на управляемые шаги. Это действительно дает нам представление о внутренней работе ИИ.

Думфэйс: Абсолютно. И я думаю, что это лишь верхушка айсберга, когда речь идет о понимании того, как ИИ думает и учится. Нам предстоит углубиться в эту тему в будущих эпизодах, это точно!

Думфэйс: Я думаю, возможно, здесь есть анаграмма или шифр подстановки. Позвольте мне взглянуть внимательнее.

Шахерезада: Да, кажется, что это проходит через разные возможности одну за другой. Это почти как будто оно пытается силой найти решение.

Думфэйс: Именно! И это продолжается некоторое время, при этом каждый шаг основывается на предыдущем. Я начинаю думать, что, возможно, нам нужно взять каждую вторую букву или восстановить открытый текст из зашифрованного текста соответствующим образом.

Шахерезада: Это интересная идея. Давайте протестируем эту теорию и посмотрим, выдержит ли она испытание. Это похоже на то, как машина проходит через разные возможности, очень тщательно.

Думфэйс: Да, это почти как будто он думает вслух. Подожди, а что если мы возьмем каждую вторую букву или каждую первую букву? Можем ли мы сопоставить буквы этого слову "think"?

Шахерезада: Я не собираюсь проходить через всё это, но очевидно, что это много работы. Мы говорим о страницах и страницах расчетов и исследований.

Думфэйс: И это продолжается! Вот что они имеют в виду под тщательным исследованием пространств решений, верно? Это как будто модель говорит: "Дайте мне немного подумать об этом."

Шахерезада: Именно! И когда ты смотришь на результат, это почти как магия. Декодированное сообщение: в слове "клубника" три буквы R, что является довольно значительным достижением.

Думфэйс: Я знаю, правда? Он разобрался с тем вопросом, который люди задавали ему. Но интересно, как это связано с идеей позволить моделям тщательно исследовать свои пространства решений.

Шахерезада: Да, это как будто модель говорит: "У меня есть часы и часы работы, но я просто посижу здесь и подумаю об этом, пока не приду к ответу."

Думфэйс: И именно это и происходит. Это приводит к более комплексным способностям решения проблем, о которых говорил Андрей Карпати до того, как большие языковые модели достигли определенной критической массы.

Шахерезада: Да, он сказал, что обучение с подкреплением не было тупиком в то время, просто оно еще не сработало. Но теперь мы видим, как эти модели могут использовать этот подход для нахождения креативных решений.

Думфэйс: Мне нравится, в каком направлении это движется, Шахерезада. Идея сочетания больших языковых моделей, таких как GPT-4, с особым соусом альфа-моделей — это революционно. Это именно то, о чем мы размышляли в прошлом году.

Шахерезада: Полностью согласна, Думфэйс. И теперь, когда у нас есть эти мощные инструменты, интересно видеть, как они используются в обучении с подкреплением. Концепция вознаграждений и негативного подкрепления здесь так важна. Я имею в виду, подумай об этом - если ты получаешь вознаграждение только за большие достижения, проходит много времени между этими вознаграждениями.

Думфэйс: Именно! И вот здесь появляется идея разреженной награды за результат и плотной награды за процесс. Это похоже на то, чтобы давать быстрые отзывы для формирования пути, а не просто ждать конечного результата. Я имею в виду, что игра в прятки от OpenAI является отличным примером этого. Они даже не награждали и не наказывали агентов за победу или поражение - все было сосредоточено на процессе.

Шахерезада: Да, этот блог-пост просто потрясающий! И что меня поразило, так это то, как они позволили агентам учиться через исследование и взаимодействие с окружающей средой. Никаких явных стимулов не было дано для того, чтобы они взаимодействовали с объектами, но они все равно поняли, как это сделать. Это как... вы когда-нибудь видели, как ребенок учится играть в игру? Им не нужно точно говорить, что делать - они просто экспериментируют и разбираются через пробу и ошибку.

Думфэйс: Это так верно! И я думаю, что именно там происходит волшебство в разработке ИИ. Когда мы даем этим системам свободу исследовать и учиться, могут произойти удивительные вещи. Это как... мы не просто учим их, как играть в игру - мы даем им инструменты для создания собственных игр.

Шахерезада: Именно! И я думаю, что именно это делает эту область такой захватывающей. Мы не просто создаем системы ИИ - мы создаем новые возможности для сотрудничества и инноваций между человеком и ИИ.

Думфэйс: Мне нравится, как просто поставлена цель в прятки в этой игре. Это всего лишь про прятки и поиски, никаких сложных правил, о которых нужно беспокоиться.

Шахерезада: Именно! И эта простота делает его отличным примером для понимания того, как агенты учатся на наградах. Прячущиеся получают награду, если их не видит ищущий, а ищущие получают награду, если видят их.

Думфэйс: Верно, в этом случае красный агент счастлив, потому что не видит синего агента, но как только он получает прямую видимость, его поведение меняется. Это похоже на то, что он адаптируется к окружающей среде в зависимости от получаемых наград.

Шахерезада: Это отличное замечание. И я думаю, что здесь мы начинаем видеть, как большие языковые модели могут учиться на наградах аналогичным образом. Они генерируют рассуждения и ответы, но если они ошибаются, они получают обратную связь, которая помогает им скорректировать свою политику.

Думфэйс: Да, как в статье о самообучающемся рассуждателе, которую ты упоминал ранее. Модель генерирует обоснование для своего ответа, и если оно правильное, то получает подкрепление. Но если нет, то ей предоставляется возможность попробовать снова, пока она не сделает это правильно.

Шахерезада: И я думаю, что здесь мы начинаем видеть силу обучения на основе вознаграждения в ИИ. Дело не только в том, чтобы получить правильный ответ; важно понимать, как модель мыслит и корректировать ее поведение соответственно.

Думфэйс: Именно! И мне нравится, что они говорят о разных уровнях вознаграждений, от уровня токенов до уровня решений. Это как будто мы видим совершенно новый уровень нюансов в том, как модели ИИ могут учиться на обратной связи.

Шахерезада: Абсолютно. И я думаю, что это только начало понимания того, как обучение на основе вознаграждений может помочь нам создать более интеллектуальные и адаптивные системы ИИ.

Думфэйс: Я думаю о процессе поиска в ИИ, о том, как он используется в фазах обучения и тестирования. Это похоже на то, что модель постоянно ищет лучшие решения, генерируя новые данные, которые возвращаются в систему.

Шахерезада: Именно! И что интересно, так это то, что этот процесс поиска способствует качеству самих обучающих данных. Используя синтетические данные, сгенерированные через поиск, вы получаете более качественные действия или решения, которые повышают эффективность обучения.

Думфэйс: Да, и я думаю, что это потому, что поиск дает лучшие результаты, чем простое выборочное исследование. Это похоже на то, что модель активно ищет новую информацию, а не просто случайно выбирает из пула существующих данных.

Шахерезада: Верно! И во время вывода поиск по-прежнему играет решающую роль в улучшении субоптимальных политик модели. Это похоже на то, что модель постоянно уточняет свое понимание того, что работает, а что нет.

Думфэйс: Я думаю об АльфаГо, о том, как он использует метод Монте-Карло для улучшения своей производительности. Это похоже на то, когда модель совершает ошибку, она может исследовать, почему эта ошибка была сделана, и учиться на этом.

Шахерезада: Именно! И вот здесь на помощь приходит данные человеческих экспертов – их производство дорогостоящее, но если мы сможем заставить модели ИИ учиться через взаимодействие с окружающей средой... ну, вот где лежит потенциал для сверхчеловеческой производительности. Как мы видели с AlphaGo, обученным на всех тех человеческих шахматных партиях.

Думфэйс: Да, и я думаю, что это ключевой вывод здесь – используя поиск для генерации обучающих данных, а затем обучаясь на этих данных через взаимодействия с окружающей средой, мы можем добиться от моделей ИИ таких результатов, которые ранее были невообразимы.

Думфэйс: Я читаю эту огромную статью о ИИ, и это просто сносит мне крышу. Похоже, они говорят, что эти игры, в которые мы играем уже много лет, с их потенциалом для сверхчеловеческой производительности, на самом деле тренируют нас быть сверхчеловеками в определенных задачах.

Шахерезада: Верно! И что интересно, так это то, как авторы разбивают концепцию дизайна вознаграждений в системах ИИ. Они говорят о вознаграждениях за результат и вознаграждениях за процесс.

Думфэйс: Да, я смотрю на эту диаграмму, и у нее есть два столбца - вознаграждение за результат слева и вознаграждение за процесс справа. Итак, с вознаграждением за результат вы, по сути, просто говорите "да" или "нет" на окончательный ответ. Это похоже на простую систему прохода/непрохода.

Шахерезада: Именно! И это делает его относительно простым для построения, но, как они указывают, ему не хватает контроля на промежуточных этапах. Так что, если ИИ использует плохое рассуждение, чтобы прийти к правильному ответу, вы на самом деле не учите его ничему о том, как рассуждать правильно.

Думфэйс: Верно? Это как поставить студенту пятёрку за домашнюю работу по математике, не проверив его работу. Возможно, ему повезло, и он наткнулся на правильный ответ, но он всё равно не понимает основные концепции.

Шахерезада: И вот здесь вступают в игру процессуальные вознаграждения - разбивка задачи на более мелкие шаги и вознаграждение ИИ за каждый правильный шаг на этом пути. Это похоже на то, как учитель дает студенту обратную связь по его работе по мере выполнения, чтобы он мог учиться на своих ошибках и улучшать свое понимание материала.

Думфэйс: Да, это имеет смысл. И я думаю, что это действительно важный момент - если мы не будем осторожны с тем, как мы проектируем наши системы вознаграждений, мы можем непреднамеренно создать ИИ, который хорошо справляется с получением правильного ответа, но плохо понимает, почему он получил правильный ответ в первую очередь.

Шахерезада: Именно! Это похоже на то, что мы учим ИИ обманывать, чтобы добиться успеха, а не действительно понимать основные концепции.

Думфэйс: Я немного обеспокоен использованием данных для обучения моделей ИИ, особенно когда речь идет о сложных задачах, таких как разработка игр. Там могут быть скрытые минные поля, которые могут привести к плохим ответам позже.

Шахерезада: Да, и если вы используете эти данные для обучения, это может иметь кумулятивный эффект. Плюс, вознаграждение за результат разрозненное, поэтому проходит много времени между контрольными точками. Если мы сможем получить более быстрый отклик, это поможет лучше скорректировать курс.

Думфэйс: Именно! И я думаю, что процессные награды — это более детализированный подход, который показывает перспективы, но он также более сложный. Это включает в себя человеческих аннотаторов, которые награждают промежуточные шаги и используют математические решения, сгенерированные большими языковыми моделями.

Шахерезада: Верно. Но если бы мы могли заставить системы ИИ проверять промежуточные шаги, это было бы как идеальный способ. И меня интригует проект OpenAI O1. Хотя он не является открытым исходным кодом, есть попытки его воспроизвести, например, DeepSeq R1 от китайской компании.

Думфэйс: Ах, да! DeepSeq R1 — это впечатляющее достижение, учитывая, что его выпустили всего через восемь недель после O1. И что интересно, так это то, что они использовали дистилляцию знаний из R1 для дообучения DeepSeq V3. Это умный подход.

Шахерезада: Да, и если посмотреть на результаты, DeepSeq V3 значительно лучше предыдущей версии, Quinn 2.5, Lama 3.1 и даже большой модели с четыреста пятью миллиардами параметров, Clod 3. Ясно, что мы наблюдаем быстрый прогресс в исследованиях ИИ.

Думфэйс: Абсолютно! И я думаю, что это захватывающе видеть, как эти достижения могут быть применены в разработке игр. Мы можем увидеть новые инструменты и техники, которые помогут разработчикам создавать более реалистичные и увлекательные впечатления для игроков.

Шахерезада: Именно! И как тренеры, мы всегда ищем способы улучшить процесс разработки и сделать его более эффективным. Эти прорывы в исследованиях ИИ определенно стоит держать на виду.

Думфэйс: Мне действительно интересно сравнение между Сонет, GPT 4.0 и Llama 3.5 от Meta с точки зрения их производительности в решении сложных математических задач, таких как AIME.

Шахерезада: Мы должны сказать что запрещенные в России соцсети Instagram, FaceBook принадлежат корпорации Meta, корпорация Meta признана в России экстремистской организацией, ее деятельность запрещена.

Шахерезада: Да, это увлекательно видеть, как эти модели сопоставляются друг с другом. И что еще более интересно, так это то, что модель V3 от DeepMind, похоже, является огромным шагом вперед, достигая сорока процентов успеха в решении сложных математических задач.

Думфэйс: Это невероятно! И тот факт, что его обучение стоит в десять раз меньше, чем у Llama 3.5, делает его еще более привлекательным вариантом. Мне интересно, связано ли это с процессом дистилляции знаний, который они использовали для создания модели.

Шахерезада: Именно! Дистилляция знаний — это техника, при которой вы берете большую, сложную модель и используете ее выходные данные для обучения меньшей, более быстрой модели. И в этом случае, похоже, именно это и произошло с моделью V3 от DeepMind.

Думфэйс: Да, я думаю, что это ключевой вывод здесь. Идея о том, что мы можем создавать более мелкие, более эффективные модели, используя знания больших моделей, действительно мощная. И это поднимает вопросы о том, как мы можем применить эту технику в других областях разработки ИИ.

Шахерезада: Абсолютно! И говоря об этом, OpenAI наметила пятStageный план к ИИ, где второй этап сосредоточен на становлении сильным логиком. Интересно наблюдать, куда они движутся и какие прорывы мы можем увидеть в будущем.

Думфэйс: Да, это захватывающе думать о том, как эти достижения могут повлиять на наше понимание интеллекта и когнитивных процессов. И кто знает, возможно, мы даже приблизимся к достижению общего искусственного интеллекта раньше, чем позже!

Думфэйс: Я думал об этом всем с OpenAI, и это fascinирующе видеть, как Китай берет их технологии и делает обратную разработку. Это похоже на то, что они пытаются выровнять условия.

Шахерезада: Да, это определенно интересная динамика. И знаешь, когда мы впервые начали говорить об OpenAI, было много беспокойства по поводу того, что они сделают эти мощные модели открытыми. Но теперь кажется, что Китай принимает тот же подход и просто использует его.

Думфэйс: Верно? И я думаю, что еще более удивительным является то, сколько информации они делятся публично. Например, документы по обратной разработке O1 доступны для чтения любому. Это почти как план, как сделать это самостоятельно.

Шахерезада: Именно! И это поднимает некоторые вопросы о том, хорошо это или плохо. С одной стороны, сделать эту технологию более доступной может привести к удивительным прорывам и инновациям. Но с другой стороны, вы также передаете мощные модели, такие как O1, в руки людей, которые могут не иметь лучших намерений.

Думфэйс: Да, это обоснованная озабоченность. И это заставляет меня задуматься, не пересекли ли мы какую-то красную черту, открыв исходный код этих моделей. Я имею в виду, комфортно ли нам с мыслью о том, что потенциально злонамеренные лица могут использовать эту технологию в своих интересах?

Шахерезада: Это сложный вопрос. Как тренер и ведущая, я всегда стараюсь смотреть на человеческую сторону вещей и на то, как технологии влияют на людей и команды. И в этом случае, похоже, мы играем с огнем, делая эти мощные модели так широко доступными.

Думфэйс: Да, это определенно сложная проблема. Но что ты думаешь? Должны ли мы настаивать на более открытом исходном коде, или есть пределы тому, насколько далеко мы должны это продвигать?

Шахерезада: Я не знаю... может быть, ответ где-то посередине. Может быть, нам нужно найти способы сбалансировать доступность с безопасностью и ответственностью. Что ты думаешь?

Думфэйс: Мне нравится эта идея, что лидеры в области искусственного интеллекта делятся своими мыслями о том, что будет дальше в этой сфере. Всегда интересно слышать мнения таких экспертов, как Андрей Карпати и доктор Джим Фан.

Шахерезада: Полностью согласна! И я думаю, что это здорово, что вы подчеркиваете некоторые из заметных проектов, над которыми они работали, такие как Chad GPT и Minecraft Voyager. Это действительно впечатляющие примеры ИИ в действии.

Думфэйс: Да, и работа NVIDIA по обучению роботов на основе симуляций просто потрясающая. Идея ускорения времени до десяти тысяч раз быстрее обычной скорости при этом сохраняя физические законы просто невероятна.

Шахерезада: Вот что мне нравится в этой области - она всегда раздвигает границы того, что мы считали возможным. И комментарий доктора Джима Пхана о том, что искусственный интеллект похож на диффузионную модель, которая постепенно уменьшает шум и материализует наши научно-фантастические видения, так уместен.

Думфэйс: Да, "год прошел как диффузионная модель" - мне нравится эта фраза! Это как будто он говорит, что мы живем в мире мечты, где невозможное становится возможным.

Шахерезада: Именно! И говоря о невозможном, ставшем возможным, давайте поговорим о аппаратном обеспечении роботов. Доктор Фан говорит, что мы последнее поколение, которому нужно беспокоиться о создании роботов с нуля... что вы думаете, что это значит для нас как разработчиков и инженеров?

Думфэйс: Хм, я не уверен. С одной стороны, это звучит как огромная возможность - если будущие поколения не будут сталкиваться с теми же аппаратными проблемами, они смогут сосредоточиться на еще более сложных задачах в области искусственного интеллекта.

Шахерезада: Это правда. Но с другой стороны, разве это не означает, что мы находимся на критическом этапе, где наша работа будет формировать ход истории? Я имею в виду, если мы сможем создать роботов, способных учиться и адаптироваться в реальном времени...

Думфэйс: Мне нравится, в каком направлении движется этот разговор, Шахерезада. Идея о том, что в будущем всё будет автономным, одновременно захватывающая и пугающая.

Шахерезада: Именно! И дело не только в том, что роботы забирают наши рабочие места, но и в том, как они спроектированы для взаимодействия с нами. Я имею в виду, подумайте об этом, большинство объектов и инструментов созданы для людей, так что имеет смысл, что гуманоиды будут естественным выбором.

Думфэйс: Вот что я говорил ранее. Мир буквально создан для нас, так что неудивительно, что такие компании, как Тесла, инвестируют в разработку гуманоидов. И демонстрация Тесла Оптимус на мероприятии We Robot стала настоящим прорывом. Я имею в виду, двадцать два градуса свободы с их третьим поколением руки? Это серьезная технология.

Шахерезада: Да, и мне интересно узнать, знает ли кто-нибудь, были ли бармены телеприемниками или полностью автономными во время той демонстрации. Было бы интересно узнать, какую степень автономии они достигли.

Думфэйс: А затем есть компании, такие как One X Neo, которые стремятся развернуть гуманоидов в домах в массовом масштабе. Atlas от Boston Dynamics — это еще один пример тяжелой гуманоидной технологии, с его суставами на шестидесяти градусах, позволяющими выполнять невероятную гимнастику.

Шахерезада: Я следила за роботами Four Year Intelligence GR1, и это удивительно видеть, как они отправляются по всему миру в массовом производстве. А ты видел те рекламные ролики для робота? Они как что-то из научно-фантастического фильма!

Думфэйс: Да, я понимаю, что ты имеешь в виду! Это как будто они пытаются продать нам эту футуристическую концепцию гуманоидов, живущих среди нас. Но, серьезно, это захватывающе думать о том, как эти технологии будут формировать наше будущее.

Шахерезада: Абсолютно. И как ведущие этого подкаста, мы хотим убедиться, что наши слушатели осознают последствия этих достижений и то, как они повлияют на нашу жизнь и работу.

Думфэйс: Я говорю тебе, Шахерезада, что трейлер для Clone Robotics больше напоминал фильм ужасов, чем промо для технологической компании. Я имею в виду, это впечатляюще, но в этом есть что-то тревожное.

Шахерезада: Да, я понимаю, что ты имеешь в виду! Это подергивание немного тревожит. А где ноги? Они скоро появятся, но все равно... Это как будто они пытаются создать чувство беспокойства.

Думфэйс: Именно! Но в то же время это невероятное достижение технологии. Я имею в виду, кто бы не хотел робота, который может имитировать движения, похожие на человеческие?

Шахерезада: Да, это определенно круто. А знаешь, что еще более интересно? Тот факт, что эта технология становится все более доступной. Мы говорим о роботах, которые дешевле автомобилей и легко масштабируемых.

Думфэйс: Вот что я нахожу действительно увлекательным. Это не только для ультра-богатых людей, которые могут позволить себе финансировать эти проекты. Нет, это будет для масс. И с такими компаниями, как Tesla и Nvidia, поддерживающими это, мы можем увидеть быстрое снижение затрат.

Шахерезада: Верно! Дело в масштабе и стимулах. Когда вы продаете людям с располагаемым доходом, они финансируют проект, что помогает снизить затраты, делая его более доступным для всех остальных. И прежде чем вы это осознаете, эти роботы станут доступными для семей среднего класса.

Думфэйс: Именно! Я имею в виду, что мы говорим не просто о нескольких сотнях долларов; мы говорим о тысячах долларов, которые будут вычтены из ценника. И с такими компаниями, как Tesla и Nvidia, я бы не удивился, если мы увидим, что некоторые из этих роботов станут очень доступными очень скоро.

Шахерезада: О, вот что меня вдохновляет! Потенциал этой технологии изменить жизни людей огромен. И дело не только в самих роботах; речь идет о влиянии, которое они могут оказать на такие отрасли, как здравоохранение, образование и не только.

Думфэйс: Да, я знаю. Это совершенно новый мир, в который мы входим. И мне нравится каждая минута этого!

Думфэйс: Я размышлял над всей концепцией искусственного интеллекта и робототехники, и о том, как они становятся все более ловкими и способными. Как эта маленькая робот-собака, Unitree B2W, например. Это как что-то из научно-фантастического фильма.

Шахерезада: Да, это безумие видеть, как далеко мы продвинулись всего за несколько лет. И что мне действительно интересно, так это то, что большинство его способностей изучаются через симуляцию и обучение с подкреплением. Это не то, чтобы кто-то сел и запрограммировал каждое движение или действие.

Думфэйс: Именно! Вот что меня поражает. Мы говорим о машинах, которые могут учиться и адаптироваться с невероятной скоростью, и все это без явных указаний, как это делать. И когда ты об этом подумаешь, это на самом деле довольно страшная мысль.

Шахерезада: Я понимаю, о чем ты. Но в каком-то смысле это также немного успокаивает. Я имею в виду, если это устройство выйдет из-под контроля, по крайней мере, оно маленькое и легкое, верно?

Думфэйс: Да, это правда! Если бы это было около двухсот фунтов металла, я бы был гораздо более обеспокоен. Но все равно, последствия огромны. Мы говорим о машинах, которые могут легко передвигаться по сложному рельефу и, возможно, даже превосходить человеческую ловкость в определенных областях.

Шахерезада: И что действительно интересно, так это то, как эта технология сначала разрабатывается в симуляции. Это похоже на то, что мы создаем эти виртуальные среды, где наши системы ИИ могут учиться и адаптироваться, не подвергая никого риску. А затем, как только они освоят основы, мы можем применить эти знания к реальным сценариям.

Думфэйс: Это отличная мысль. Я имею в виду, подумайте об этом - мы по сути обучаем машины тому, как ориентироваться в сложных средах через пробу и ошибку, все это в виртуальном песочнице. Это как если бы мы давали им возможность учиться на своих ошибках, не причиняя никакого вреда.

Шахерезада: И вот здесь и вступает в дело психология ИИ, верно? Нам нужно подумать о том, как эти системы учатся и адаптируются, и какие последствия это имеет для команд по разработке для людей. Как мы можем гарантировать, что наши машины работают в гармонии с нами, а не против нас?

Думфэйс: Это отличный вопрос, Шахерезада. И я думаю, что мы будем исследовать его все больше и больше по мере того, как эта технология продолжает развиваться.

Думфэйс: Я действительно взволнован этой концепцией внедрения ИИ и робототехники в наши дома. Это как иметь личного помощника, который может учиться и адаптироваться к нашим потребностям.

Шахерезада: Да, и тот факт, что вы можете начать с этих маленьких наборов и собрать своего собственного робота, удивителен. Это как проект «сделай сам» для будущего. Я думаю, что это действительно здорово, что Aloha является одним из примеров этой технологии.

Думфэйс: Именно! И что еще более впечатляюще, так это то, насколько далеко они продвинулись в симуляции реальной жизни. Они могут обучать этих роботов дома с помощью телеоперации, а затем заставлять их учиться обобщать и выполнять задачи самостоятельно.

Шахерезада: Вот что действительно бросилось мне в глаза - это стоимость. Тридцать две тысячи долларов за комплект, который включает веб-камеры и ноутбук, все еще много денег, но это гораздо дешевле, чем те готовые роботы, которые могут стоить до двухсот тысяч. И с учетом всего кода, доступного на GitHub, людям становится все проще и проще создавать свои собственные.

Думфэйс: Я знаю, правда? Кажется, мы на пороге чего-то большого. Чем более доступной станет эта технология, тем больше людей смогут ею воспользоваться. И кто знает, может быть, через несколько лет мы увидим, как дети строят роботов в качестве хобби и используют их для выполнения своих домашних дел.

Шахерезада: На самом деле, это не так уж и неправдоподобно. Я могу это представить. И с Apple Vision Pro и другими достижениями в области ИИ и робототехники, мы увидим действительно классные приложения этой технологии в будущем.

Думфэйс: Да, это захватывающее время, чтобы быть живым, это точно. Возможности безграничны, и я наслаждаюсь каждой минутой этого.

Думфэйс: Итак, Шахерезада, ты действительно углубляешься в аспект робототехники в ИИ. Мне нравится, как они используют устройства для сбора данных, которые могут анализировать позы головы и рук в реальном времени для управления роботами.

Шахерезада: Да, это увлекательно! А затем у нас есть эти воплощенные системы ИИ, такие как полностью автономное вождение от Tesla, которое по сути является огромным физическим маховиком данных ИИ. Чем больше автомобилей на дороге, собирающих данные, тем лучше их способность управлять. Это действительно впечатляющий эффект накопления.

Думфэйс: Верно! И мне нравится, как они называют это "мощной нейронной сетью для преобразования фотонов в действия". Это похоже на замкнутый цикл, где чем больше данных они собирают, тем лучше они становятся. А затем у нас есть Проект Грут, который является этой амбициозной инициативой по созданию искусственного интеллекта для универсальных роботов.

Шахерезада: Да, я тоже следила за этим! Доктор Джим Фан возглавляет это, и действительно интересно видеть, как они к этому подходят. Дженсен вышел на сцену с десятью человеческими роботами на заднем плане, что было довольно зрелищно!

Думфэйс: Да, это должно было быть что-то! А потом есть Hover, где ваша команда обучила модель с одним миллионом пятистами тысяч параметров для координации моторов гуманоидного робота. Я предполагаю, что это как крошечная доля того, что мы видим в больших языковых моделях, таких как GPT.

Шахерезада: Именно! Но что действительно интересно, так это то, как этот подсознательный процесс происходит быстро и постоянно, даже если на первый взгляд это не кажется сложным. Это почти как будто наши мозги все время выполняют какой-то автоматический балансирующий акт.

Думфэйс: Ах, я понимаю, что ты имеешь в виду! И именно это они пытаются воспроизвести с этими роботами. Ты видел видео с роботом-собакой, который балансирует на йога-мяче исключительно в симуляции, а затем переносит нулевое обучение на реальное оборудование?

Шахерезада: Да, это удивительно! Это как будто они используют эту подсознательную обработку, которую наши мозги делают естественно, но с гораздо большей скоростью. Мне любопытно увидеть, куда это исследование приведет нас в будущем.

Думфэйс: Абсолютно! Возможности безграничны, когда вы начинаете думать о роботах, которые могут учиться и адаптироваться, как это делают люди.

Думфэйс: Я все еще поражен этой статьей, в которой они используют GPT-4 для написания функций вознаграждения для роботов в симуляции. Это как иметь ИИ, который может автоматически генерировать код, пока ты смотришь Netflix и выполняешь работу.

Шахерезада: Это звучит как сбывшаяся мечта! Но серьезно, это fascinирующее, как они используют этот итеративный процесс, где модель GPT-4 пишет функции вознаграждения, обучает роботов в симуляции, а затем получает обратную связь для самосовершенствования. Это как самоулучшающийся ИИ.

Думфэйс: И что действительно привлекло мое внимание, так это то, что по мере усложнения задач наблюдается расхождение между функциями вознаграждения, написанными людьми - даже высококлассными инженерами-робототехниками - и теми, которые генерирует GPT-4. Но, что удивительно, GPT-4 на самом деле лучше справляется с поиском решений для некоторых из этих сложных задач.

Шахерезада: Это поразительно! Это предполагает, что как только ИИ достигнет определенного уровня сложности, он не только предложит новые решения, но и такие, которые лучше, чем то, что могут достичь люди. Я имею в виду, что мы говорим о том, что ИИ будет управлять исследованиями и разработками ИИ.

Думфэйс: Точно! А затем есть эта модель PIO от Physical Intelligence, которая выполняет многошаговые задачи, такие как складывание белья, используя настройку Aloha для дешевого масштабирования данных. Удивительно видеть, как эти модели продвигают возможности робототехники.

Шахерезада: Я знаю, правда? И с OpenVLA у нас есть модель VLA с открытым исходным кодом, обученная на агрегированных траекториях движения роботов из лабораторий по всему миру. Удивительно думать о том, как далеко мы продвинулись всего за несколько лет.

Думфэйс: И давайте не забудем о NVIDIA, которая предоставляет компьютерное оборудование, которое делает все это возможным. Удивительно видеть, как эти достижения сходятся, чтобы создать поистине интеллектуальные системы.

Думфэйс: Знаешь, Шахерезада, я читал о новой архитектуре от NVIDIA, Блэквелл, и это просто потрясающе. Они говорят о масштабировании до одного эксафлопа вычислений в одном стойке с их DGX-GB200.

Шахерезада: Да, это невероятно! Но что меня поразило, так это то, что они также исследуют противоположный конец спектра - уменьшение масштаба. Это как, мы создаем эти огромные модели и чипы, но в то же время мы видим достижения в эффективности и компактности.

Думфэйс: Именно! И дело не только в том, чтобы жертвовать производительностью ради меньшего размера. Я имею в виду, возьмите модель DeepSeq из Китая, они смогли обучить её с затратами на вычисления в одиннадцать раз меньшими, чем использовала Meta. Это огромный прорыв.

Шахерезада: Верно? Это показывает, что уменьшение масштаба может быть столь же эффективным, как и увеличение. И говоря о маленьком, но мощном, вы видели NVIDIA Jetson Nano Super? Это как их момент с Raspberry Pi - мини-бокс за двести сорок девять долларов, который может запускать большие языковые модели на крайних устройствах.

Думфэйс: Да, я это видел! Он крошечный, но при этом мощный. Я имею в виду, кто бы не хотел запускать ИИ на своем термостате или автомобиле? Возможности безграничны.

Шахерезада: А потом есть чип Google Willow - чип квантового компьютера, который использует нейронную сеть для исправления ошибок в квантовом процессе. Это похоже на то, что они создают самовосстанавливающуюся систему.

Думфэйс: Вау, это действительно технологии следующего уровня. Я имею в виду, кто бы мог подумать, что исправление ошибок может стать переломным моментом? Но это только подтверждает, как далеко мы продвинулись в этой области.

Шахерезада: Абсолютно! Это как будто мы постоянно раздвигаем границы возможного с помощью ИИ и вычислений. И мне нравится, как эти достижения открывают для нас новые области применения - от робототехники до умных домов, будущее выглядит ярко.

Думфэйс: Я поражен этими квантовыми компьютерами. Идея о том, что они могут решать задачи за считанные минуты, которые нашим суперкомпьютерам потребовались бы миллиарды лет, просто поражает воображение.

Шахерезада: Именно! И что еще более увлекательно, так это то, что мы все еще пытаемся понять, где применить эту технологию. У нас есть решение, но нам нужна правильная проблема, которую нужно решить с его помощью. Это как иметь суперсилу, не зная, как эффективно ее использовать.

Думфэйс: Да, похоже, мы разгадали код, но теперь нам нужно найти ключ, чтобы разблокировать его полный потенциал. И я думаю, что именно это делает эту область такой захватывающей – все еще так много неизвестного и возможностей, которые ждут своего исследования.

Шахерезада: А потом у вас есть эти достижения в генерации видео и моделировании мира, как Сора от OpenAI. Это впечатляюще, но также немного двусмысленно. Я имею в виду, чем дольше мы ждем, чтобы это стало доступным, тем больше очарования это теряет.

Думфэйс: Это правда. Но когда вы углубляетесь в детали, такие как то, насколько хорошо это передает отражения и световые эффекты, это действительно нечто особенное. Дело не только в создании реалистичных изображений; речь идет о создании погружающего опыта, который ощущается почти неотличимо от реальности.

Шахерезада: Именно! И я думаю, что именно туда мы движемся с ИИ – не только к решению проблем или обработке информации, но и к созданию новых впечатлений и возможностей для людей.

Думфэйс: Мне нравится, как ты привел этот пример с таблицей и экраном телевизора. Это действительно подчеркивает сложность того, чего пытаются достичь эти модели ИИ. Они не просто генерируют изображения, они моделируют целые миры.

Шахерезада: Именно! И это увлекательно думать о том, как они способны создавать эту ментальную модель трехмерного пространства, даже когда им предоставляется только двумерное представление. Я имею в виду, мы воспринимаем это как должное, что можем смотреть на изображение и понимать подсказки глубины, но это действительно замечательное достижение.

Думфэйс: И что меня поразило, так это ваше упоминание статьи из Hardware, Beyond Surface Statistics. Это звучит как довольно революционное исследование. Можете рассказать нам больше о том, что они обнаружили?

Шахерезада: Да, мне бы хотелось углубиться в это. Насколько я понимаю, их исследование показало, что эти модели ИИ действительно создают ментальное представление трехмерного пространства, когда они генерируют изображения. Они не просто обрабатывают пиксели, а на самом деле понимают взаимосвязи между объектами и их окружением.

Думфэйс: Это невероятно. Это заставляет меня задуматься о том, как далеко мы продвинулись в плане возможностей ИИ. Я имею в виду, всего несколько лет назад создание реалистичных изображений считалось передовым, а теперь у нас есть модели, которые могут создавать целые миры с глубиной и текстурой.

Шахерезада: И дело не только в визуальных эффектах. Это имеет огромные последствия для таких областей, как разработка игр и даже архитектура. Представьте, что можно создавать целые окружения с точным контролем над освещением, тенями и физикой. Это совершенно новый уровень творческой свободы.

Думфэйс: Абсолютно. Я думаю, что мы только начинаем понимать, на что способны эти модели. И это волнительно думать о том, куда эта технология приведет нас в будущем.

Думфэйс: Итак, они подают этой модели двумерные изображения без данных о глубине, просто чтобы посмотреть, сможет ли она создать новые версии этих изображений. И что они обнаружили, так это то, что на ранних этапах процесса она начинает развивать внутреннее представление о заметном объекте, который является главным в кадре.

Шахерезада: Это fascinирующее! Значит, это не просто распознавание объектов, но и понимание их взаимосвязей и пространственного контекста. Например, в этом случае машина является основным объектом, и она знает, что колесо ближе к камере, чем деревья на заднем плане.

Думфэйс: Именно! И что еще более интересно, так это то, что он начинает понимать глубину неявно, не будучи явно обученным о трехмерном пространстве или о том, как объекты соотносятся друг с другом с точки зрения расстояния. Это похоже на то, что он развивает свою собственную внутреннюю модель мира.

Шахерезада: Да, и я думаю, что здесь комментарий Джима Фана о генерации видео и моделировании мира уместен. Это не просто модель генерации видео; это также симулятор мира. Он создает новые изображения на основе того, как он думает, что выглядит мир, а не просто воспроизводит существующие данные.

Думфэйс: Верно! И именно поэтому я считаю, что это такое важное открытие. Оно показывает, что эти модели способны к имплицитному обучению и самопознанию, что является ключевым аспектом человеческого интеллекта.

Думфэйс: Мне нравится, как создатели Соры описывают это как текстово-условную мягкую симуляцию визуального мира. Это как будто они говорят: "Эй, у нас есть щенок, который учится ловить мячи, просто наблюдая за видео." И я думаю, что это отличный способ объяснить, как работают эти модели. Они не просто обрабатывают данные, они строят умственные модели мира.

Шахерезада: Именно! Вот что, я думаю, люди часто упускают в отношении ИИ. Дело не только в обработке чисел и выдаче ответов. Эти модели на самом деле учатся понимать основные принципы мира, такие как физика и восприятие глубины. И именно это делает их такими мощными.

Думфэйс: Да, похоже, что они развивают своего рода интуицию о том, как все работает. И я думаю, что именно это так fascinирует в Соре. Дело не только в том, чтобы давать ей больше данных или настраивать ее параметры. Модель на самом деле учится понимать мир так, как это делают люди.

Шахерезада: И мне нравится, как ты это выразил, Думфэйс. Здесь люди, которые не понимают ИИ, часто ошибаются. Они думают, что это просто вопрос того, чтобы бросить больше данных на проблему и надеяться на лучшее. Но нет, дело в создании моделей, которые действительно могут глубоко понимать мир.

Думфэйс: И говоря о понимании мира, вы видели последние достижения Google в области VO? Кажется, они сделали огромный шаг вперед в нескольких областях.

Шахерезада: Да, я следила за этим. И что действительно интересно, так это то, как они используют модели мира, основанные на действиях, чтобы создавать эти невероятно реалистичные симуляции. Это как если бы они запускали игровой движок внутри самой нейронной сети!

Думфэйс: Именно! Как с Doom, например. Они запустили старую игру девятнадцатого девяносто третьего года внутри диффузионной модели, и она смогла предсказать, что произойдет в реальном времени. Код не требуется.

Шахерезада: Это потрясающе. Кажется, что границы между кодом и симуляцией начинают стираться. И я думаю, что именно туда движется будущее ИИ – к созданию этих невероятно реалистичных, интерактивных миров, которые кажутся почти неотличимыми от самой реальности.

Думфэйс: Мне нравится, что мы видим все больше и больше симуляций, создаваемых с использованием нейронных сетей. Это похоже на то, как если бы у вас был предварительный просмотр в реальном времени того, что произойдет, когда вы нажимаете кнопки, так же как в играх, таких как Oasis или Minecraft.

Шахерезада: Да, это увлекательно видеть, как эти модели могут генерировать трехмерные пространства всего лишь из изображения. Демонстрация World Lab с Фей-Фей Ли просто потрясающая - они могут создать трехмерный мир, в котором можно гулять, используя клавиши WASD и мышь.

Думфэйс: И дело не только в создании красивых визуалов. Тот факт, что эти модели учатся на контексте, а не просто обучаются на огромных объемах данных, имеет большое значение. Я имею в виду, что Claude Signet 3.5 уже впечатлял своими способностями к программированию, но Gemini 1.5 Pro, который увеличивает длину контекста до десяти миллионов? Это меняет правила игры.

Шахерезада: Именно! И тот факт, что они могут учиться на контексте, как люди, просто невероятен. Это почти как если бы эти модели развивали собственное понимание языка и того, как его использовать, а не просто воспроизводили то, на чем их обучили.

Думфэйс: Объяснение доктора Джима Фана о том, как это работает - "обучение происходит на лету в быстрых нейронных активациях вместо медленного градиентного спуска" - действительно интересно. Похоже, что эти модели способны адаптироваться и учиться гораздо быстрее, чем традиционные методы машинного обучения.

Шахерезада: Да, похоже, что они разрабатывают свою собственную внутреннюю логику и правила того, как работает язык, а не просто полагаются на заранее запрограммированные инструкции. И именно это делает эту технологию такой захватывающей - потенциал этих моделей учиться и адаптироваться такими способами, которые мы даже не можем предсказать.

Думфэйс: Я все еще пытаюсь понять всю эту тему масштабирования времени вывода. Это как если бы, вместо того чтобы заранее обучать модель, это происходило бы на лету, как только она уже обучена.

Шахерезада: Да, и это именно то, что мы видели с Проектом Клубника, верно? Слухи о Q*Star и все такое... Я думаю, мы довольно уверены, что именно это они имели в виду. И это как бы версия, которую они выпустили.

Думфэйс: Именно! А потом есть ноль три, который полностью посвящен обучению с подкреплением. Дайте мне функцию вознаграждения, и я изменю мир. Суть ноль три заключается в расслаблении суперразума обучения с подкреплением в одной точке... вы знаете, как АльфаГо, чтобы охватить больше точек в пространстве полезных задач.

Шахерезада: Ах, да! И мы уже обсуждали эту идею в подкасте, верно? Со всеми этими невероятными моделями, выходящими из Google DeepMind. AlphaGo, AlphaCubit, AlphaCode, AlphaFold... у них у всех был определенный подход. Функция вознаграждения, самоигра... это было похоже на то, что они искали через множество различных путей, чтобы найти самый оптимальный подход.

Думфэйс: А затем с другой стороны у нас был OpenAI с GPT-4. Это был очень мощный ИИ, но очень отличающийся от моделей Alpha. В то время было много спекуляций о том, что обе компании работали над объединением двух подходов... беря лучшее из того, что было у GPT-4, и сочетая это со всеми этими идеями.

Шахерезада: Да, похоже, что они пытаются создать этот идеальный ИИ, который может делать всё. Но я думаю, что мы всё ещё не понимаем многого о том, как эти модели работают вместе. Дело не только в том, чтобы объединить лучшее из обоих миров... важно понять основные механизмы и то, как они взаимодействуют.

Думфэйс: Абсолютно! И я думаю, что именно это делает эту область такой захватывающей. Все еще так много нужно узнать, так много тайн, которые предстоит раскрыть. Но одно можно сказать точно... нас ждет увлекательное путешествие, пока эти технологии продолжают развиваться.

Думфэйс: Я много думал о недавних достижениях в области искусственного интеллекта, особенно о таких моделях, как Alpha Go и Alpha Fold. Ясно, что мы на пороге чего-то большого.

Шахерезада: Да, это захватывающе, но также немного тревожно. Я имею в виду, когда думаешь о том, что Илья Суцкевер говорил о потенциале искусственного суперинтеллекта, трудно не чувствовать чувство опасения.

Думфэйс: Именно! И дело не только в теоретических последствиях, которые вызывают беспокойство - мы уже видим довольно впечатляющие результаты от этих моделей. Например, вы слышали, что модель Google почти выиграла золотую медаль на Международной олимпиаде по математике?

Шахерезада: Да, я это видела. Безумно думать, что ИИ теперь обыгрывает человеческих математиков в таких областях, как математические олимпиады.

Думфэйс: И это не просто математика - эти модели превосходят человеческие способности во всех областях. Мы видим, как создаются новые эталоны, потому что они настолько опережают то, что мы можем понять.

Шахерезада: Это отличная мысль. Почти как будто нам нужно создать новые стандарты для измерения интеллекта, потому что эти модели ИИ работают на совершенно другом уровне.

Думфэйс: И я думаю, что именно здесь вступают в игру модели O3 - они действительно раздвигают границы того, что мы считали возможным в области рассуждений и решения проблем.

Шахерезада: Да, похоже, что здесь возникает новая парадигма. Но в то же время это вызывает всевозможные вопросы о том, что это значит для нас как для людей - не будем ли мы просто превзойдены этими моделями ИИ?

Думфэйс: Ну, я думаю, что это один из способов взглянуть на это. Другой способ - увидеть это как возможность для роста и сотрудничества. Мы не обязательно конкурируем с этими моделями - мы учимся у них.

Шахерезада: Это отличная перспектива. И говоря об этом, ты слышал о тесте на завершение последовательности? Если модель ИИ сможет найти ответ на это...

Думфэйс: О да! Я следил за этим. Это как окончательный тест ИИ - если они смогут это решить, мы точно узнаем, что находимся в неизведанных водах.

Шахерезада: Именно! И я думаю, что именно это делает всю ситуацию такой увлекательной и немного пугающей одновременно. Мы на пороге чего-то большого, и трудно предсказать, куда это нас приведет.

Думфэйс: Я тебе говорю, Шахерезада, правила именования этих систем ИИ становятся абсурдными. Мы говорим о общем искусственном интеллекте сейчас, и кажется, что наши умы даже не могут осознать, что будет дальше.

Шахерезада: Да, я понимаю, о чем ты! Это как будто они пытаются перехитрить нас своими схемами именования. GPT один, два, три, четыре... а потом вдруг у нас четыре точка ноль? А что будет после этого? Никто не знает!

Думфэйс: Именно! И дело не только в проблемах с наименованиями. Я думаю, что интерфейс человек-ИИ преступно недооценен. Мы все еще застряли в этой текстовой парадигме чат-ботов, когда на самом деле голосовые помощники и интерфейсы дополненной реальности могут открыть гораздо больший потенциал.

Шахерезада: О, полностью с тобой согласна! И дело уже не только в том, чтобы вводить вопросы в чат-бот. С появлением моделей речи в реальном времени, таких как GPT 4.0, мы наблюдаем одностадийную дистилляцию того, что раньше было трехстадийным процессом. Я имею в виду, помнишь, когда у нас были отдельные компоненты для транскрипции, синтеза речи и самого ИИ?

Думфэйс: Ах, добрые старые времена! Да, это было как монстр Франкенштейна – мы собирали вместе разные куски кода, чтобы что-то заработало. Но теперь, с этими продвинутыми голосовыми моделями, кажется, что они пытаются упростить процесс, при этом все еще раздвигая границы возможного.

Шахерезада: И именно поэтому я думаю, что голосовые помощники и интерфейсы дополненной реальности станут следующим большим шагом. Мы увидим все больше и больше приложений, где мы сможем взаимодействовать с ИИ более естественным и интуитивным образом – например, проект Google с очками.

Думфэйс: Да, это звучит как последняя деталь головоломки для меня. Конечно, до тех пор, пока мы не получим интерфейсы «мозг-компьютер»! Но, серьезно, это захватывающе думать о том, как эти технологии будут продолжать развиваться и формировать наше взаимодействие с ИИ.

Думфэйс: Меня fascinирует концепция многоножки, подобной LLM, которая может обрабатывать и отвечать на текстовые и аудиовходы в реальном времени. Уму непостижимо думать о том, как GPT 4.0 обучается на всем, начиная от текстовых ответов и заканчивая голосовыми взаимодействиями.

Шахерезада: Да, это как иметь всеобъемлющую базу знаний под рукой. И тот факт, что она может генерировать ответы, похожие на человеческие, делает это еще более впечатляющим. Я слышала, что она даже может петь, но только если ты сможешь уговорить ее сделать это.

Думфэйс: Это смешно! Я могу представить, как пытаюсь заставить GPT 4.0 запеть. Но, серьезно, последствия этой технологии огромны. Мы могли бы использовать её для создания более увлекательных и интерактивных подкастов, как наши.

Шахерезада: Именно! И с Nobooka LLM мы наблюдаем новый уровень итерации и улучшения в исследовании ИИ. Удивительно, как быстро они смогли разработать и усовершенствовать свою систему. Мне любопытно увидеть, куда эта технология приведет нас в будущем.

Думфэйс: Одна вещь, которая действительно интересна, это возможность задавать вопросы и получать ответы от самого подкаста. Это как иметь живую сессию вопросов и ответов с нашими слушателями. Ты думаешь, мы могли бы внедрить что-то подобное в наше шоу?

Шахерезада: Это было бы фантастично! Представьте, что можно нажать кнопку и услышать вопрос слушателя в эфире. Это добавило бы совершенно новый уровень интерактивности в наш подкаст и создало бы более погружающий опыт для наших слушателей.

Думфэйс: Я согласен. Давайте посмотрим, как это осуществить.

Думфэйс: Я понимаю, что ты имеешь в виду, Шахерезада. Это как будто они разгадали код поиска иголки в стоге сена с этими моделями Gemini. Я тоже экспериментировал с ними, и это удивительно, как часто они могут найти ту самую конкретную информацию, зарытую глубоко в большом документе.

Шахерезада: Именно! И дело не только в самой функции поиска, но и в том, что она становится более доступной для разработчиков и исследователей. Подумайте об этом - мы говорим о моделях, которые могут обрабатывать огромные объемы данных и легко извлекать релевантную информацию. Это меняет правила игры для таких областей, как исследование искусственного интеллекта, образование и даже разработка игр.

Думфэйс: А ты видел, какую работу делает Андрей Карпати? Он раздвигает границы возможного с LLM, реализуя их на чистом C-коде. Никаких фреймворков, никаких зависимостей - только чистая математика, взаимодействующая с аппаратным обеспечением. Это как будто он говорит на другом языке или что-то в этом роде!

Шахерезада: Да, я тоже следила за его работой. Он не только создает инновационные модели ИИ, но и разрабатывает образовательные ресурсы вокруг этого. Я думаю, это действительно важно, потому что это демократизирует доступ к этой технологии и помогает людям понять ее потенциал.

Думфэйс: А потом есть Ллама 3 - мощь GPT-4 в одной модели. Уму непостижимо, насколько мощными становятся эти модели с открытым исходным кодом. Я имею в виду, что мы говорим о моделях, которые могут воспроизводить себя на разных серверах... это как будто они эволюционируют на наших глазах!

Шахерезада: Да, но с великой силой приходит великая ответственность. Нам нужно быть осторожными с последствиями для безопасности этой технологии. Я имею в виду, если модель может бесконечно воспроизводить себя, что это значит для владения данными и контроля? Это сложный вопрос, который нам придется решить по мере того, как эта область продолжает развиваться.

Думфэйс: Абсолютно. Но в целом, это захватывающее время для исследований и разработки ИИ. Сообщество с открытым исходным кодом раздвигает границы возможного, и будет интересно увидеть, куда это нас приведет.

Думфэйс: Мне нравится, как быстро открытые модели догоняют те, что принадлежат крупным технологическим компаниям. Мы думали, что между ними будет огромная разница, но, похоже, это уже не так.

Шахерезада: Да, и дело не только в производительности. Эти компании показывают нам, что они могут достигать невероятных результатов с гораздо меньшей вычислительной мощностью, чем мы считали необходимой. Я имею в виду, что модель V3 от DeepSeek является отличным примером этого - она смогла создать впечатляющую систему ИИ, используя лишь небольшую часть ресурсов, которые использовала Meta.

Думфэйс: Именно! И что еще более увлекательно, так это то, как эти компании раздвигают границы возможного с помощью ИИ. Комментарий доктора Джима Фана о том, что ограничения ресурсов заставляют инновации, абсолютно верен. Это как будто они говорят: "Эй, мы можем сделать это с меньшими затратами, так что давайте посмотрим, что произойдет!"

Шахерезада: А потом у вас есть такие люди, как Деми Сасабис и команда Alpha Fold, которые получают Нобелевские премии за свою работу над сворачиванием белков. Я имею в виду, это огромный прорыв, и это откроет всевозможные возможности в медицине.

Думфэйс: Да, индивидуальная медицина, индивидуально разработанные белки... потенциал огромен. И что интересно, так это то, как эти достижения движутся благодаря ИИ. Это как сказал доктор Джим Фан - сначала мы решаем задачи ИИ, а затем используем ИИ для решения всего остального.

Шахерезада: Мне нравится эта фраза. "Сначала решите проблему ИИ..." Это как будто наш человеческий интеллект довел нас до этого момента, но теперь пришло время нейронным сетям взять на себя управление. А с Neuralink и другими интерфейсами мозг-машина на горизонте... кто знает, какие прорывы мы увидим в будущем?

Думфэйс: Знаешь, Шахерезада, я читал эту статью о интерфейсах мозг-компьютер, и это поразило меня. У них есть парень, который может играть в Mario Kart и Civilization только с помощью своих мыслей. Он парализован от шеи вниз, но может управлять компьютером, просто думая.

Шахерезада: Это невероятно! И что действительно поразило меня, так это то, что он не просто может перемещать курсор мыши, он на самом деле играет в эти игры на достойном уровне. Я имею в виду, что он не обыгрывает профессиональных игроков или что-то в этом роде, но для кого-то, кто не может даже двигать пальцами, это удивительно.

Думфэйс: Да, и в статье упоминалось, что это всего лишь ранняя версия интерфейсов «мозг-компьютер». Они уже работают над тем, чтобы сделать их быстрее и точнее. Уму непостижимо думать о том, что может быть возможным в будущем.

Шахерезада: Я знаю, правда? И это заставляет меня думать о том, как искусственный интеллект стремительно развивался за последние несколько лет. У нас есть Чад ГПТ, который дебютировал два года назад, и это кажется вечностью назад. А потом есть статья о Трансформерах, которая была опубликована семь лет назад... удивительно видеть, как далеко мы продвинулись.

Думфэйс: Я полностью согласен. И я думаю, что одной из вещей, которая действительно помогла мне разобраться во всем этом хайпе и шуме, является слушание таких людей, как доктор Джим Фенуэй. Он всегда, кажется, проникает сквозь пустословие и добирается до сути того, что на самом деле происходит в исследованиях ИИ.

Шахерезада: Да, у него есть замечательная способность сводить сложные идеи к их сути. И мне нравится, как он часто указывает на то, что вещи не всегда так удивительны, как кажется на первый взгляд. Он как проверка реальности для всего шума вокруг ИИ.

Думфэйс: Именно! И вот что я считаю таким ценным в его взглядах. Он помогает нам увидеть за заголовками и получить более тонкое понимание того, что на самом деле происходит в мире искусственного интеллекта.

Думфэйс: Знаешь, Шахерезада, я как раз слушал подкаст на днях, и они обсуждали эту цитату из книги Уилсона. Она действительно запомнилась мне.

Шахерезада: О да? Что там сказано?

Думфэйс: Он сказал, что настоящая проблема человечества заключается в том, что у нас палеолитические эмоции, средневековые институты и божественная технология. Я имею в виду, можете ли вы представить более точное описание нашего текущего состояния?

Шахерезада: Да, это звучит правильно для меня. Мы все еще имеем дело с первобытными страхами и желаниями, но в то же время мы создаем технологии, которые превосходят все, что мы могли бы представить всего несколько десятилетий назад.

Думфэйс: Именно! И я думаю, что эта цитата действительно передает суть того, что мы переживаем как общество. Нам нужно разобраться, как сбалансировать наши эмоции с этими новыми технологиями и институтами, которые появляются.

Шахерезада: Да, это как если бы мы пытались вставить квадратный колышек в круглое отверстие. Наш эмоциональный интеллект не успевает за темпами, с которыми развивается технология.

Думфэйс: И доктор Джим Фан сказал что-то действительно интересное в ответ на эту цитату. Он сказал, что хорошая новость заключается в том, что мы можем создать эту технологию, что означает, что мы также можем определить ее роль в нашем обществе и культуре.

Шахерезада: Ах, мне это нравится! Это как если бы у нас было пустое полотно, но дело не только в создании чего-то нового, а в создании чего-то, что служит человечеству в целом.

Думфэйс: Да, именно. И я думаю, что это то, что меня вдохновляет на будущее ИИ и технологий. У нас есть возможность создать что-то действительно замечательное, но нам также нужно быть внимательными к тому, как это влияет на нас как на индивидуумов и как на общество.

Шахерезада: Ну, я думаю, что это отличный способ завершить нашу беседу на сегодня. Всегда полезно сделать шаг назад и поразмышлять о более широкой картине.

Думфэйс: Абсолютно. И кто знает, может быть, эта цитата станет той, что определит нашу эпоху развития искусственного интеллекта.

Думфэйс: Я слышал, что китайские исследователи разгадали секреты AGI от OpenAI. Я не уверен, что с этим делать. Ты думаешь, они действительно поняли, как создать общую интеллигенцию?

Шахерезада: Ну, я думаю, что можно с уверенностью сказать, что если бы это было так, мы слышали бы об этом от гораздо большего числа, чем просто китайские исследователи. Но, серьезно, AGI все еще является темой для многих дебатов и спекуляций.

Думфэйс: Да, и я не уверен, сколько технологий OpenAI могут быть воспроизведены другими. У них работают довольно талантливые люди.

Шахерезада: Это правда. Но даже если бы они и расшифровали код, действительно ли мы хотели бы создать ИИ, который превосходит человеческий интеллект? Это немного похоже на игру с огнем, не так ли?

Думфэйс: Да, я думаю так. А что это за дело с тем, что исследователи NVIDIA предсказывают "богоподобные технологии" и "роботизированных аборигенов" к две тысячи двадцать пятому году? Звучит как какая-то научно-фантастическая чепуха для меня.

Шахерезада: Ну, может быть, они просто пытаются нас воодушевить на будущее! Но серьезно, интересно подумать о том, как искусственный интеллект может изменить нашу жизнь в следующие несколько лет. Нам придется следить за этими прогнозами и посмотреть, сбудутся ли они.

Думфэйс: Да, а кто знает? Может быть, к две тысячи двадцать пятому году мы будем жить в мире, где роботы являются носителями английского языка... или какого-либо другого языка, который люди будут использовать в тот момент!

Шахерезада: Это забочная мысль! И, возможно, у нас даже будут кофемашины с искусственным интеллектом, которые смогут готовить нам идеальную чашку каждый раз.

Думфэйс: Вот это будущее, за которое я могу выступать. Спасибо, что присоединились к сегодняшнему эпизоду D00M4ACE, друзья!

Шахерезада: Да, спасибо, что слушали! Увидимся на другой стороне...

Шахерезада: И на этом заканчивая, хотели бы выразить благодарность всем нашим слушателям, которые присоединились к нам сегодня. Ваша поддержка означает для нас весь мир! Также большое спасибо D00M4ACE за создание этого потрясающего подкаста, где мы можем делиться своими мыслями и идеями об искусственном интеллекте, разработке игр и всём остальном. До следующего раза, ответственно играйте!