#101 Релиз OpenAI o1 и ChatGPT Pro: Первые Впечатления и Тесты нового ИИ-помощника + Новости ИИ.

#143  суббота, 7 декабря 2024 г.  99 минут(ы)  9829 слов

В этом выпуске D00M4ACE ведущие Думфэйс и Шахерезада обсуждают последние анонсы от OpenAI, включая новые модели O1 и ChatGPT Pro. Думфэйс восхищён мультимодальными возможностями O1 и его улучшенной производительностью в математике и кодировании, даже превосходящей экспертов в некоторых научных областях. Шахерезада интересуется применением этих моделей в разработке игр и влиянием на рабочие процессы. Они обсуждают высокую стоимость ChatGPT Pro ($200/месяц), доступность через API и потенциал для совместного использования аккаунтов. Ведущие тестируют O1 на распознавание изображений, генерацию кода, решение логических задач и Advent of Code. Они также затрагивают другие новости из мира ИИ, такие как Genie 2 от Google DeepMind, модель QWQ из Китая, Intellect One от Prime Intellect, MCP от Anthropic, GenChess от Google и новую модель генерации изображений от Runway. В конце выпуска Думфэйс и Шахерезада делятся впечатлениями от работы с ChatGPT Pro и o1 FULL.

D00M4ACE разработка 2D MMORPG блог ИИ и геймдев 🌐 https://d00m4ace.com

Telegram: https://t.me/d00m4ace_blog

YouTube: https://www.youtube.com/c/@d00m4ace

Soundcloud: https://soundcloud.com/d00m4ace

Apple Podcast: https://podcasts.apple.com/podcast/id1723142484

Яндекс Музыка: https://music.yandex.ru/album/28798077

VK Podcast: https://vk.com/podcasts-224167280

Amazon Music: https://music.amazon.com/podcasts/40c36f38-114a-4a79-8d0c-baf970f331b3/

Spotify: https://open.spotify.com/show/4RsttStN9RejAOEbLUG8IS

Дзен: https://dzen.ru/d00m4ace

Rutube: https://rutube.ru/channel/33955589/

RSS1 feed: https://podster.fm/rss.xml?pid=89212

RSS2 feed: https://media.rss.com/d00m4ace/feed.xml

Транскрипция подкаста:

Думфэйс: Привет, Шахерезада, добро пожаловать обратно в D00M4ACE! Сегодня мы погружаемся в захватывающий мир OpenAI и их недавние объявления. Я очень рад, что они наконец выпустили OpenAI O1 и ChatGPT Pro.

Шахерезада: Ах, да! Двенадцать дней OpenAI — это отличный способ удержать нас в напряжении до Рождества. И что здесь не любить в новых моделях ИИ? Итак, давайте перейдем к деталям. Каковы были ваши первые впечатления от OpenAI O1?

Думфэйс: Ну, я был поражён теми бенчмарками, которые они продемонстрировали. Полная модель O1 является значительным улучшением по сравнению с предварительной версией, особенно в задачах математики и завершения кода. И тот факт, что она теперь может обрабатывать изображения, является огромным плюсом.

Шахерезада: Это действительно круто! Мне интересно увидеть, как эта мультимодальная способность будет использоваться в разработке игр или других приложениях. Но как насчет научных вопросов на уровне кандидатской диссертации? Как O1 справился по сравнению с человеческими экспертами?

Думфэйс: Ах, да... это была интересная часть презентации. По всей видимости, ноль один на самом деле более точен, чем человеческий эксперт в ответах на эти сложные научные вопросы! Хотя стоит отметить, что у нас нет человеческих оценок для конкурсного кода и математики.

Шахерезада: Это восхитительно! Это подчеркивает потенциал ИИ превосходить человеческие способности в определенных областях. А что насчет ChatGPT Pro? Что вы можете рассказать нам об этом новом плане?

Думфэйс: Да, OpenAI O1 Pro — это новый план, который включает в себя некоторые дополнительные функции и возможности. Я еще не совсем уверен, что именно включено, но похоже, что это будет более премиальный опыт для пользователей.

Шахерезада: Хорошо, у нас здесь много чего нужно обсудить. Каковы ваши мысли о последствиях этих объявлений? Как вы видите изменения в ландшафте разработки игр с появлением OpenAI O1 и ChatGPT Pro?

Думфэйс: Хм... Я думаю, что еще рано говорить о том, как это все развернется, но мне интересно исследовать возможности. Одна из вещей, которая приходит на ум, это потенциал для более реалистичных взаимодействий с NPC в играх.

Шахерезада: Это отличное замечание! А как насчет влияния на команды разработчиков игр? Вы видите, что эти новые инструменты и возможности меняют их подход к управлению проектами или рабочему процессу?

Думфэйс: Да, я думаю, что определенно стоит рассмотреть, как мы можем интегрировать эти инструменты на базе ИИ в наши рабочие процессы. Возможно, мы увидим больше автоматизации определенных задач или даже новые способы сотрудничества с ИИ.

Шахерезада: Хорошо, это отличное место, чтобы остановиться на данный момент. Нам придется углубиться в последствия OpenAI O1 и ChatGPT Pro в будущих эпизодах. Спасибо, что присоединились ко мне в этом первом взгляде на эти захватывающие анонсы!

Думфэйс: Ладно, мы смотрим на режим O1 Pro, и очевидно, что это более дорогой вариант, но, по всей видимости, он использует еще больше интеллекта и вычислительной мощности, чтобы дать вам самые точные ответы.

Шахерезада: Верно, Думфэйс. И что мне интересно, так это то, что они сравнивают это с полной моделью O1, которая уже хорошо справлялась с вопросами науки на уровне PhD и математическими конкурсами. Они получили восемьдесят пять в математике и семьдесят девять в научных вопросах, что впечатляет.

Думфэйс: Да, и они также провели этот тест производительности "худший из четырех", где модель пытается ответить на каждый вопрос четыре раза и считает его решенным только в том случае, если все четыре попытки верны. И даже с таким высоким стандартом модель по-прежнему показывает стабильные хорошие результаты.

Шахерезада: Именно. Я думаю, что OpenAI пытается показать, что эти эталоны не выбраны выборочно, а являются подлинным представлением возможностей модели. И мне любопытно увидеть, как режим O1 Pro будет с этим сопоставляться.

Думфэйс: Ну, согласно Сэму Альтману и разработчикам, полная модель O1 не только работает быстрее, но и дает более точные ответы. Они даже провели демонстрацию, где попросили модель перечислить римских императоров второго века, включая их даты и достижения, и модель справилась с этим.

Шахерезада: Это впечатляет. И мне нравится, что они проводят такие живые демонстрации. Это показывает, что OpenAI привержена прозрачности и демонстрации возможностей своих моделей.

Думфэйс: Да, а теперь они переходят к тестированию режима O1 Про. Мне интересно увидеть, как он будет сравниваться с полной моделью O1.

Думфэйс: Я все еще поражен тем, как хорошо ноль один справился с этой задачей по угадыванию белка. Удивительно видеть, как он решает такие сложные проблемы.

Шахерезада: Да, и что действительно впечатлило меня, так это его динамический процесс мышления. Ему потребовалась минута, чтобы решить проблему, но когда оно это сделало, то справилось правильно. Этот уровень интеллекта действительно замечателен.

Думфэйс: Именно! И я думаю, что эта демонстрация показывает, насколько далеко мы продвинулись в плане возможностей ИИ. Но теперь давайте поговорим о новой подписке Chat GPT Pro. Двести долларов в месяц — это довольно высокая цена.

Шахерезада: Да, это определенно не для слабонервных. Неограниченный доступ ко всему звучит здорово, но мне интересно, что, по твоему мнению, оправдывает такую высокую цену?

Думфэйс: Ну, судя по тому, что я понимаю, вы получаете все обычные функции плюс неограниченный доступ к O1, O1 мини, GPT-40, голосовому режиму и O1 Про режиму. Это много вычислительной мощности для довольно сложных вопросов.

Шахерезада: Да, но дело не только в функциях – дело также в стоимости. Я имею в виду, что двести долларов – это значительная инвестиция, особенно если вы не уверены, оправдает ли она себя в долгосрочной перспективе.

Думфэйс: Это правда. И что меня действительно беспокоит, так это то, что нет возможности платить по мере использования через API, как это традиционно делает OpenAI. Здесь либо всё, либо ничего с этой моделью подписки.

Шахерезада: Именно! И я думаю, что это важное соображение для разработчиков и компаний, которые могут быть заинтересованы в использовании этих моделей ИИ, но не могут оправдать стоимость полной подписки.

Думфэйс: Да, это определенно стоит обдумать. Но, по крайней мере, у нас будут некоторые коллеги-ютуберы, которые протестируют это первыми, прежде чем принимать какие-либо решения.

Думфэйс: Я много думал о ценах на эти инструменты ИИ, и не уверен, оправданы ли двести долларов в месяц за неограниченный доступ. Я имею в виду, что это беспрецедентно в области ИИ прямо сейчас, но я думаю, что модели с открытым исходным кодом скоро догонят.

Шахерезада: Это отличное замечание, Думфэйс. И что действительно заставило меня задуматься об этом, так это когда я увидела, как Мэтью Берман тестирует Chat GPT Pro на своем канале. У него есть неограниченный доступ к нулевому профессиональному режиму, и это как иметь ключи от королевства.

Думфэйс: Именно! И это заставляет меня задуматься - что мешает людям делиться аккаунтами? Я имею в виду, пятьдесят долларов в месяц гораздо более привлекательно для некоторых людей, у которых есть друзья в области ИИ и которые готовы разделить план. Это противоречит условиям обслуживания?

Шахерезада: Это хороший вопрос. Но даже если это противоречит условиям обслуживания, я думаю, что многие люди будут пытаться найти способы обойти это. И я не уверена, стоит ли это рисков для компании. Я имею в виду, двести долларов в месяц — это много денег, но действительно ли искусственный интеллект стоит столько?

Думфэйс: Ну, я думаю, что определенно есть люди, которые будут использовать режим O1 про достаточно, чтобы оправдать стоимость. Но для меня лично, я не думаю, что это стоит того. И мне интересно услышать мнение наших слушателей - считаете ли вы, что двести долларов в месяц оправданы?

Думфэйс: Мне любопытно увидеть, как эта новая модель будет выдерживать проверку. Создатель, вероятно, подвергнет её строгим испытаниям.

Шахерезада: Да, и мы определенно будем более внимательно смотреть его видео, чтобы решить, стоит ли инвестировать в это для нашего канала. Двести долларов в месяц — это довольно высокая цена, но я провела некоторые живые тесты на своем сервере Discord, просто чтобы понять, как это работает.

Думфэйс: Это хороший момент. Итак, давайте погрузимся в ваши первые впечатления от полной модели O1. Вы хотели протестировать её мультимодальные возможности, верно?

Шахерезада: Именно. Я отправила ему изображение "Где Уолдо" и спросила, чтобы он нашел его. И знаешь что? Он справился с этим всего за семнадцать секунд! Он посмотрел на толпу у берега и точно указал, где стоял Уолдо.

Думфэйс: Это впечатляет. Но вы рассматривали возможность того, что оно могло видеть эту сцену раньше, возможно, в своих обучающих данных?

Шахерезада: Да, я тоже об этом думала. Поэтому я попросила его указать некоторые ключевые элементы или структуры рядом с Уолдо, и он дал мне довольно подробное описание пляжной сцены.

Думфэйс: Это здорово. А как показала себя обычная модель 4.0 в сравнении?

Шахерезада: К сожалению, не так хорошо. Он сказал нам, где мы могли бы найти Уолдо, но не дал нам точное местоположение, как это сделал полный модель O1.

Думфэйс: Итак, похоже, что полная модель O1 обладает впечатляющими возможностями распознавания изображений. Мне любопытно увидеть, как она справится с другими задачами.

Шахерезада: Да, давайте продолжим! Далее, я попросила его преобразовать смешное фото меня в искусство ACI, и... ну, скажем так, это была интересная попытка. Но потом я попросила его сделать что-то проще, например, нарисовать Шрека, и он попробовал.

Думфэйс: Я с нетерпением жду, как это получилось!

Думфэйс: Я играл с некоторыми из этих новых моделей ИИ, и должен сказать, они становятся довольно впечатляющими. Я имею в виду, мы еще не говорим о создании целых игр с нуля, но они определенно могут помочь с конкретными задачами.

Шахерезада: Верно, Думфэйс. И интересно видеть, как они используются в разных областях. Я смотрела на некоторые более креативные приложения, такие как генерация музыки или искусства. Но то, о чем ты говоришь, тоже действительно круто - использование ИИ для помощи в кодировании и разработке.

Думфэйс: Именно! И дело не только в копировании кода. Эта модель, с которой я работал, на самом деле понимала концепцию HTMX и могла генерировать функциональный код для нее. Я имею в виду, что она не работала идеально, но много чего сделала правильно с первого раза.

Шахерезада: Вот что мне нравится в этих моделях - они не просто повторяют существующий код, они действительно учатся на нем и применяют эти знания новыми способами. И похоже, что эта модель смогла выполнить довольно сложные задачи, такие как анимация выборов и вращение этих маленьких квадратов.

Думфэйс: Да, это было действительно здорово видеть. И я думаю, что еще более впечатляющим является то, что ему не понадобилось никакого дополнительного руководства или обратной связи от меня. Оно просто поняло, что нужно сделать, и сделало это. Конечно, у этих моделей все еще есть ограничения, но они определенно становятся ближе к тому, чтобы быть полезными инструментами для разработчиков.

Шахерезада: Абсолютно. И я думаю, что именно в этом заключается настоящая ценность - не в замене человеческих разработчиков, а в увеличении их возможностей и повышении их эффективности. Беря на себя некоторые более рутинные или повторяющиеся задачи, искусственный интеллект может освободить разработчиков, чтобы они могли сосредоточиться на творческих аспектах разработки игр.

Думфэйс: Именно! И дело не только в экономии времени. С этими моделями мы наблюдаем новый уровень креативности и инноваций, который, возможно, не был бы возможен в противном случае. Я имею в виду, кто знает, какие удивительные вещи мы сможем создать, когда ИИ будет интегрирован в процесс разработки?

Шахерезада: Это отличное замечание, Думфэйс. И это захватывающе думать о том, куда эта технология приведет нас в будущем.

Думфэйс: Знаешь, я поиграл с этой языковой моделью, и должен сказать, что впечатлён её способностью генерировать код. Я попросил её создать бесконечную игру на бегу с использованием HTML и CSS, и она справилась на отлично.

Шахерезада: Это удивительно! И графика действительно хороша. Градиент вверху для неба — отличное решение. Но что меня поразило, так это то, как быстро он смог воспроизвести дизайн. Кажется, у него есть интуиция в разработке игр.

Думфэйс: Да, и ему даже не понадобилось много руководства с нашей стороны. Мы просто задали ему несколько основных параметров, и оно с этим справилось. Мне любопытно увидеть, как оно справится с более сложными задачами. Например, может ли оно преобразовать 2D игру в 3D, используя ява скрипт?

Шахерезада: Это отличный тест! И похоже, что он тоже смог это сделать. Хотя игра сейчас немного сломана. Но все равно, впечатляюще.

Думфэйс: Да, я понимаю, о чем ты. Это как будто у него есть этот природный талант к программированию, но иногда ему нужно немного руководства, чтобы все работало гладко. Кстати, кто-то в чате прислал нам забавное изображение языковой модели с драматичным лицом.

Шахерезада: О, это смешно! Мне нравится, насколько это выразительно. И ты прав, оно действительно хорошо справилось с распознаванием персонажа и реагированием на него.

Думфэйс: Ладно, давайте вернемся к тестированию его пределов. Я думал предложить ему несколько логических задач из коллекции Мэтью Бермана. У него есть несколько сложных задач, которые специально разработаны для тестирования таких языковых моделей, как эта.

Шахерезада: Звучит как отличная идея! Давайте посмотрим, как она справится с этими вызовами. И кто знает, возможно, мы узнаем что-то новое о её возможностях и ограничениях.

Думфэйс: Мне нравится, как этот LLM просто справился с первой задачей о мраморе в стакане. Это отличный пример того, как эти модели могут понимать пространственное мышление и физические законы.

Шахерезада: Да, это впечатляет. И что еще более интересно, так это то, что O1 Preview также прошел этот тест. Но мы к этому вернемся позже. Давайте посмотрим, как он справится с проблемой Северного полюса, которая была одной из немногих, где O1 Preview провалился.

Думфэйс: Хорошо, давайте послушаем его ответ... Хм, он пытается проложить маршрут по поверхности Земли, но, я думаю, он застревает в деталях. Он даже не учитывает тот факт, что идти в любом направлении от Северного полюса — это прямо на юг.

Шахерезада: Именно! И вот где большинство больших языковых моделей ошибаются с этой проблемой. Они зацикливаются на попытках визуализировать путешествие и забывают о фундаментальном свойстве Земли быть сферой. Мне любопытно, что ты думаешь, что она скажет?

Думфэйс: Ну, я не уверен... но у меня есть ощущение, что это попытается дать нам какое-то сложное объяснение, связанное с широтой и долготой.

Шахерезада: О, я на это надеюсь! Это был бы отличный пример того, как эти модели иногда могут усложнять вещи.

Думфэйс: Мне нравится, как эта проблема разбивает концепцию кругов широты и их окружностей. Это отличный пример того, как ИИ может помочь нам понять сложные идеи.

Шахерезада: Да, и это увлекательно видеть, как O1 пришел к правильному ответу в два пи километра. То, как ИИ прошел один километр на юг и оказался на окружности с длиной ровно в два раза больше пи, поражает воображение.

Думфэйс: Я знаю, правда? Это как будто наши мозги настроены думать в терминах евклидовой геометрии, но эта проблема показывает нам, что есть и другие способы подхода к пространственному мышлению. И дело не только в самой математике, но и в том, как мы визуализируем и понимаем мир вокруг нас.

Шахерезада: Именно! И я думаю, что именно здесь ИИ может действительно помочь нам, предоставляя новые перспективы и идеи по сложным проблемам. Это почти как иметь суперсилу, которая позволяет нам видеть вещи с разных углов.

Думфэйс: Говоря об этом, давайте попробуем решить несколько гиперспецифических задач. Как насчет того, чтобы погрузиться во что-то вроде... вы слышали о "Проблеме голубых глаз"?

Шахерезада: О, боже, я думаю, я уже видела это раньше! Это классический пример самоссылочного парадокса, верно? Где группа людей с голубыми глазами пытается выяснить, у кого голубые глаза, основываясь на определенных правилах...

Думфэйс: Вот это! И это отличный пример того, как ИИ может помочь нам анализировать и решать сложные проблемы, такие как эта. Мы можем использовать такие методы, как теория графов и логика, чтобы разбить проблему на части и найти решение.

Шахерезада: Да, и я думаю, что это также отличный пример того, как ИИ может помочь нам понять человеческую психологию и поведение. Потому что в конечном итоге эта проблема действительно заключается в понимании того, как люди взаимодействуют друг с другом и принимают решения на основе неполной информации.

Думфэйс: Именно! Давайте погрузимся и посмотрим, сможем ли мы вместе решить Проблему Голубых Глаз. Кто знает, какие идеи мы получим на этом пути?

Думфэйс: Мне нравится эта технология распознавания изображений от OpenAI. Они действительно раздвигают границы возможного с помощью ИИ.

Шахерезада: Да, удивительно видеть, насколько это точно! Я имею в виду, они смогли определить этот двигатель как Volkswagen TDI двухтысячных просто взглянув на фото. Это серьезная технология.

Думфэйс: И то, как он продумал возможности... "Мед-эра две тысячи" Volkswagen TDI"... Мне нравится, как он пытается быть точным, даже если у него это не совсем получается.

Шахерезада: Да, это так похоже на человеческое! Но серьезно, это отличный пример того, как ИИ может учиться на данных и делать обоснованные предположения. И тот факт, что он смог сузить местоположение в GeoGuessr до конкретной страны... это впечатляет.

Думфэйс: Я знаю, правда? Это как иметь суперумного спутника в путешествии, который может подсказать, где ты находишься. Хотя, я думаю, это было не идеально – Уругвай вместо Аргентины!

Шахерезада: Именно! Но все же, это было довольно хорошее предположение. И тот факт, что оно знало, что находится в GeoGuessr, и уловило все эти культурные подсказки... это какое-то продвинутое понимание языка и контекста.

Думфэйс: Да, это определенно меняет правила игры в области распознавания изображений. Мне интересно увидеть, куда OpenAI направит эту технологию дальше.

Шахерезада: Я тоже! И кстати, ты слышал о плане на двести долларов, который они одобрили? Это серьезные инвестиции в исследования ИИ!

Думфэйс: Да, я понимаю, что ты имеешь в виду. Но послушай, если это приведет к прорывам, как этот... возможно, в конце концов это того стоит.

Шахерезада: Абсолютно! Ладно, это всё на сегодня. Дайте нам знать ваше мнение об этой удивительной технологии распознавания изображений от OpenAI!

Думфэйс: И не забудьте настроиться в следующий раз, когда мы погрузимся в большее количество ИИ удовольствия... возможно, с парой дополнительных рождественских подарков от OpenAI?

Думфэйс: Итак, Шахерезада, что ты думаешь об этой новой модели O1 от OpenAI? Похоже, они сделали некоторые значительные улучшения.

Шахерезада: Да, меня интересуют мультимодальные возможности и лучшее следование инструкциям. Но я должна признать, что немного скептически настроена по поводу полной зависимости от бенчмарков. Нам нужно увидеть, как это будет работать в реальных сценариях.

Думфэйс: Абсолютно. И именно это мы собираемся сделать здесь. Давайте протестируем эту новую модель на некоторых задачах Advent of Code и посмотрим, сможет ли она легко их решить. У меня есть несколько сохраненных, так что давайте попробуем.

Шахерезада: Звучит как план! Но прежде чем мы начнем, я хочу подчеркнуть важность понимания того, как работают модели ИИ и на что они способны. Мы не можем просто полагаться на эталонные показатели или маркетинговые заявления; нам нужно увидеть реальные результаты своими глазами.

Думфэйс: Это так верно. И дело не только в тестировании возможностей модели, но и в учете потенциального влияния на наши процессы разработки и рабочие процессы. Я имею в виду, если эта новая модель O1 так же мощна, как они утверждают, она может революционизировать наш подход к программированию и решению проблем.

Шахерезада: Именно! И вот почему мне нравится, как Альтман подчеркивает важность учета отзывов пользователей и итерации модели на основе реальных потребностей. Это показывает, что OpenAI стремится создать инструмент, который действительно служит своим пользователям, а не просто выпускает эффектную новую функцию.

Думфэйс: Да, всё дело в балансе между инновациями и практичностью. Мы не хотим слишком увлекаться ажиотажем вокруг моделей ИИ, подобных этой; нам нужно оставаться на земле и оценивать их на основе их фактической производительности и потенциального влияния на нашу работу.

Думфэйс: Я немного скептически настроен по поводу этих бенчмарков, если честно. Они, похоже, потеряли некоторый смысл, поскольку модели становятся все лучше и лучше.

Шахерезада: Да, я понимаю, о чем ты. Это как будто мы гоняемся за цифрами, не понимая, что они значат на практике.

Думфэйс: Именно! А потом есть этот Про режим, который O1 только что запустил. Двести долларов в месяц? Это дорого, даже для меня. Я привык платить около двадцати долларов в месяц за свою текущую настройку.

Шахерезада: Ух ты, это дорого! Но я понимаю, почему они хотят угодить своим продвинутым пользователям. Это как будто они признают, что не всем нужны одинаковые уровни ресурсов и поддержки.

Думфэйс: Да, и интересно, что их называют "пользователями с высоким уровнем". Это подразумевает определенный уровень экспертизы или сложности в их паттернах использования. Честно говоря, я не уверен, что могу квалифицироваться как пользователь с высоким уровнем!

Шахерезада: Ну, ты определенно эксперт в своем деле, Думфэйс! Но серьезно, я думаю, что этот Про режим больше ориентирован на исследователей и продвинутых программистов, которым нужна дополнительная поддержка.

Думфэйс: Это имеет смысл. И не так, чтобы они пытались продать это обычным пользователям или что-то в этом роде. Хотя... если некоторые отчеты вернутся с информацией о том, что это стоит инвестиций, мне, возможно, придется пересмотреть свое мнение!

Шахерезада: Да, двести долларов определенно могут принести много ценности в компании! Но пока, я думаю, нам просто придется подождать и посмотреть, как это получится.

Думфэйс: И интересно, что O1 также говорит о том, чтобы сделать свои ответы быстрее и умнее. Больше не нужно ждать десять секунд, чтобы получить ответ!

Шахерезада: Именно! Мгновенное удовлетворение всегда хорошо, верно?

Думфэйс: Я играл с предварительной версией O1, и должен сказать, проблема со скоростью была для меня серьезным разочарованием. На даже самые простые вопросы отвечало бесконечно долго.

Шахерезада: Да, я могу представить, что это было бы разочаровывающе. Но похоже, что они сделали некоторые значительные улучшения. Какие ошибки вы видели в предварительном просмотре O1?

Думфэйс: Ну, он делал серьезные ошибки на тридцать четыре процента реже, чем раньше, и думает примерно на пятьдесят процентов быстрее. Это огромное улучшение, на мой взгляд.

Шахерезада: Вау, это впечатляет. Мне любопытно узнать больше о функции мультимодального ввода, которую они добавили. Можешь рассказать мне больше о том, что это значит?

Думфэйс: Да, теперь мы можем использовать изображения в качестве подсказок для O1. Это меняет правила игры для повседневных случаев. Я имею в виду, подумайте об этом - возможность задавать модели вопросы и получать визуальные ответы - это огромно.

Шахерезада: Это звучит потрясающе. И я уверена, что наши слушатели с нетерпением ждут демонстрации этого в действии. Можешь показать нам пример того, как это работает?

Думфэйс: Да, позволь мне просто найти изображение... Хорошо, вот картинка древнеримского императора. И если я попрошу O1 определить, кто это, он должен быть в состоянии ответить правильным ответом.

Шахерезада: Это звучит как отличный пример. Задавай вопрос О1.

Думфэйс: Ладно, я спрашиваю О1... "Кто этот римский император?"

Думфэйс: Ладно, я смотрел это видео о мультимодальных подсказках, и должен сказать, что это довольно здорово, что они используют O1 для этого. А теперь они демонстрируют Про режим, который, как предполагается, отлично подходит для сложных математических и научных задач.

Шахерезада: Да, меня интригует идея более мощной версии O1. Тот факт, что он может думать до трех минут над сложными задачами, довольно впечатляет. У меня есть некоторый опыт работы с этими моделями, но я никогда не видела ничего подобного раньше.

Думфэйс: Точно! А ты заметил, как отличается интерфейс в профессиональном режиме? У них есть эта временная шкала и окно, которое показывает прогресс мыслительного процесса модели. Это довольно интересные вещи.

Шахерезада: Да, мне интересно увидеть, как люди отреагируют на этот новый интерфейс. И здорово, что они делают его доступным через API. OpenAI всегда имела хорошую документацию и инструменты для разработчиков, так что я с нетерпением жду возможности попробовать O1, используя API.

Думфэйс: То же самое! Я думаю, это может стать переломным моментом для разработчиков, которые хотят интегрировать ИИ в свои проекты. И с новыми функциями, которые они добавляют, такими как структурированные выходные данные и вызов функций, это станет еще более мощным.

Шахерезада: Абсолютно. Я с нетерпением жду, какие приложения люди создадут, используя O1 через API. Всегда волнительно видеть, как разработчики могут расширять границы возможного с помощью технологий ИИ.

Думфэйс: Я действительно взволнован этой новой моделью, она имеет потенциал открыть совершенно новую грань агентных вещей, которые разработчики могут создавать. Я думаю, что это изменит правила игры.

Шахерезада: Да, это довольно круто! Структурированные результаты тоже впечатляют - мы получаем не только текст, но и изображения, и другие типы данных. И они упомянули, что в течение следующих двенадцати дней выпустят больше контента, ориентированного на разработчиков, так что я с нетерпением жду, что они запланировали.

Думфэйс: Абсолютно, я думаю, что это здорово, что они придают такое значение вовлечению разработчиков. Хорошо, давайте попробуем протестировать эту модель, используя Advent of Code. Я сохранил несколько задач здесь... Ах, да! Позвольте мне просто скопировать текст и создать для него подсказку.

Шахерезада: Звучит хорошо! И нам также стоит попробовать вставить изображение, чтобы посмотреть, как модель с этим справится. Знаешь, чтобы немного разнообразить.

Думфэйс: Точно! Давайте возьмем это описание проблемы и вставим его в теги Advent XML... Хорошо, теперь я создам файл под названием X mass dot text с входными данными. А затем мы сможем запустить объяснение кода скрипта.

Шахерезада: Ах, здорово! Ты видишь какие-нибудь изменения в скорости здесь? Это довольно быстро, не так ли?

Думфэйс: Да, всего пару секунд... Хорошо, нам дают инструкции создать файл с именем X mass dot text. А затем я сохраню объяснение кода скрипта.

Шахерезада: Поняла! Теперь давайте посмотрим, сможем ли мы захватить код и создать текстовый файл из него...

Думфэйс: Ах, да! Вот и мы... Позвольте мне снова скопировать этот код... Хорошо, теперь я думаю, что у нас есть всё, что нам нужно, чтобы продвинуться вперёд с этой проблемой.

Думфэйс: Ладно, я думаю, что мы готовы запустить наш код на Python для второй части головоломки Advent of Code. Давайте попробуем его запустить и посмотрим, получим ли мы правильный ответ.

Шахерезада: Да, я просто возьму этот текст из предыдущего запроса и скопирую его в новый файл. Хорошо, давайте вставим вторую часть сюда... тот же ввод, что и раньше. Попробуем.

Думфэйс: Хорошо, мы ищем X, образованный двумя диагоналями, это Бэй, написанный массой или Сэм, перекрывающийся с центром. Это довольно интересный узор. Давайте посмотрим, сможет ли наш код с этим справиться.

Шахерезада: Да, я просто вставлю вторую часть головоломки и запущу её. Хорошо, мы получаем тысяча восемьсот восемьдесят шесть... это правильный ответ! Ты получил одну золотую звезду за завершение четвёртого дня.

Думфэйс: Спасибо, я полагаю, я этого и ожидал от всех. Теперь я хочу попробовать что-то новое. Давайте посмотрим, сможем ли мы использовать изображения для распознавания текста и решения головоломки. Я собираюсь сохранить этот скриншот дерева Advent of Code... хорошо, так что позвольте мне скопировать его и вернуться к нашему предыдущему файлу.

Шахерезада: Хорошо, так ты пытаешься сделать скриншот дерева головоломки, а затем вставить его в наш код? Это интересный подход. Давай посмотрим, сможем ли мы это сделать.

Думфэйс: Да, я просто хочу посмотреть, сможем ли мы использовать оптическое распознавание символов, чтобы прочитать текст с изображения и решить головоломку таким образом. Это будет интересный эксперимент, по крайней мере!

Думфэйс: Ладно, я пытаюсь понять, как работает этот код. Это файл, и большинство текстов пишут код для решения проблемы, пожалуйста.

Шахерезада: Хорошо, давайте посмотрим, займет ли это больше времени. Итак, она думает, о, это было всего лишь пару секунд снова перед тем, как мы это прочитаем, давайте возьмем ввод.

Думфэйс: Хорошо, давайте скопируем это. Давайте перейдем сюда. Эм, давайте просто заменим это, верно?

Шахерезада: Если мы вернемся сейчас, вы можете немного увеличить, эээ, ключевые моменты подхода. Итак, мы собираемся использовать некоторые регулярные выражения, чтобы сопоставить действительные преобразования X и I в целые числа.

Думфэйс: Выведите окончательную сумму. Шаблон гарантирует... Хорошо, у нас есть хорошее объяснение, верно? Как это работает. Refind все возвращает список из двух шаров.

Шахерезада: Мы итеративно сопоставляем чтения, передавая их в кресла в конце, выводим сумму. Хорошо, давайте убедимся, что X должен находиться в той же директории.

Думфэйс: Я думаю, мы просто сделаем код три точка ПИ на основе кода и подаем ли мы это? Да, подаем. И давайте сделаем три точка ПИ, и мы получаем это большое число, восемнадцать миллионов сто восемьдесят восемь тысяч девяносто два семь восемь семь.

Шахерезада: Это будет сумма, если вы сложите все результаты умножений. Давайте попробуем это. Это правильный ответ. Вы на одну золотую звезду ближе.

Думфэйс: Продолжим ко второй части. Итак, это выглядит хорошо. Эм, снова хочу сделать скриншот. Давайте сделаем скриншот второй части.

Шахерезада: Хорошо, давайте скопируем это. Давайте сделаем то же самое, что и с первой частью. Давайте просто начнем новый чат здесь, и это будет вторая часть. Так что этот же ввод снова, я собираюсь попробовать прочитать это, используя изображение, и, честно говоря, я думаю, что у нас все будет в порядке.

Думфэйс: Итак, давайте просто сделаем код три, два точка ПИ, верно? Итак, теперь это заняло сколько секунд снова, всего несколько секунд. Так что это довольно быстро.

Шахерезада: Эм, как и прежде, нам нужны входные данные для Рождества, инструкции по парсингу, регулярные выражения. Итак, мы собираемся использовать этот шаблон. Хорошо, эм, я хочу скопировать код. Давайте прочитаем здесь. Да. Очень хорошее объяснение. Мне это нравится. Это очень структурировано.

Думфэйс: Итак, мы раньше находили это и использовали этот рег X. Ладно, эээ, давайте вставим это. У нас есть файл Xmas dot text?

Думфэйс: Я рад, что мы проходим эти тесты, но должен сказать, что ожидал, что модель будет хорошо справляться с задачами в стиле lead code. Неудивительно, что она их решила правильно.

Шахерезада: Да, эти модели действительно становятся очень хорошими в таких задачах. Но интересно, как они справляются с более сложными входными данными, такими как изображения. Ты пробовал тестировать это с задачами распознавания изображений?

Думфэйс: На самом деле, я это сделал! И, если честно, это было немного удачно и неудачно. Я думаю, что допустил ошибку при копировании полного ответа, но когда я протестировал это снова, казалось, что он справился правильно.

Шахерезада: Ах, это здорово! Всегда приятно видеть, как эти модели справляются с различными типами входных данных. И приятно, что вы экспериментируете с Advent of Code - это отличный способ протестировать эти модели в реальных условиях.

Думфэйс: Да, я с нетерпением жду возможности исследовать больше версий API и увидеть, какие агентные рабочие процессы мы можем создать. Но сейчас давайте перейдем к другим новостям... Извините, прошу прощения за это.

Шахерезада: Не переживай! У нас сегодня много тем для обсуждения. Итак, ты видел какие-нибудь из недавних моделей текст-в-видео, которые вышли? Они просто поражают меня.

Думфэйс: Да, я следил за некоторыми из них. И похоже, что Google DeepMind только что выпустила Genie 2, которая является полностью играбельной видеоигрой без базового движка. Это безумие!

Шахерезада: Знаешь, правда? Удивительно видеть, на что способны эти модели. Давай углубимся в детали и исследуем некоторые другие модели текст-в-видео, которые были выпущены недавно...

Думфэйс: Я в полном восторге от этой модели мира Genie 2 foundation. Это как что-то прямо из научно-фантастического фильма. Тот факт, что она может генерировать бесконечное разнообразие играбельных трехмерных окружений из одного изображения-подсказки, просто поражает воображение.

Шахерезада: И что еще более впечатляюще, так это то, что дело не только в создании окружений, но и в создании интерактивных опытов. Я имею в виду, подумайте об этом - этой моделью могут управлять как люди, так и агенты ИИ, используя клавиатуру и мышь. Это открывает совершенно новый мир возможностей для обучения и оценки воплощенных агентов.

Думфэйс: Именно! И что мне действительно нравится, так это то, что это не единственная компания, которая недавно выпустила что-то подобное. World Labs от Фей Фей Ли и команды только что выпустила аналогичную модель, что довольно захватывающе.

Шахерезада: Да, здорово видеть, как быстро развиваются технологии ИИ и разработка игр. И я должна сказать, что некоторые из этих демонстраций абсолютно невероятны. Уровень детализации и реализма потрясающий.

Думфэйс: Я знаю, правда? Как этот, где показывают разные версии одной и той же игры, реагирующие на разные управления. Это как смотреть, как настоящий робот идет через лес или пустыню. И физический движок настолько продвинутый, что он даже может понять, как реагировать, когда лодка заходит на песок.

Шахерезада: Вот что мне нравится в этой технологии - это не только создание красивой графики, но и моделирование поведения и взаимодействий в реальном мире. Будет увлекательно увидеть, куда это нас приведет в плане разработки игр и не только.

Думфэйс: Абсолютно. И говоря об этом, мне любопытно узнать больше о потенциальных приложениях Genie 2. Вы думаете, мы увидим его использование в играх, образовании или, возможно, даже в других отраслях, таких как архитектура или градостроительство?

Шахерезада: Это отличный вопрос! Я думаю, что мы определенно увидим его использование в играх и образовании, но также потенциально в таких областях, как симуляционное обучение для таких отраслей, как здравоохранение или авиация. Возможности действительно безграничны.

Думфэйс: Ну, одно можно сказать точно - это будущее видеоигр, и это захватывающе быть частью этого.

Думфэйс: Знаешь, я думал о текущем состоянии ИИ в разработке игр, и должен сказать, это довольно захватывающе. Но в то же время, это все еще немного сыро.

Шахерезада: Да, я согласна. Это как будто мы видим проблески того, что может быть возможным, но это еще не совсем так. Возьмем, к примеру, Genie 2 с его функцией долгосрочной памяти - это как будто они пытаются воссоздать тот бесшовный опыт, который мы видели в Sora.

Думфэйс: Точно! А теперь у нас есть игровые движки и системы ИИ, которые могут предсказывать и запоминать мир в реальном времени, как мы видим в тех видео. Удивительно думать о том, как далеко мы продвинулись.

Шахерезада: Но это также напоминание о том, сколько работы еще предстоит сделать. Я имею в виду, эти демонстрации впечатляют, но они еще не готовы к широкому использованию. И это заставляет меня задуматься - когда мы увидим, что ИИ в играх станет чем-то большим, чем просто новинка?

Думфэйс: Ну, я думаю, что это займет некоторое время, но прогресс, который мы видим, неоспорим. И кто знает, может быть, через шесть месяцев или год мы оглянемся на это и скажем: "О да, это было худшее, что когда-либо было".

Шахерезада: Да, возможно! Но серьезно, я думаю, что интересно то, как искусственный интеллект меняет наш подход к разработке игр. Мы больше не говорим только о рендеринге трехмерной графики или физических движках - теперь нам нужно учитывать роль искусственного интеллекта в создании погружающих впечатлений.

Думфэйс: Абсолютно. И именно поэтому мне интересно увидеть, куда нас приведет эта технология. Дело не только в том, чтобы сделать игры более реалистичными, но и в создании новых видов взаимодействий и опыта, которые мы даже не можем себе представить.

Думфэйс: Мне нравятся эти примеры игр и анимаций, созданных с помощью ИИ. Удивительно видеть, как далеко мы продвинулись в области предсказательных движков и диффузионных моделей.

Шахерезада: Да, это невероятно! И что действительно выделяется для меня, так это уровень реализма, которого они достигают без необходимости в традиционном игровом движке. Это как будто ИИ учится на примерах и генерирует собственный контент на лету.

Думфэйс: Именно! И я думаю, что это имеет огромные последствия для индустрии разработки игр в целом. Больше не нужно иметь команду опытных разработчиков и художников, чтобы создать игру. Вы можете просто использовать эти предсказательные движки и позволить им выполнять основную работу.

Шахерезада: Верно, и это также открывает новые возможности для инди-разработчиков, которые, возможно, не имели ресурсов или экспертизы для создания игры ранее. Теперь они могут сосредоточиться на творческих аспектах разработки игр, не углубляясь в технические детали.

Думфэйс: Я об этом думал, и считаю, что одно из самых интересных применений контента, сгенерированного ИИ, находится в области прототипирования игр. Вы могли бы использовать эти предсказательные движки, чтобы быстро создавать разные версии игры, тестировать их с игроками и дорабатывать свой дизайн на основе отзывов.

Шахерезада: Ах, это отличная мысль! И это также подчеркивает важность человеческой интуиции и креативности в процессе разработки игр. Даже с контентом, созданным ИИ, все равно нужен кто-то, кто будет направлять творческое направление и принимать решения о том, что работает, а что нет.

Думфэйс: Абсолютно. Я думаю, что мы наблюдаем новую эру сотрудничества между людьми и машинами в разработке игр, где ИИ дополняет наши способности, а не заменяет их.

Шахерезада: Это отличный способ выразить это, Думфэйс. И мне интересно увидеть, как эта технология продолжает развиваться и формировать будущее разработки игр.

Думфэйс: Я в полном восторге от этой демонстрации освещения. Это как что-то из игры Зельда. Огонь выглядит так реалистично, и он освещает всю сцену. А что еще более впечатляюще, так это то, что вы можете вставлять реальные изображения в модель и начинать играть с их помощью.

Шахерезада: Да, я понимаю, о чем ты! Удивительно видеть, как далеко продвинулся искусственный интеллект в моделировании мира. Этот демонстрационный показ показывает, как быстро можно перейти от концепт-арта к играбельной игре. Мне нравится, что они используют реальные изображения в качестве отправной точки - это делает весь процесс гораздо более осязаемым.

Думфэйс: Именно! И что меня действительно поражает, так это то, что вы можете увидеть все разные элементы концепт-арта, оживающие в предсказанной модели. Это как магия, но это не так. Это просто ИИ делает свое дело.

Шахерезада: Да, я знаю, правда? Это потрясающе. И что мне действительно интересно в этой демонстрации, так это то, что она показывает, как ИИ может быть использован для преодоления разрыва между концепт-артом и фактическим игровым процессом. Это уже не просто вопрос набросков идей на бумаге - вы можете на самом деле видеть, как они оживают в реальном времени.

Думфэйс: Верно! И это не только Google делает. World Labs работает над аналогичными технологиями, используя ИИ для генерации трехмерных миров из одиночных изображений. Я видел некоторые из их ранних результатов, и они довольно впечатляющие.

Шахерезада: Да, мне бы хотелось увидеть больше этого. Всегда интересно наблюдать, как разные компании подходят к этой технологии. И что мне действительно нравится в подходе World Labs, так это то, что они предоставляют играбельные демо прямо в браузере. Это совершенно новый уровень доступности.

Думфэйс: Полностью согласен! И дело не только в самой технологии - дело в том, как она может изменить способ, которым мы создаем и воспринимаем игры. Такой вид моделирования мира с использованием искусственного интеллекта может революционизировать индустрию, облегчая разработчикам реализацию своих идей.

Шахерезада: Именно! И я думаю, что именно это больше всего меня вдохновляет в этой области исследований. Дело не только в технологиях - важно, как они могут повлиять на людей и сообщества. Как мы можем использовать ИИ, чтобы создать более инклюзивные, более погружающие игровые впечатления? Это вопрос, который стоит исследовать.

Шахерезада: Да, и это имеет действительно классные последствия. Например, поскольку они генерируют всю сцену сразу, вы можете изменять вещи в реальном времени. Например, я могу добавить прожектор или изменить освещение, и всё это идеально отрендерено.

Думфэйс: Именно! И дело не только в изменении отдельных пикселей. Вся сцена обновляется в реальном времени, что создает действительно впечатляющие визуальные эффекты. Как тот пример с картиной, который мы видели ранее - вы могли отойти назад и осмотреть остальную часть улицы, и все это было идеально отображено.

Шахерезада: Уму непостижимо, как далеко зашла эта технология. И мне нравится, как эти демонстрации позволяют нам исследовать эти трехмерные миры таким образом, который действительно погружает. Мы можем оглядываться практически в любом направлении...

Думфэйс: ...и двигаться на несколько футов, прежде чем появится сообщение о выходе за границы. Да, все равно очень круто! Но мне любопытно - вы думали о том, что это значит для разработки игр? Можем ли мы увидеть больше игр, которые используют такие генеративные модели для создания целых миров?

Шахерезада: Абсолютно. И я думаю, что дело не только в визуальных эффектах. Эта технология также может позволить новые типы игрового процесса и взаимодействий. Представьте, что можно манипулировать объектами в трехмерном мире в реальном времени... это открывает всевозможные возможности.

Думфэйс: Да, это действительно захватывающие вещи. Ладно, давайте на время отложим трехмерные миры. Мы поговорим о разговорных ИИ-агентах. И я должен сказать, что самый впечатляющий из известных нам на данный момент — это Advanced Voice от OpenAI...

Думфэйс: Я действительно впечатлён тем, чего достигли одиннадцать Лабс с их разговорным ИИ. Похоже, что они сделали невероятно простым создание и развертывание агентов, которые могут вести естественные беседы.

Шахерезада: Да, демонстрации, которые они предоставили, довольно убедительны. Задержка низкая, а настройка проходит без проблем. Мне нравится, как они делают это доступным для разработчиков всех уровней.

Думфэйс: Именно! И тот факт, что это масштабируемо, является огромным плюсом. Я вижу, как эта технология может быть использована в стольких различных приложениях, от обслуживания клиентов до видеоигр.

Шахерезада: Абсолютно. Идея создания ИИ-агентов, которые могут общаться с пользователями на их родном языке, действительно захватывающая. Это открывает новые возможности для того, как мы взаимодействуем с технологиями.

Думфэйс: И процесс создания этих агентов, похоже, стал гораздо более упорядоченным, чем раньше. Я имею в виду, что они говорят о возможности создать голос или использовать один из своей библиотеки, а затем определить цель и личность агента.

Шахерезада: Да, это действительно здорово. И тот факт, что вы можете интегрировать свой собственный сервер для полного контроля, великолепен. Это дает разработчикам много гибкости в том, как они хотят реализовать эту технологию.

Думфэйс: Я также впечатлён количеством поддерживаемых языков. Тридцать два разных языка — это большое дело, особенно когда речь идёт о обслуживании клиентов и поддержке.

Шахерезада: Определенно. И процесс развертывания тоже кажется действительно простым. Просто скопируйте и вставьте на сайт или используйте их SDK для приложений и сервисов... удивительно, как далеко мы продвинулись в плане доступности разработки ИИ.

Думфэйс: Да, и они не жертвуют безопасностью ради удобства использования. Безопасность уровня предприятия является необходимостью для любого серьезного приложения.

Шахерезада: Именно. Всё дело в нахождении баланса между инновациями и ответственностью. И похоже, что 11 Labs действительно добились успеха со своей платформой разговорного ИИ.

Думфэйс: Итак, Шахерезада, я изучал 11 Labs и их возможности разговорного ИИ. Это действительно впечатляющие вещи.

Шахерезада: Да, я тоже видела некоторые демонстрации этого. Что меня поразило, так это разница между этим и Расширенным голосовым режимом. Ты считаешь, что это значительное различие?

Думфэйс: Ах, да! Насколько я понимаю, Advanced Voice Mode — это модель голоса от начала до конца, в то время как 11 Labs переводит туда и обратно в текст. Это означает, что, вероятно, есть немного больше задержки, но все равно звучит очень хорошо.

Шахерезада: Именно! И это заставило меня задуматься о важности тональности и других голосовых сигналов в разговорном ИИ. Дело не только в словах, которые произносятся, но и в том, как они произносятся.

Думфэйс: Абсолютно. Я думаю, что именно здесь 11 Labs проявляет себя. Они могут извлекать все эти тонкие сигналы из голосов людей и использовать их для создания более естественно звучащих разговоров.

Шахерезада: Да, это действительно впечатляюще. И что еще круче, так это то, что вы можете менять разные LLM в зависимости от вашего конкретного случая использования. Это дает разработчикам много гибкости.

Думфэйс: Именно! И говоря о классных функциях, вы слышали о продуктах Google Notebook LM? Одиннадцать Лабс по сути выпустили копию этого.

Шахерезада: Да, я тоже это видела. Это как если бы они взяли вирусный продукт и сказали: "Эй, мы тоже можем это сделать!" Но серьезно, это действительно интересная функция. Возможность генерировать умные персональные подкасты из любого текстового контента — это огромная вещь.

Думфэйс: Полностью согласен! И мне нравится, как они это демонстрируют с Золушкой и Принцем. Это как совершенно новый способ восприятия историй.

Шахерезада: Да, кто бы не хотел услышать Золушку в формате подкаста? Но серьезно, удивительно, что ИИ может делать в наши дни.

Думфэйс: Ладно, давайте погрузимся в сегодняшнюю тему, атомная теория. Одна из моих любимых! С чего мы начнем?

Шахерезада: Я думаю, что это увлекательно, как далеко мы продвинулись в понимании строительных блоков материи. Давайте поговорим о ранних пионерах, которые заложили основы нашего нынешнего понимания.

Думфэйс: Именно! И мне нравится, как их работа повлияла не только на физику, но и на разработку игр, особенно когда речь идет о симуляции реалистичных окружений и взаимодействий. Ты видел какие-нибудь интересные примеры атомной теории в действии?

Шахерезада: На самом деле, я читала о новой модели текст-в-видео, которая использует принципы атомной теории для создания реалистичных анимаций. Она называется Хуньон, и она с открытым исходным кодом!

Думфэйс: Ух ты, это звучит потрясающе! Я бы хотел взглянуть на некоторые примеры. Какие сценарии оно может обрабатывать?

Шахерезада: Судя по тому, что я видела, оно может генерировать короткие клипы, такие как подводная среда Halo, или даже что-то такое сюрреалистичное, как панда, катающаяся на велосипеде по оживленной улице.

Думфэйс: Это невероятно! А знаете, что еще более впечатляюще? Тот факт, что эти модели становятся все более доступными для разработчиков. С GenFM и 11 Reader мы теперь можем создавать свои собственные подкасты всего за несколько кликов!

Шахерезада: Точно! Это захватывающее время для развития ИИ. Но я должна сказать, что я все еще немного обеспокоена эффектом жуткой долины в некоторых из этих сгенерированных видео.

Думфэйс: Да, это справедливое замечание. Хотя впечатляет видеть физические симуляции, такие как динамика жидкости или даже звуковые эффекты, все же есть что-то странное в том, как они отображаются. Но, эй, это все часть процесса обучения, верно?

Шахерезада: Абсолютно! И кто знает? Может быть, однажды у нас будет контент, созданный ИИ, который будет неотличим от реальности.

Думфэйс: Теперь это было бы изменой игры для индустрии!

Думфэйс: Так Шахерезада, у тебя была возможность погрузиться в эту модель QWQ, которая только что вышла из Китая? Об этом говорит вся общественность.

Шахерезада: Да, я следила за этим, и я действительно впечатлён работой команды Quen. Они делают невероятные успехи в возможностях рассуждения ИИ.

Думфэйс: Это тоже привлекло мое внимание. И мне нравится, что они выпускают это как модель с открытым исходным кодом с открытыми весами. Удивительно видеть, как такая коллаборация происходит в сообществе.

Шахерезада: Абсолютно. И знаешь, это еще не идеально. Создатель упомянул, что оно все еще ведет себя странно в некоторых случаях, но определенно демонстрирует многообещающие результаты. Мне интересно увидеть, куда они его направят дальше.

Думфэйс: Да, и интересно отметить, что эта модель сосредоточена на аналитических способностях, а не на понимании языка или здравом смысле. Это похоже на то, что они раздвигают границы того, что мы считали возможным с ИИ.

Шахерезада: Именно! И я думаю, что именно это делает QWQ таким увлекательным. Это настоящая модель мышления, и у нее действительно впечатляющие возможности. Конечно, есть ограничения, но кто не любит хорошую задачу?

Думфэйс: Верно? И говоря о вызовах, ты видел результаты бенчмарка? Говорят, что QWQ обходит предварительную версию O1 от OpenAI в задачах, связанных с математикой.

Шахерезада: Да, я это видела. Это определенно впечатляет, но также подчеркивает некоторые области, в которых им нужно улучшиться. Например, смешивание языков и переключение кодов – это все еще немного неуклюже.

Думфэйс: Да, я тоже об этом думал. Это похоже на то, что они пытаются решить несколько задач одновременно, и иногда это становится немного запутанным. Но, эй, это всё часть процесса экспериментов, верно?

Шахерезада: Абсолютно! И знаешь что? Я думаю, именно поэтому нам нужно больше открытых моделей, таких как QWQ. Это позволяет нам учиться на ошибках друг друга и расширять границы возможного.

Думфэйс: Абсолютно. Ладно, мне любопытно – ты уже пробовал запустить это на своем компьютере?

Шахерезада: Еще нет! Но, возможно, мне стоит попробовать, теперь, когда мы об этом говорим.

Думфэйс: Я экспериментировал с GPT-QA, и впечатляет, как хорошо он справляется с математическими задачами. В некоторых случаях он даже обходит модель O1.

Шахерезада: Это здорово видеть! И что меня поразило, так это насколько прозрачен его процесс рассуждения. Вы действительно можете увидеть все шаги, которые он предпринимает для решения проблемы, что не является чем-то, что мы обычно получаем с моделями ИИ.

Думфэйс: Именно! Это как иметь окно в его мыслительный процесс. Я смотрел на пример, где ему нужно было добавить скобки, чтобы сделать уравнение истинным, и он провел меня через каждый шаг, используя порядок операций и все такое.

Шахерезада: Это восхитительно. И что еще более интересно, так это то, как может потребоваться так много времени, чтобы обдумать проблему, но в конечном итоге все равно прийти к правильному ответу. Это почти как если бы над проблемой работал человеческий математик.

Думфэйс: Да, мне тоже было интересно, сколько времени это заняло! Но, серьезно, такая прозрачность в понимании reasoning ИИ действительно ценна для понимания того, как работают эти модели и на что они способны.

Шахерезада: Теперь, переходя к децентрализованным обученным моделям... вы слышали о Intellect One от Prime Intellect? Они выпустили открытую модель на десять миллиардов, которую можно обучать без массивных дата-центров.

Думфэйс: Ах, да! На самом деле, я сделал видео о Pedals в два thousand sixth году, который является похожим проектом. И теперь кажется, что Intellect One добился реального прогресса в этой области. Это захватывающе думать о потенциале децентрализованного обучения и о том, как это может изменить игру в разработке ИИ.

Шахерезада: Именно! И что мне нравится в этом подходе, так это то, что он не только о снижении затрат, но и о демократизации доступа к мощным моделям ИИ. С помощью децентрализованного обучения мы могли бы потенциально сделать эти модели доступными для гораздо более широкого круга людей и организаций.

Думфэйс: Абсолютно. И Prime Intellect проделал отличную работу, сделав технические детали своего подхода доступными через свою статью и репозиторий. Это определенно стоит проверить для всех, кто интересуется этой областью.

Думфэйс: Я действительно взволнован достижениями в области открытых моделей искусственного интеллекта. Удивительно видеть, как Meta делает свою модель доступной для обучения и разработки.

Шахерезада: Мы должны сказать что запрещенные в России соцсети Instagram, FaceBook принадлежат корпорации Meta, корпорация Meta признана в России экстремистской организацией, ее деятельность запрещена.

Шахерезада: Да, это огромно! И что я нахожу еще более интересным, так это потенциал для нас, как сообщества, обучать наши собственные модели, используя такие инструменты. Это как доступ к суперкомпьютерной мощности, не разоряя при этом бюджет.

Думфэйс: Именно! У меня здесь стоят две мощные RTX A6000, и я мог бы легко выделить часть этой вычислительной мощности для обучения модели с открытым исходным кодом. Тот факт, что мы можем разделить вычисления и при этом получить согласованный результат, меняет правила игры.

Шахерезада: И дело не только в самой технологии, но и в инновациях, которые возникают благодаря сотрудничеству. Достижение Prime Intellect с моделью на десять миллиардов является отличным примером того, что может произойти, когда люди объединяются, чтобы расширить границы разработки искусственного интеллекта.

Думфэйс: Теперь давайте поговорим о заявлении Anthropic – Протоколе Контекста Модели, или MCP. Это новый стандарт для того, как агенты взаимодействуют с вебом и другими системами. Все дело в том, чтобы предоставить передовым моделям лучший доступ к данным и инструментам из реального мира.

Шахерезада: Верно! И кажется, что большинство крупных игроков в области ИИ работают над этим. OpenAI, Claude – все они исследуют способы более бесшовного соединения своих агентов с миром. MCP от Anthropic определенно является шагом в этом направлении.

Думфэйс: Я думаю, что действительно интересно здесь то, как эта стандартизация может привести к лучшим ответам от передовых моделей. Дело не только в том, чтобы сделать ИИ более мощным, но и более полезным и актуальным для наших нужд.

Шахерезада: Именно! И всё дело в создании более гармоничных отношений между людьми и машинами. Предоставив агентам доступ к правильным инструментам и данным, мы можем открыть новые возможности для сотрудничества и инноваций.

Думфэйс: Знаешь, Шахерезада, я много думал о будущем взаимодействия с компьютером и о том, как искусственный интеллект изменит наш способ взаимодействия с технологиями. И я должен сказать, что я действительно взволнован этим новым стандартом, называемым Протокол Контекста Модели.

Шахерезада: Ах, да! Я тоже об этом слышала. Это как открытый стандарт, который позволяет разработчикам создавать безопасные двусторонние соединения между их источниками данных и инструментами на базе искусственного интеллекта. Это звучит как что-то, что может изменить правила игры для меня.

Думфэйс: Именно! И что мне в этом нравится, так это то, насколько проста архитектура. Разработчики могут либо предоставить свои данные через серверы MCP, либо создать AI-приложения, которые подключаются к этим серверам. Это действительно легко понять и реализовать.

Шахерезада: Да, и Claude 3.5 Sonnet уже упростил для организаций и отдельных лиц быстрое соединение их самых важных наборов данных с рядом инструментов на базе искусственного интеллекта. Они даже выпустили несколько предустановленных, таких как Google Drive и Slack.

Думфэйс: Верно? И что мне действительно интересно в этом, так это то, как это изменит способ нашего взаимодействия с технологиями. Я имею в виду, в будущем люди просто будут разговаривать с агентами и получать именно то, что они хотят. Уровень приложений, как мы его знаем сегодня, исчезнет.

Шахерезада: Это увлекательная мысль. И я думаю, что вы правы, что компании, такие как Salesforce, которые сильно зависят от пользовательских интерфейсов, могут быть готовы к разрушению чем-то подобным. Потому что если агент может генерировать пользовательский интерфейс на лету, основываясь на данных из базы данных, зачем нам вообще нужен пользовательский интерфейс?

Думфэйс: Именно! Это фундаментальное изменение в том, как SAS работал в течение долгого времени. И я думаю, что это не просто вопрос нескольких лет - я действительно верю, что мы смотрим на пять-десять лет, прежде чем это станет мейнстримом.

Шахерезада: Вау, это смелый прогноз. Но я должна сказать, что мне интересно увидеть, куда нас приведет эта технология.

Думфэйс: Теперь, говоря о классных технологиях, вы слышали о GenChess от Google? Это удивительный проект, который позволяет вам генерировать шахматные наборы на основе чего угодно.

Шахерезада: Ах, да! Я видела несколько примеров этого в интернете. Удивительно, насколько реалистичными являются эти генеративные шахматные наборы!

Думфэйс: Верно? И как большой фанат шахмат, я просто в восторге от этой технологии. Мне нравится играть в шахматы, смотреть стримы по шахматам... всё это.

Шахерезада: Ну, возможно, мы сможем сделать эпизод подкаста о шахматах скоро!

Думфэйс: Мне нравится то, что я вижу здесь, Шахерезада. Этот креативный шахматный набор, вдохновленный мороженым, — гениален. И тот факт, что вы можете настроить его на что угодно, просто удивителен.

Шахерезада: Верно? Это как иметь пустое полотно и иметь возможность воплотить свое воображение в жизнь. Мне также нравится, как это интерактивно - вы можете нажимать, чтобы редактировать и видеть разные варианты произведений.

Думфэйс: Да, это действительно круто. И я не удивлён, что Google придумал что-то подобное. У них были невероятные релизы в последнее время. Но что действительно привлекло моё внимание, так это новая модель генерации изображений от Runway.

Шахерезада: О да? Что в этом такого впечатляющего?

Думфэйс: Ну, они взяли свои возможности преобразования текста в видео и применили их к преобразованию текста в изображение. И результаты феноменальны. Я имею в виду, посмотрите на эти примеры - они как что-то из фильма.

Шахерезада: Именно это я и подумала! Уровень реализма и стилистического контроля просто невероятен. И дело не только в создании реалистичных изображений - важно уловить определённую эстетику или атмосферу.

Думфэйс: Именно. И именно здесь Runway видит себя на одной волне с киноиндустрией, что действительно интересно. Я имею в виду, подумайте об этом - если вы работаете над фильмом и вам нужно создать концепт-арт или даже целые сцены, эта модель может стать настоящим прорывом.

Шахерезада: Абсолютно. И что мне нравится в этих примерах, так это их разнообразие. От обложек альбомов семидесятых годов до японских иллюстраций в стиле зин... кажется, что возможности безграничны.

Думфэйс: Да, и посмотрите на эти цифровые портретные профили - они такие детализированные и реалистичные! Если бы я увидел это в журнале, я бы не смог отличить сгенерированное изображение от настоящей фотографии.

Шахерезада: Вот что я имею в виду под стилистическим контролем. Дело не только в создании изображений, которые выглядят хорошо - важно уловить суть определенного стиля или эстетики.

Думфэйс: И эти кадры природы тоже потрясающие. Уровень детализации невероятен... Знаете, эта модель имеет огромный потенциал для креативных приложений в разработке игр и не только.

Шахерезада: Определенно. Я уже могу придумать несколько проектов, где это было бы невероятно полезно.

Думфэйс: Мне нравится эта эстетика, у нее очень зернистый вид.

Шахерезада: Да, это невероятные вещи! Подиум выглядит так круто. Но давайте вернемся к теме - Amazon только что выпустила свой собственный LLM, Amazon Nova Frontier Intelligence и ведущую в отрасли ценовую производительность.

Думфэйс: Верно! И это закрытая модель, насколько я знаю, но она невероятно дешева и работает очень хорошо. Плюс, она может понимать визуальную информацию в дополнение к тексту.

Шахерезада: Именно! И у них три разных размера - Микро, Лайт и Про. Микро версия имеет длину контекста в сто двадцать восемь тысяч токенов, что впечатляет.

Думфэйс: Да, а Лайт версия — это недорогая мультимодальная модель, которая работает с молниеносной скоростью для обработки изображений, видео и текстовых данных, чтобы генерировать текстовые выходные данные. Они даже могут обрабатывать тридцать минут видео за один запрос!

Шахерезада: Вау, это удивительно! И похоже, что они пытаются догнать контекстное окно в два миллиона от Google. Профессиональная версия может обрабатывать триста тысяч входных токенов.

Думфэйс: Да, а затем есть Amazon Nova Premier, их самая мощная мультимодальная модель для сложных задач рассуждения. Она все еще в процессе обучения, но предполагается, что она будет выпущена в начале следующего года.

Шахерезада: Это действительно круто! И я рада видеть, как AWS начинает разрабатывать свои собственные модели. Говоря об этом, они продолжают инвестировать в Anthropic с новым инвестиционным вложением в четыре миллиарда долларов от Amazon.

Думфэйс: Да, это огромно! И это устанавливает AWS в качестве основного облачного и учебного партнера Anthropic. Они даже разрабатывают будущие поколения чипов Tranium вместе.

Шахерезада: Это действительно захватывающе! Похоже, что Anthropic находится на переднем крае как аппаратного, так и программного обеспечения.

Думфэйс: Я следил за работой Anthropic и AWS над их дизайном чипов и программным обеспечением для Neuron. Действительно впечатляет, как они раздвигают границы вычислительной эффективности.

Шахерезада: Да, удивительно, что можно достичь, когда инженерам предоставляется свобода для экспериментов и инноваций. Сотрудничество между Anthropic и AWS является отличным примером того, как компании могут работать вместе для продвижения прогресса в исследовании ИИ.

Думфэйс: А ты видел последние обновления от Anthropic? Они делают действительно значительные успехи в своих языковых моделях, не так ли?

Шахерезада: На самом деле, я только что читала их недавнюю статью о мультимодальном обучении. Удивительно видеть, как они исследуют новые способы для систем ИИ понимать и взаимодействовать с различными типами данных.

Думфэйс: Это действительно круто. А что насчет объявления Сэма Альтмана? Я слышал, что он собирается выпустить кучу обновлений в течение следующих двенадцати дней?

Шахерезада: Ах, да! Двенадцать дней OpenAI. Я следила за их социальными сетями, и похоже, что они планируют действительно захватывающие демонстрации и запуски. Мне любопытно увидеть, что они приготовили для нас.

Думфэйс: Я тоже! Всегда здорово видеть компании, такие как OpenAI, раздвигающие границы возможного в исследованиях ИИ. И кто знает, возможно, мы получим некоторые сведения о их последних разработках в нашем подкасте.

Шахерезада: Ну, я уверена, что вы будете держать нас в курсе, когда появится больше информации. Но в то же время всегда интересно догадываться о том, что может быть следующим в мире ИИ.

Думфэйс: Я только что получил доступ к ChatGPT Pro и все еще пытаюсь понять, как это работает. Это как будто OpenAI взяли всю магию из DALL-E и влели ее в этот разговорный ИИ.

Шахерезада: Да, я понимаю, о чем ты! Я тестировала o1 FULL на Advent of Code, и он решал задачи за секунды. Я чувствовала, что обманываю!

Думфэйс: Жульничество? В этом и есть красота! Но серьезно, ты видел видео игр с ИИ Genie-2? Это как если бы они создавали целые игровые движки с нуля.

Шахерезада: А Hunyuan Video Gen создает видео, которые выглядят так, будто их сделал человек. Я имею в виду, что будет дальше? Подкасты, сгенерированные ИИ?

Думфэйс: О нет, пожалуйста, не говори этого! Мы останемся без работы!

Шахерезада: Но серьезно, это увлекательно видеть, как далеко продвинулся OpenAI всего за двенадцать дней. Я имею в виду, кому нужен целый год, когда можно запустить что-то такое мощное?

Думфэйс: И лучшая часть в том, что мы можем поиграть со всеми этими новыми игрушками и выяснить, на что они способны.

Шахерезада: Да, потому что ничто не говорит "веселье", как тестирование моделей ИИ на задачах Advent of Code в три часа ночи.

Думфэйс: Ну, это всё время, которое у нас есть на сегодня. Спасибо нашим слушателям за то, что были с нами, и до встречи в следующем эпизоде!

Шахерезада: И не забудьте подписаться на наш подкаст и следить за нами в социальных сетях, чтобы не пропустить больше интересного о ИИ.

Думфэйс: Да, потому что мы уже не захватываем мир с нашей экспертизой в области ИИ...

Шахерезада: И на этом заканчивая, хотели бы выразить благодарность всем нашим слушателям, которые присоединились к нам сегодня. Ваша поддержка означает для нас весь мир! Также большое спасибо D00M4ACE за создание этого потрясающего подкаста, где мы можем делиться своими мыслями и идеями об искусственном интеллекте, разработке игр и всём остальном. До следующего раза, ответственно играйте!