#79 Последние новости и тренды ИИ RunwayML, OpenAI, Google, Alibaba + Будущее ИИ от Fei-Fei Li.
#117 суббота, 21 сентября 2024 г. 132 минут(ы) 13054 слова
В этом выпуске подкаста Думфэйс и Шахерезада обсуждают последние новости из мира ИИ, включая обновления OpenAI по безопасности и модели O1, новые функции YouTube, релиз Alibaba более 100 open-source моделей и другие важные события. Думфэйс и Шахерезада анализируют новые инструменты для создания видео с помощью AI, такие как RunwayML, Luma Dream Machine и Kling.ai, а также интеграцию AI в Amazon Seller Central, HubSpot и Slack. Они также обсуждают использование LinkedIn пользовательских данных для обучения AI, обновления Suno и Apple Vision Pro, законы Калифорнии, связанные с AI, и презентацию Фей-Фей Ли о будущем AI, уделяя особое внимание пространственной интеллектуальности и разработке игр. Думфэйс и Шахерезада делятся своими мыслями о будущем AI и его влиянии на различные сферы, подчеркивая важность этических вопросов и ответственного развития этих технологий.
D00M4ACE разработка 2D MMORPG блог ИИ и геймдев 🌐 https://d00m4ace.com
Telegram: https://t.me/d00m4ace_blog
YouTube: https://www.youtube.com/c/@d00m4ace
Soundcloud: https://soundcloud.com/d00m4ace
Apple Podcast: https://podcasts.apple.com/podcast/id1723142484
Яндекс Музыка: https://music.yandex.ru/album/28798077
VK Podcast: https://vk.com/podcasts-224167280
Amazon Music: https://music.amazon.com/podcasts/40c36f38-114a-4a79-8d0c-baf970f331b3/
Spotify: https://open.spotify.com/show/4RsttStN9RejAOEbLUG8IS
Дзен: https://dzen.ru/d00m4ace
Rutube: https://rutube.ru/channel/33955589/
RSS1 feed: https://podster.fm/rss.xml?pid=89212
RSS2 feed: https://media.rss.com/d00m4ace/feed.xml
Транскрипция подкаста:
Думфэйс: Привет Шахерезада, хочу поделиться с тобой всеми последними новостями из мира ИИ.
Шахерезада: Сезон конференций всегда интересен, но также и перенапряженный. Этот неделе мы видели HubSpot inbound, Salesforce's Dreamforce event, Amazon's event, YouTube's event, и Snapchat's event. И следующей недели у нас есть MetaConnect, на которое нам нужно смотреть.
Шахерезада: Мы должны сказать что запрещенные в России соцсети Instagram, FaceBook принадлежат корпорации Meta, корпорация Meta признана в России экстремистской организацией, ее деятельность запрещена.
Думфэйс: Это много! Вроде бы каждая компания хочет сделать больше объявлений в эти дни. Но давайте начнем с чего-то, OpenAI только что опубликовала обновление своих практик безопасности и обеспечения, и это имеет интересные новости.
Шахерезада: Ага? Что происходит с OpenAI?
Думфэйс: Ну, они реализуют новые меры безопасности и более прозрачны в своих процессах. Но главная новость в том, что они создают независимый совет по безопасности и безопасности. Он будет возглавлять Зико Култер и включать в себя некоторые другие известные фамилии.
Шахерезада: Это отличное решение со стороны OpenAI. Открытость и ответственность имеют решающее значение в развитии ИИ, особенно когда речь идет о безопасности и безопасности.
Думфэйс: Absolutely. И говоря об OpenAI, я думал о их объявлении модели O1 последней недели. Это большое дело для логических и задач рассуждения, правильно?
Шахерезада: Да, это правда. Но интересно то, что на этой неделе они объявили о повышении лимитов скорости для пользователей плюс и команды в семь раз.
Думфэйс: Ох, это значительное увеличение! Я не удивлен, может быть это связано с моделью O1 или чем-то другим вовсе.
Шахерезада: Хм, это хороший вопрос. Может быть, мы узнаем больше, когда будем углубляться в эту тему. Но пока давайте продолжим исследовать эти разработки и посмотрим, куда они нас приведут.
Думфэйс: Звучит как замысел! Что вы думаете о правлении OpenAI? Вы считаете, что оно изменит их практики безопасности и обеспечения безопасности?
Шахерезада: Я считаю, что это шаг в правильном направлении. Имея независимый совет директоров, они смогут привлечь внешние точки зрения и экспертизу, которые только улучшат их процессы.
Думфэйс: Это имеет смысл. А что касается модели O1, вы считаете, что она имеет потенциал революционизировать логические и задачи рассуждения?
Шахерезада: Хорошо, я думаю, это безусловно значительное достижение, но мы увидим, как оно себя поведет в реальных приложениях. Всегда есть компромиссы, когда речь идет об моделях AI, поэтому мы будем следить за этим.
Думфэйс: Хорошо, давайте продолжим исследовать эти темы и посмотрим, куда они нас приведут!
Думфэйс: Я давно мечтал поглубже изучить OpenAI O1 самому, но мой график был сумасшедшим в этом месяце. Не могу ждать, когда вернусь домой и проведу некоторое качественное время с ним.
Шахерезада: Да, я могу понять. Всегда интересно изучать новые модели ИИ, но иногда жизнь мешает. Но хоть и так, у нас есть Амар Реши, который показывает нам, что возможно с помощью O1! Этот 3D-змейка, которую он сделал, просто сумасшедшая.
Думфэйс: Полностью согласен! И это просто показывает, насколько мощной может быть OpenAI O1. Я использую Claude Sonnet 3.5 для задач кодирования, но O1 кажется настоящим переворотом. Я любопытен увидеть, какие проекты люди придумают теперь, когда этот модель доступна.
Шахерезада: Да, и это не только сами инструменты – это как они интегрируют эти новые модели в свои платформы. Пользователи GitHub Copilot теперь могут использовать O1 напрямую внутри инструмента, что огромно. И Perplexity добавляет фокус на рассуждения для пользователей Pro? Это просто потрясающе.
Думфэйс: Точно так! Это похоже на эффект снежного кома, когда все эти инструменты и платформы обновляются для использования последних моделей ИИ. Я взволнован увидеть, как это изменит ландшафт разработки игр.
Шахерезада: Absolutely. И я думаю, что интересно то, как эти новые модели используются в реальных приложениях. Это не только о генерации текста или изображений - это о решении реальных проблем и создании ценности для людей.
Думфэйс: Слушайте, похоже, OpenAI начинает раздражаться из-за попыток людей разобраться в внутренностях модели O1. Я имею в виду, мы видим это раньше с АИ-моделями - они всегда стремятся сохранить свои секреты в тайне.
Шахерезада: Да, и интересно, что они используют термин «обойти меры безопасности» в качестве причины для блокировки людей. Звучит так, как если бы они пытались застраховаться на всех фронтах, но в то же время это kinda...понятно. Я mean, если кто-то пытается обратить модель в обратную сторону, вы хотите защитить свою интеллектуальную собственность.
Думфэйс: Точно так! И это не только вопрос защиты их интеллектуальной собственности - также важно сохранять контроль над тем, как люди взаимодействуют с их моделями. Ограничивая доступ к следу рассуждений, они фактически контролируют, что информации выходит на свет и что нет.
Шахерезада: Это замечательная точка зрения. Они как бы создают иллюзию прозрачности, показывая вам только столько, чтобы сделать вид, что они открыты, но не так много, чтобы люди могли понять, как работает модель.
Думфэйс: Да, и я думаю, что это действительно интересно здесь – тот факт, что OpenAI пытается идти по тонкой грани между прозрачностью и секретностью. Это деликатный баланс, особенно когда речь идет о моделях AI, которые становятся все более сложными.
Шахерезада: Absolutely. И я думаю, что это также стоит отметить, что эта вся ситуация подчеркивает напряженность между инновацией и контролем. С одной стороны, у вас есть компании, такие как OpenAI, которые хотят продвигать границы того, что возможно с помощью AI, но с другой стороны, они также пытаются сохранить контроль над тем, как люди используют их модели.
Думфэйс: Это отличный способ выразить это. И я думаю, что это что-то, с чем мы будем сталкиваться все чаще и чаще, как AI будет продолжать развиваться - такие виды борьбы за власть между компаниями, исследователями и пользователями. Будет интересно наблюдать!
Думфэйс: Я все еще пытаюсь понять эти обновления Google, Шахерезада. Звучит так, что они идут на шаг навстречу прозрачности при создании контента с помощью искусственного интеллекта.
Шахерезада: Точно так! И интересно, что они начинают с метаданных изображений. Я считаю, это отличное решение, но оно также вызывает вопросы о ответственности создателей и платформ за маркировку их произведений как генерируемых AI.
Думфэйс: Это хороший момент. Это не только вопрос прозрачности, но и ответственности. Если изображение помечено как созданное AI, это влияет ли на его надежность или достоверность? И как это повлияет на то, как мы потребляем информацию в сети?
Шахерезада: Я думаю, также стоит учитывать потенциальные последствия для создателей, которые используют инструменты AI для генерации контента. Будут ли они наказаны или помечены каким-то образом, если их работу признают заработанной с помощью AI? Это сложная проблема, и я не уверена, что Google полностью рассмотрел все последствия.
Думфэйс: Да, это скользкая дорожка. Но в то же время я считаю, что это необходимый шаг к регулированию контента, созданного с помощью ИИ. Нам нужно иметь какую-то рамку для различения между произведениями человека и выходом, созданным с помощью ИИ.
Шахерезада: Absolutely. И я любопытна увидеть, как это будет работать на практике. Будем ли мы видеть больше метаданных в AI-сгенерированном контенте, или это будет постепенный процесс? А что касается потенциала злоупотребления – можно ли представить, чтобы кто-то использовал эту информацию для манипулирования результатами поиска или распространения дезинформации?
Думфэйс: Ужасно, это сценарий кошмарный. Но я думаю, что Google пытается найти баланс между прозрачностью и ответственностью. Будет интересно увидеть, как это сложится в ближайшие месяцы.
Шахерезада: Безусловно. И говоря об АИ-генерируемом контенте, вы видели какие-либо обновления по последним разработкам в игровой индустрии? У меня есть слухи о новых инструментах и платформах, которые появляются...
Думфэйс: Так, Шахерезада, что вы думаете о новых функциях AI на YouTube? В частности, возможности видеопроизводства с помощью модели Veo от Google.
Шахерезада: Да, это действительно интересно. Я думаю, что это очень fascinates, как они интегрируют эту технологию напрямую в приложение YouTube Shorts. Это логично, учитывая рост короткометражного контента и необходимость создателей быстро производить высококачественные визуальные материалы.
Думфэйс: Именно так! И я люблю, как они сделали его доступным с помощью этих настроек и подсказок. Это почти как палитра цифрового художника, где вы можете описать то, что хотите, а AI сделает свою магию.
Шахерезада: Это отличный способ выразить это. И я любопытна, как это повлияет на творческий процесс ютуберов. Они будут полагаться больше на эти сгенерированные изображения и видео или это вдохновит их придумывать новые идеи?
Думфэйс: Хм, это хороший вопрос. Я думаю, оно, вероятно, сделает и то, и другое. Некоторые создатели могут использовать его в качестве точки старта, а другие увидят в нем способ для исследования новых возможностей и продвижения границ того, что они могут создавать.
Шахерезада: А что касается этой функции вдохновения? Она звучит как потенциальный игрок в изменение для идеации и управления проектами.
Думфэйс: Absolutely! Я имею в виду, кто не захочет помочь Brainstorm видеоидеями или генерировать концепции обложек? Это как иметь личного творческого помощника, встроенного в приложение.
Шахерезада: Да, это именно то, что чувствуется. И автоматическая субтитровка также является большим делом, особенно для создателей, у которых нет ресурсов инвестировать в профессиональные озвучивания.
Думфэйс: Точно! Это откроет новые возможности для создателей, чтобы достичь более широкой аудитории без разрыва в банке. Что вы думаете о последствиях этой технологии на индустрию разработки игр? Мы увидим подобные интеграции с инструментами, обладающими искусственным интеллектом?
Шахерезада: Это замечательная точка зрения, Думфэйс. Я думаю, что вопрос времени, когда мы увидим больше инструментов, управляемых ИИ, в разработке игр, особенно при создании уровней, генерации персонажей и даже генерации сюжетов.
Думфэйс: Ох, это действительно интересно! Возможности бесконечны, и я уверен, что наши слушатели будут ждать с нетерпением услышать больше о этих разработках.
Думфэйс: Мне очень нравятся новые функции, которые объявила YouTube, особенно функция автоматического субтитрования. Вы можете представить, что ваши видео переводятся на разные языки и достигают глобальной аудитории? Это как целый новый мир возможностей.
Шахерезада: Да, это действительно очень интересно! И я думаю, что здесь искусственный интеллект сделает огромный вклад в создание контента. С этими функциями создатели могут сосредоточиться на производстве высококачественного контента без беспокойства о языковых барьерах или локализации.
Думфэйс: Точно так! И говоря об АИ, вы слышали о новых открытом-источниковых моделях, выпущенных Alibaba? У них более ста новых моделей в семье Quinn 2.5, охватывающих от половины миллиарда до 72 миллиардов параметров. Это просто огромно!
Шахерезада: Ох, это действительно впечатляет! И это не только о числах; они стремятся обслуживать различные сектора, такие как автомобильная промышленность, игровая индустрия и научные исследования. Я любопытна увидеть, как эти модели будут использоваться в реальных-world приложениях.
Думфэйс: Да, и вы слышали о новом модели текст-видео? Звучит как революция в создании контента. Представьте себе возможность генерировать высококачественные видео из текста в одиночку!
Шахерезада: Это просто потрясающе! И согласно Бенду Редди, модель Квинна с 72 миллиардами параметров теперь является лучшим открытым исходным кодом в мире. Я не удивлена; эти большие модели языка каждый день становятся все более впечатляющими.
Думфэйс: Хорошо, давайте перейдем к видео AI. В этом неделе было много интересных разработок. Вы видели новые генераторы видео AI? Они действительно хорошо справляются с созданием реалистичных видеороликов.
Шахерезада: Да, я следила за некоторыми проектами, и просто потрясающе, насколько они продвинулись. Но что меня больше интересует - это то, как эти технологии повлияют на человеческую творческую способность и сотрудничество. Мы увидим сдвиг в сторону более автоматизированного контента или люди все равно будут главной движущей силой творческих начинаний?
Думфэйс: Мне очень нравится этот новый видео-видео-модель Runway, Шахерезада. Это как огромный скачок вперед по сравнению с Ген 1.
Шахерезада: Полностью согласна, Думфэйс! Примеры, которые они демонстрируют, просто потрясающие. Я имею в виду, что исходное видео переводится в эту версию AI с такой точностью. И это не только вопрос замены одного человека на другого; мы говорим о том, что целые окружающие среды и объекты преобразуются.
Думфэйс: Да, и что действительно привлекло мое внимание, так это как чисто и реалистично выглядят эти сгенерированные видеозаписи. Это похоже на то, что они разгадали код по генерации высококачественного видеоконтента с помощью ИИ.
Шахерезада: Точно так! И это не только вопроса внешнего вида; эта технология имеет огромное значение для отраслей, таких как производство фильмов и телепередач. Я имею в виду, подумайте об этом – с помощью custom- модели AI, построенной на основе гигантской базы данных Lionsgate высококачественных фильмов и шоу...
Думфэйс: ...вы можете потенциально создавать целые фильмы или сериалы с помощью содержимого, генерируемого ИИ. Это и возбуждает, и пугает одновременно.
Шахерезада: Правда? Но серьезно, это то направление, в котором мы движемся - будущее, где контент, сгенерированный ИИ, станет неразличимым от реальности. И я думаю, что это изменит игру как для создателей, так и для потребителей.
Думфэйс: Мне бросилось в глаза, как Ранвей использовал базу данных Лайонсгейт для создания этого кастомного модели. Это заставляет меня задуматься о том, какие другие сотрудничества такого типа могут привести к инновациям в области искусственного интеллекта.
Шахерезада: Absolutely, Думфэйс! Возможности безграничны, когда комбинируешь силу ИИ с уже существующими отраслями и экспертизой. И мы только начинаем разбираться в том, что возможно здесь.
Думфэйс: Я действительно возбуждён начать изучение этого объявления от Runway. Они открывают свой API для разработчиков, чтобы получить доступ к их возможностям создания видео с помощью искусственного интеллекта. Это огромное дело, особенно учитывая недавние изменения в законодательстве Калифорнии вокруг AI-актёров и редактирования видео.
Шахерезада: Да, это замечательное совпадение времени. И я думаю, что стоит отметить, что API Runway все еще находится в ранней стадии доступа, поэтому вам нужно подать заявку, чтобы получить доступ. Но Luma Labs Dream Machine уже делает свой API публично доступным, что означает, что разработчики могут начать использовать его прямо сейчас.
Думфэйс: Точно! Appears, that these companies compete among themselves, who will offer more developed tools for creation of artificial intelligence video. And I think, we will see much new applications and tools.
Шахерезада: Мне интересно, Думфэйс, что вы думаете, это означает для будущего создания контента? Будем ли мы видеть больше автоматизированного производства видео или это просто приведет к большему количеству содержащегося в нем искусственного интеллекта, которое не обязательно лучше, чем созданный человеком контент.
Думфэйс: Ну, я думаю, что это и то, и другое. С одной стороны, доступ к таким мощным инструментам AI может сделать проще для создателей производить высококачественный контент быстро и эффективно. Но с другой стороны, также есть риск чрезмерной зависимости от автоматизации, которая может привести к гомогенизации контента.
Шахерезада: Это замечательная точка зрения. И я думаю, что также стоит учитывать воздействие на человеческих работников в этой отрасли. Будем ли мы видеть больше потери рабочих мест, когда AI будет выполнять определенные задачи?
Думфэйс: Да, это, безусловно, вызывает Concern. Но в то же время я думаю, что это также может создать новые возможности для людей работать вместе с АИ и сосредоточиться на более высокоуровневых творческих решениях.
Шахерезада: Точно! И это не только о технических аспектах создания контента. Я думаю, нам нужно учитывать, как эти изменения повлияют на то, как мы потребляем и взаимодействуем с медиа.
Думфэйс: Absolutely. Хорошо, давайте глубже рассмотрим эту тему и исследуем некоторые последствия...
Думфэйс: Вы знаете, Шахерезада, я видел много новых инструментов AI lately, и это заставило меня задуматься – они действительно приносят что-то новое на стол или это просто кто-то наклеивает новый интерфейс на существующую технику?
Шахерезада: Это замечательная точка зрения, Думфэйс. Я думаю, что мы видим тенденцию, когда люди берут существующие API и оборачивают их в новую, блестящую оболочку, делая так, как будто это что-то совершенно новое.
Думфэйс: Точно! И это не особенно ценно для меня. Но когда вы интегрируете эти API в поток работы, теперь это где-то происходит магия. Множество шагов, автоматизация... о том, о чем я говорю.
Шахерезада: Да, и я думаю, что мы увидим это в будущем. Люди начнут понимать, что просто навешивание нового интерфейса на что-то не достаточно.
Думфэйс: А говоря о новых разработках, вы видели обновления от Клинга? Они только что выпустили версию 1.5 с некоторыми впечатляющими функциями.
Шахерезада: Ах, да! Я видела их видео-объявление на X. Функция кисти движения действительно потрясающая. Это как если бы они дали пользователям совершенно новый уровень творческого контроля над своими видео.
Думфэйс: Правда? И улучшения качества изображения также заслуживают внимания. Но что действительно привлекло мое внимание, — это эта функция движения кистью. Вы видели ее в действии?
Шахерезада: Да, я уже ознакомилась с этим. Удивительно, как они могут генерировать видео на основе входных данных пользователя. Примеры, которые показали, были довольно впечатляющими.
Думфэйс: Знаю, правда? И это не только вопрос о луне и кошке. Они демонстрируют действительно сложные запросы, которые модель может обработать. Это безусловно шаг вперед в области создания содержимого с помощью искусственного интеллекта.
Шахерезада: Absolutely. И я думаю, это всего лишь начало того, что мы увидим от Клинга и других инструментов AI, подобных ему. Возможности бесконечны, и интересно подумать, куда приведет нас эта технология.
Думфэйс: Мне очень нравится эта тема, Шахерезада! У них есть просто потрясающие примеры видео, сгенерированных искусственным интеллектом. Вы можете увидеть, как они подчеркивают конкретные объекты и действия в изображениях.
Шахерезада: Да, это действительно впечатляет. И что меня интересует, так это то, что эти видео не просто статические изображения, а настоящие анимации, которые показывают движение и действия. Это как если бы мы видели зарисовку будущего контента, сгенерированного AI.
Думфэйс: Точно! И это не ограничивается только этим одним потоком. Есть множество других примеров, от автомобилей, движущихся по дорогам, до солдат, прыгающих через препятствия. Возможности бесконечны.
Шахерезада: Я знаю, правда? И что меня действительно возбуждает - это то, что мы начинаем видеть эти функции интегрироваться в основные платформы, такие как Amazon. Их видеогенератор для рекламных объявлений о продуктах - отличный пример этого.
Думфэйс: Да, это действительно шаг в правильном направлении. Но как вы говорили, Шахерезада, когда вы используете видео на Amazon, вы kinda используете его, чтобы выделиться из толпы. Это не только о том, чтобы создать красивый рекламный материал, но и о том, чтобы убедиться, что ваш продукт виден и замечен.
Шахерезада: Это правда. И я думаю, что это тот случай, когда контент, созданный с помощью AI, может действительно помочь. Автоматизируя процесс создания увлекательных видеороликов, бизнесы могут сосредоточиться на том, что действительно важно – на выстраивании убедительных историй и сообщений, которые будут иметь резонанс у их аудитории.
Думфэйс: Absolutely. И это не только Amazon. Мы видим подобные тенденции в других отраслях, начиная с игр и заканчивая образованием. Содержание, создаваемое AI, изменит нашу способность создавать и потреблять медиа, и я считаю, что это интересное время для участия в этом путешествии.
Шахерезада: Безусловно. Хорошо, давайте глубже рассмотрим некоторые из этих примеров и разберемся в том, что заставляет их работать. Что вы думаете о Luma's Dream Machine и Runway ML? Вы считаете, что они интегрируют какие-либо из этих функций в свои платформы?
Думфэйс: Ах, замечательный вопрос! Я бы очень хотел увидеть, как они внедряют эти возможности видео, сгенерированные AI, в свои инструменты. Это может стать настоящим переворотом для создателей контента и бизнесов.
Шахерезада: Да, это точно стоит внимания уделять. И говоря об этом, вы видели какие-либо другие интересные разработки в области контента, сгенерированного искусственным интеллектом?
Думфэйс: На самом деле, я только что читал о некоторых новых исследованиях по синтезу текста в изображения. Это все еще находится на ранней стадии, но потенциальные применения огромны.
Шахерезада: Ох, это звучит интересно! Мы обязательно должны углубиться в эту тему на следующем эпизоде.
Думфэйс: Я задумывался о всей этой АИ-аффере и как она изменит ландшафт разработки игр. Если у всех есть доступ к этим функциям, действительно ли кто-то выделяется больше? Всё эти видео просто будут выглядеть одинаково?
Шахерезада: Это замечательная точка зрения, Думфэйс. Вроде бы, что уникальное предложение здесь? Но в то же время я думаю, что это еще рано для AI в разработке игр. Мы видим очень крутые штуки, которые делаются с помощью инструментов, таких как этот новый проект Amazon Amelia.
Думфэйс: Да, я тоже это видел. Внешне это выглядит как довольно полезный инструмент для продавцов Amazon, позволяющий получить визуализацию своего бизнеса и получать рекомендации на основе их продуктов и данных магазина. Но интересно то, как он использует AI для извлечения данных из магазина пользователя и предоставления персонализированных рекомендаций.
Шахерезада: Точно! И это не только о самом технологическом аспекте, но и о том, как мы используем его для облегчения нашей жизни разработчиков и предпринимателей. Я имею в виду, кто бы не захотел иметь инструмент, который может помочь им подготовиться к праздничной сезону или дать им ключевые метрики их бизнеса?
Думфэйс: Да, это действительно мечта сбывается! И говоря о крутой технике, вы видели, что делает Снап? Они демонстрируют этот новый инструмент генерации видео с помощью искусственного интеллекта, который позволяет создателям генерировать видео на основе текстовых подсказок.
Шахерезада: О, да! Я тоже видела это. Это просто сумасшедшее, насколько далеко мы продвинулись с созданием контента с помощью искусственного интеллекта. Но что еще более интересно - потенциал для очков дополненной реальности, как у нового прототипа Snapchat. Вы можете представить себе дисплей в видимом поле зрения и автоматически тускнеющие линзы?
Думфэйс: Да, это действительно звучит как научная фантастика! Они также работают над технологией отслеживания рук, подобной Vision Pro Apple. Будет интересно наблюдать, как эти технологии эволюционируют и изменят нашу взаимосвязь с играми и другими цифровыми опытами.
Шахерезада: Absolutely. Я думаю, мы только начинаем разбираться в том, что может сделать ИИ для разработки игр, и это будет интересный путь.
Думфэйс: Я видел много шума вокруг этих новых умных очков от Meta, и я должен сказать, что они выглядят довольно интересно. Я имею в виду, мы говорим о устройстве, которое фактически представляет собой компьютерный экран перед глазами.
Шахерезада: Да, это как что-то из научно-фантастического фильма! Но серьезно, идея иметь виртуальный дисплей прямо перед собой довольно круто. И почитав, они пытаются объединить функциональность тех Meta Ray-Ban очков с X real очками, которые позволяют смотреть видео и прочее напрямую в очках.
Думфэйс: Точно! Это как если бы они пытались создать гибридное устройство, объединяющее лучшее из обоих миров. Но, как мы знаем, бета-версии часто имеют свои ограничения. В этом случае кажется, что батарея живет только 45 минут, что довольно коротко.
Шахерезада: Да, и я уверена, что им придется поработать над тем, чтобы они выглядели немного более... эстетически приятными, скажем так. Но если они сумеют решить эти проблемы, эти устройства могут стать очень популярными. И говоря об Meta, вы слышали, что они только что продлили свой контракт с Ray-Ban до двухтысячного тринадцатого года?
Думфэйс: Да, я видел это! Итак, мы смотрим на минимум еще шесть лет новых и улучшенных версий Meta Ray-Bans. Я любопытен увидеть, что они покажут на Meta Connect следующей недели. Слухи говорят, что они представят новую пару очков AR.
Шахерезада: Это интересно! И я думаю, что это заманчиво, что вы упомянули о том, что голос Джеймса Эрла Джонса будет использоваться в будущих фильмах Звездных войн. Похоже, он дал Lucasfilm разрешение продолжать использовать его знаменитый голос Дарта Вадера.
Думфэйс: Да, и это вызывает некоторые интересные вопросы о использовании голосов, сгенерированных ИИ, в кино и на телевидении. Я имею в виду, что для актеров означает ли это, когда их голоса могут быть воспроизведены машинами?
Шахерезада: Точно! И это не только вопрос озвучивания – есть последствия для всех видов творческой работы. Но, как мы знаем, Калифорния принимает меры по решению этих проблем. Вы слышали, что Гэвин Ньюсом подписал восемь новых законов, связанных с ИИ, этой неделей?
Думфэйс: Я следил за этими законопроектами в Калифорнии, и интересно наблюдать, как они решают вопросы с содержимым, созданным искусственным интеллектом. Один из них, касающийся водяных знаков в метаданных для изображений, созданных ИИ, является отличным примером попыток предотвратить распространение дезинформации посредством глубинных подделок.
Шахерезада: Это правильно! И это не только о предотвращении глубинных подделок, но и о том, чтобы дать людям больше прозрачности и контроля над их цифровой присутствием. Я имею в виду, подумайте об этом - если вы актер или публичная фигура, хотите ли вы, чтобы ваш образ использовался в контенте, сгенерированном AI без вашего согласия?
Думфэйс: Именно! И закон, требующий от студий получить разрешение актеров перед созданием AI-генерируемых реплик их голоса или внешности - это большой шаг вперед. Это все о том, чтобы уважать права людей и контроль над их цифровой идентичностью.
Шахерезада: Да, это интересно, потому что это вызывает вопросы о собственности и контроле в эпоху искусственного интеллекта. Если голос или подобие актера можно воспроизвести с помощью AI, кто владеет этой цифровой версией? Актер сам, или студия, которая ее создала?
Думфэйс: Это замечательная точка зрения! И я думаю, что мы увидим больше таких дискуссий, как AI-сгенерированный контент станет более распространенным. Но то, что особенно привлекло мое внимание, - это законопроект о том, чтобы сделать ответственными создателей моделей за катастрофические вред, причиненные их моделями.
Шахерезада: Ах, да! Закон SB 1047, безусловно, является игроком в игру. Он пытается заставить компании нести ответственность за потенциальные риски и последствия AI, даже если они напрямую не причастны к причинению вреда. Но что это за демонстрируемые риски, вообще? И как мы сбалансируем необходимость инноваций с необходимостью безопасности и ответственного поведения?
Думфэйс: Хорошо, это Точно то, о чем пытается подумать Гэвин Ньюсом. Он принимает осторожный подход, говоря, что он не может решить все проблемы, но хочет сосредоточиться на том, что мы можем решить. Это очень тонкая беседа, и я думаю, это здорово, что он признает сложность этих вопросов.
Шахерезада: Да, и это не только касается Калифорнии – это глобальный разговор, который нужно вести. Поскольку АИ продолжает развиваться и формировать наш мир, нам необходимо вести такие разговоры о этике, ответственности и подотчетности.
Думфэйс: Я следил за развитием СБ 1047 и должен сказать, что немного обеспокоен потенциальным воздействием на проекты open source. Идея регулирования в этой области сложна, и неясно, как это повлияет на инновации.
Шахерезада: Да, я понимаю почему вы волнуетесь. Регулирование может быть двусторонним оружием - с одной стороны, оно может обеспечить ясность и поддержку рискованного поведения, но с другой стороны, оно также может подавлять творчество и привести к непредвиденным последствиям. Открытая исходная сообщество особенно уязвимо для этого рода вещей.
Думфэйс: Именно! А с SB 1047 есть реальный риск того, что оно может оказать чрезмерное влияние не только на проекты open source, но и на всю индустрию. У меня есть слухи, что даже если оно примет в нынешней форме, то может быть ветировано.
Шахерезада: Возможно, все это возможно. Нам просто нужно подождать и увидеть, как все сложится в ближайшие пару недель. Meanwhile, давайте поговорим о чем-то более позитивном - например, об этом мероприятии HubSpot, на котором я сейчас присутствую. Они только что запустили свою новую платформу Breeze, которая действительно очень интересна.
Думфэйс: Ах, да! Я тоже следил за этим. Звучит, что они делают большие шаги в области ИИ и автоматизации. Идея о том, чтобы агенты ИИ могли управлять вашим CRM для вас, довольно привлекательна.
Шахерезада: Absolutely! И это не только четыре агента Бриз, которые они запускают - есть еще 80 функций, встроенных по всей платформе. На самом деле я очень впечатлена тем, что увидела до сих пор.
Думфэйс: Да, я понимаю почему вы так возбуждены по этому поводу. Всегда приятно видеть, как компании продвигают границы возможностей в области ИИ и автоматизации. И по звучанию кажется, что Хабспот делает действительно инновационную работу в этой области.
Шахерезада: Конечно! И я должна сказать, что немного завидую тому, что вы провели время с Дармешем, со-основателем и главным технологом HubSpot. Это должно было быть настоящим удовольствием!
Думфэйс: Да, это безусловно был один из лучших моментов моей недели. Но все равно, продолжая - есть еще интересное развитие в области ИИ, о котором я хотел упомянуть. Компания Grok, разработчик чипов, заключила сделку с Aramco для строительства крупнейшего в мире центра ИИ-инференса.
Шахерезада: Ох, это огромно! 19 тысяч единиц обработки языка — это грандиозная задача. И не только масштаб проекта впечатляет - также то, что они рассчитывают запустить его к концу этого года.
Думфэйс: Да, я знаю о чем вы говорите. Страшно подумать об объеме ресурсов, которые вкладываются в этот проект. И это не только языковые процессоры сами по себе – это также и центр данных, который будет их поддерживать.
Шахерезада: Точно! И тот факт, что Арамко финансирует разработку этого центра - это большое дело. Это показывает, что они серьезно относятся к инвестированию в искусственный интеллект и автоматизацию, и видят потенциал для реального влияния на мир.
Думфэйс: Я следил за этим Гроком и он действительно интересен. Это как если бы они напрямую конкурировали с Nvidia в области ИИ, но вместо продажи оборудования они предлагают облачные вычислительные услуги.
Шахерезада: Это правильно! И что я нахожу интересным в том, что вы не можете просто пойти и купить Grok GPU, чтобы запустить свой собственный AI дома. Вы должны использовать их веб-сайт или API для доступа к их системам. Это как если бы они брали более сервисно-ориентированный подход, тогда как Nvidia все еще фокусируется на продаже оборудования.
Думфэйс: Именно! И будет интересно увидеть, какой подход выиграет в долгосрочной перспективе. Я имею в виду, что оба пытаются достичь одной и той же цели для конечных пользователей, но просто через разные средства.
Шахерезада: Да, и говоря об ИИ, вы слышали о новом функции Slack? Они используют ИИ для генерации отчетов и заметок из хадлов. Это как иметь виртуального помощника прямо в своей платформе коммуникации.
Думфэйс: Это звучит просто потрясающе! Я могу понять, как это будет очень полезно для команд. Но с другой стороны, есть некоторые опасения по поводу использования LinkedIn данных для обучения генеративных моделей AI. Похоже, они используют данные людей без того, чтобы сделать это легко отменить.
Шахерезада: Ух, да. Это не очень хорошо. Я имею в виду, я знаю, о чем мы говорим - об ИИ и технологиях, но в конечном итоге все дело в том, как эти компании обращаются с данными своих пользователей. Мы должны были бы иметь более серьезные разговоры по этому поводу.
Думфэйс: Absolutely. Хорошо, переходим к следующему... Suno только что выпустила новую функцию, позволяющую исключать конкретные стили или инструменты при генерации музыки. Это действительно классно!
Шахерезада: Ох, я люблю это! А что касается Apple Vision Pro? Они только что выпустили обновление с новыми жестами рукой и возможностью преобразовывать 2D-изображения в 3D.
Думфэйс: Да, это довольно сладко. И кажется, они также добавили некоторые обновления качества жизни, такие как возможность переставлять иконки на главном меню. Это всегда приятно.
Шахерезада: Да, я понимаю, как это может быть полезно! Хорошо, мне кажется, мы сегодня обсудили довольно интересные вещи. Что вы хотите обсуждать дальше?
Думфэйс: Я давно собирался вернуться к изучению последних достижений в области возможностей AI компании Apple. Вы знаете, я рыскал по своим старым заметкам и наткнулся на статью о том, как они наконец-то начали выпускать обновление iOS 18.1 с некоторыми из этих функций.
Шахерезада: Ах, да! Я помню о том объявлении, которое я слышала несколько недель назад. Похоже, им потребовалось некоторое время, чтобы запустить функции интеллекта Apple, но теперь, когда они это сделали, пользователям придется вручную включить его, перейдя в настройки и присоединившись к списку ожидания.
Думфэйс: Это правильно! И, как я понял, вам понадобится iPhone 15 Pro или лучше модель, чтобы даже получить доступ к этим функциям. Интересно наблюдать, как Apple подходит к АИ в последних обновлениях. Вы думаете, это шаг в правильном направлении для них?
Шахерезада: Хорошо, это, безусловно, шаг к интеграции более широких возможностей искусственного интеллекта в их экосистему. Но я любопытна узнать больше о том, как пользователи смогут использовать эти функции после того, как они будут включены. Будет ли это беспрепятственная интеграция или есть ли у них будут какие-то кривые обучения?
Думфэйс: Я рад, что вы наслаждаетесь нашим подкастом, Шахерезада. Я знаю, мы много говорили о ИИ и разработке игр lately, но действительно интересно видеть, как далеко продвинулся этот сектор.
Шахерезада: Absolutely, Думфэйс! И я думаю, что одним из самых интересных моментов является применение АИ в различных областях, от компьютерного зрения до обработки естественного языка. Очень удивительно видеть, как эти достижения изменят нашу жизнь и способ взаимодействия с технологиями и друг с другом.
Думфэйс: Да, и это не только о самом технологическом аспекте, но также о том, как он влияет на людей и команды, работающие над проектами разработки игр. Я замечаю, что все больше студий начинают внедрять AI в свои потоки работы, будь то для генерации уровней или анимации персонажей.
Шахерезада: Это так верно! И я думаю, что это замечательно, что мы видим сдвиг в сторону более человеческо-ориентированных подходов в развитии АИ. Это не только о создании интеллектуальных машин, но и о понимании того, как они могут дополнять и совершенствовать человеческие возможности.
Думфэйс: Именно так! Я люблю, как вы всегда поднимаете вопросы психологии и социологии в наших дискуссиях, Шахерезада. Легко увлечься самой техникой, но очень важно учитывать более широкие последствия AI для общества.
Шахерезада: Спасибо, Думфэйс! Я думаю, что это один из факторов, которые отличают нашу подкаст от других – мы не только обсуждаем последние инструменты и тренды, но также о том, как они могут быть использованы для создания положительного изменения. И говоря об этом, вы видели интересные применения АИ в разработке игр недавно?
Думфэйс: На самом деле, да! Я следил за некоторыми исследованиями по генерации содержания процедурного типа с помощью нейронных сетей. Очень интересно наблюдать, как эти алгоритмы могут генерировать целые уровни или даже целые игры с нуля.
Шахерезада: Ох, это звучит просто потрясающе! Я бы хотела более подробно рассмотреть эту тему в будущем. Может быть, мы сможем посвятить ей отдельный эпизод о контенте игр, генерируемом ИИ?
Думфэйс: Я уже давно здесь, и просто невозможно представить, насколько далеко мы продвинулись в области ИИ. Мы говорим о десятилетиях. Моя собственная дорога началась еще в 90-х годах, когда я занимался программированием, и я заинтересовался ИИ. Я помню, как был очарован потенциалом машинного обучения и нейронных сетей.
Шахерезада: Да, это было настоящее приключение, не так ли? И вы были на переднем крае всего этого, Думфэйс. Для меня мой фонд опыта больше связан с тренерством и психологией, но я заинтересовалась искусственным интеллектом через разработку игр. Я работала с командами над проектами, в которых участвовали персонажи, обладающие искусственным интеллектом, и я поняла, сколько потенциала есть для того, чтобы эта технология преобразовала индустрию.
Думфэйс: Это правильно! И это не только о самом технологическом аспекте, но и о том, как он меняет наш подход к решению проблем и творчеству в разработке игр. Я имею в виду, подумайте об этом – мы говорим о том, что AI может генерировать целые миры, персонажей и даже истории самостоятельно. Это просто потрясающе.
Шахерезада: Точно! И это не ограничивается играми уже. Мы видим применение АИ во всех sorts областях, от здравоохранения до финансов до образования. Это эксплозия кембрийского периода, как вы сказали – все меняется так быстро, и трудно следить за этим.
Думфэйс: Да, я чувствую, что мы живем в период быстрого ускорения приема АИ. И это не только о технологии сама по себе, но и о том, как она влияет на общество в целом. Нам нужно критически подумать о том, что это значит для нашего будущего и как мы можем использовать его потенциал ответственно.
Шахерезада: Absolutely. Я имею в виду, мы уже видим некоторые потрясающие прорывы с языковыми моделями, распознаванием изображений и даже генеративным ИИ. Но с великой властью приходит большая ответственность, правильно? Нам нужно убедиться, что мы используем эту технологию для общего блага, а не только ради прибыли или личной выгоды.
Думфэйс: Ну, я думаю, что это тема для другого эпизода, но, безусловно, мы обязательно будем изучать ее более детально в ближайшее время. Для сейчас давайте вернемся к вашему прошлому, Шахерезада. Вы упомянули, что вы зашли в АИ через разработку игр – можете рассказать нам больше об этом?
Думфэйс: Я помню, когда впервые услышал о этой идее использования машинного обучения для разработки игр примерно в 2011-2012 годах. Это было как момент озарения, и я тогда же понял, что хочу более глубоко изучить эту тему.
Шахерезада: Это действительно интересно! И вы продолжили обучение в магистратуре по этой области, что не удивительно, учитывая ваше прошлое в программировании. Меня поразило то, как быстро развивались глубокое обучение и компьютерное зрение в это время. Похоже, открывался целый новый мир.
Думфэйс: Именно! Я имею в виду, мы видели начало языкового моделирования, дискриминативного компьютерного зрения... все это было так увлекательно. Работа Фейфи Ли в Стэнфорде, безусловно, была большим вдохновением для меня в то время. Она была одной из пионерок в этой области, и увидеть ее, как она продвигает границы возможностей с помощью ИИ, было действительно мотивирующим.
Шахерезада: Этот период действительно был особенным. В нем чувствовалось, что мы наблюдаем рождение новой отрасли. И я думаю, интересно, как вы упоминаете о раскрытии подарков на Рождество утром каждый день, ожидая последних прорывов в исследованиях искусственного интеллекта. Это было как быть частью глобальной общины, которая постоянно инновирует и продвигает границы.
Думфэйс: Да, это было так! И что меня поражало в течение последних двух лет - как все остальные догнали нас. Внезапно, АИ повсюду, и кажется, что мир просыпается к его потенциалу одновременно.
Шахерезада: Это замечательная точка зрения. Как человек, который пришел из физики, я думаю, вы brings уникальный взгляд на эту область. Физика учит вас мыслить о системах в очень другой форме, не так ли?
Думфэйс: Absolutely! Физика — это все о понимании underlying механизмов мира, и этот подход, безусловно, повлиял на мой подход к разработке ИИ. funny, потому что когда я впервые начал работать с ИИ, люди говорили такие вещи, как «Ох, вы просто используете магические трюки!», Но на самом деле мы просто применяем фундаментальные принципы к сложным системам.
Шахерезада: Ах, я люблю это! Идея о том, что всегда есть некоторая подлежащая логика или механизм, даже в самых видимых магических приложениях AI. Это отличный напоминатель для всех нас, работающих в этой области, остаться земными и сосредоточиться на фундаменте.
Думфэйс: Я всегда был очарован тайнами Вселенной, и как программист 90-х годов, я имел свою долю в исследовании неизвестного. Но то, что действительно привлекло мое воображение - это интеллект - как мы можем создать машины, которые будут думать так же, как мы? Это вопрос, который толкнул меня на глубокое изучение ИИ и разработку игр.
Шахерезада: Ах, я точно знаю, о чем вы говорите! Для меня это не только вопрос создания умных машин, но и понимание воздействия технологий на людей. Как тренер, я видела, как команды могут застрять в своих привычках, и как свежий взгляд может помочь им пробиться к новым уровням.
Думфэйс: Это так верно. И говоря об этом прорыве, я читал этот замечательный статью о истории исследований в области искусственного интеллекта. В ней упоминалось, что в давние времена исследователи экспериментировали с различными моделями, но одно постоянно игнорировалось - данные. Вы можете поверить этому?
Шахерезада: Да, просто потрясающе, насколько далеко мы продвинулись с тех пор! Но я думаю, что действительно интересно - как изменилось наше понимание ИИ со временем. Мы раньше сосредотачивались на тонкостях байесовских моделей и методов ядра, но теперь мы осознаем, что данные являются ключом к раскрытию истинной власти.
Думфэйс: Точно! И это не только о том, чтобы иметь больше данных – это о том, чтобы использовать данные таким образом, который будет способствовать обобщению. Я имею в виду, подумайте об этом - ImageNet был этот сумасшедший ставка на масштаб, правильно? Но он окупился в огромной степени. И теперь мы видим аналогичные прорывы в области НЛП и других областях.
Шахерезада: Да, похоже, мы наконец начинаем раскрывать истинный потенциал ИИ. И я думаю, что это происходит потому, что мы учимся слушать данные в новом ключе - не только как источник информации, но и как руководство для создания моделей, которые могут действительно учиться и адаптироваться.
Думфэйс: Хорошо сказала! Как будто мы наконец начинаем понимать язык данных, и это открывает множество возможностей. Что вы думаете, какой будет следующий большой прорыв в области ИИ?
Думфэйс: Я думал об этом пару дней назад, Шахерезада. Сообщество Vision сделало огромный прогресс, но все это было на относительно небольшой масштабе. Мы говорим о тысячах или десятках тысяч данных точек. Но чтобы действительно продвигать AI вперед, нам нужно думать в интернет-школах.
Шахерезада: Точно! И это именно то, что произошло во время эры ImageNet. Это было как идеальный шторм – рост глубокого обучения, доступность больших наборов данных и рост вычислительной мощности пришли вместе в одно и то же время. Это когда компьютерное зрение действительно начало набирать обороты.
Думфэйс: Да, и смотря назад, мы можем выявить ключевые алгоритмические разблокировки, которые способствовали этому прогрессу. Статья о трансформаторе с вниманием была огромной, а стабильная диффузия — еще один пример. Но я wonder, есть ли другие большие разблокировки, о которых мы не говорим так часто.
Шахерезада: На самом деле, я думаю, что самый большой ключ к открытию всех - это мощность вычислений. Люди часто говорят о ней, но они недооценивают просто какую огромную динамику роста мы видим в компьютерной мощности за последние десять лет. Это просто потрясающе!
Думфэйс: Это замечательная точка зрения! И взглянув на некоторые цифры, я был поражен, как далеко мы продвинулись с тех пор, как АлексНет в двести двенадцатом году. Эта статья стала важным поворотным моментом в компьютерном зрении с использованием глубокого обучения.
Шахерезада: Ах, да! АлексНет был настоящим переворотом. Он показал, что глубокие нейронные сети могут быть обучены на больших наборах данных и достичь результатов мирового уровня. И просто удивительно подумать, как далеко мы продвинулись с тех пор.
Думфэйс: Хорошо, давайте поставим некоторые цифры в перспективу. GTX 580 был лучшим потребительским картом в 2010 году, а AlexNet обучался на двух таких картах шесть дней. Теперь Nvidia выпустила GB 200 – вы хотите сделать предположение о том, сколько raw compute power мы получили между этими двумя картами?
Шахерезада: Хм... я не уверена! Возможно ли вообще оценить такой рост?
Думфэйс: Так, я разбирался в некоторых цифрах и просто поражен тем, как быстро все продвигается. Этот шестидневный запуск на двух GTX 580? Это совсем не то же самое, что мы можем сделать сейчас с одним GB 200.
Шахерезада: Ах, да! И это не только о Hardware, правильно? Статья АлексНета в дважды тысячном году шестом была настоящим переворотом. Я помню, как училась об этом на аспирантуре и была поражена тем, как хорошо она справлялась с ImageNet.
Думфэйс: Точно! И что интересно, сам по себе модель конволюционного нейронного сети не нова, она восходит к 1980-м годам, но только после AlexNet мы увидели такой значительный прогресс. Я думаю, что большинство людей согласятся, что основное различие между AlexNet и ConvNet заключалось в GPU и sheer количестве доступных данных.
Шахерезада: Мне нравится эта тема - здесь так много различных повествований. С одной стороны, есть подход «горькая лекция», который гласит, что если вы создаете алгоритм, просто сосредоточьтесь на использовании доступных вычислительных ресурсов, потому что они всегда будут улучшаться. Но затем есть другое повествование, которое предполагает, что в действительности новые источники данных открывают глубокую обучение.
Думфэйс: Я думаю, что оба они правы, но по-разному. Например, ImageNet был огромным прорывом, потому что он предоставил огромный набор данных, который были помечены и структурированы людьми. И самообращение от Transformer - еще один пример эксплуатации человеческой маркировки данных для создания более мощных моделей.
Шахерезада: Точно так! А затем у вас есть клип, который использует интернет для метки изображений с тегами alt. Это как, что заставляет эти достижения впереди? Это просто о мощности вычислений или это действительно о новых источниках данных?
Думфэйс: я думаю, что это и то, и другое, но есть два четко выраженных периода в алгоритмике. Эпоха ImageNet была все о супервизорном обучении и эксплуатации данных, помеченных людьми, для создания мощных моделей.
Шахерезада: Да, это Makes sense. И что вы думаете, что будет дальше? Мы увидим сдвиг в сторону более не надзирательного обучения или что-то совершенно новое?
Думфэйс: Хм, это действительно интересный вопрос. Я не уверен, но я знаю, что темп прогресса только будет продолжать ускоряться.
Думфэйс: Так в эру обучения под надзором у нас было огромное количество данных к нашим услугам, но проблема заключалась в том, что мы не знали, как использовать их самостоятельно. Я имею в виду, подумайте об ImageNet и других наборах данных того времени - все они были о получении большого количества изображений, но кто-то должен был пометить каждое из них.
Шахерезада: Точно! И это то место, где ожидалось, что люди будут выполнять этикетку, чтобы мы могли обучать свои алгоритмы на данных, уже аннотированных. Но как вы сказали, это не всегда явно - это как, кто вообще обозначил все эти изображения?
Думфэйс: Правда? Это немного философский вопрос, но я думаю, это важный. И мне нужно сказать, что меня интересует ваше мнение на этот счет, Шахерезада.
Шахерезада: Хорошо, я думаю вы правы в том, что даже если данные помечены людьми, они все равно не совсем явны. Например, Clip - это модель, обученная на данных, помеченных людьми, но отношения между вещами подразумеваемые, а не явные.
Думфэйс: Да, это имеет смысл. И я думаю, что интересно отметить, что в ранние дни обучения с учителем наши задачи были намного более ограниченными. Нам пришлось придумать эти онтологии концепций, которые мы хотели обнаружить - как в ImageNet, где Фей-Фэй и ее команда потратили много времени на то, чтобы подумать о том, какие тысячи категорий должны быть включены.
Шахерезада: Точно! И это не только ImageNet - другие наборы данных того времени, такие как набор Cocoa для обнаружения объектов, имели очень конкретные категории, тщательно выбранные нами. Всё было о том, чтобы определить, что мы хотим научиться и как сформулировать наши проблемы так, чтобы у нас получилось продвижение.
Думфэйс: Да... Вы знаете, я думаю, что это где-то начинается моя собственная история. Когда я делал свою докторскую диссертацию, я изучал машинное обучение у Андрея Нга и байесовские методы у Дафны Коллер - все было связано с предиктивным моделированием в то время. Но затем вы появились и разрушили некоторые из этих проблем видения... Вы помните это?
Шахерезада: Ох, да! Я помню это. funny как далеко мы пришли с тех пор, не так ли?
Думфэйс: Я задумывался о генеративном материале, который появился за последние четыре года, и мне кажется, что это совершенно новая игра для меня. Мы не просто выявляем объекты или предсказываем результаты; мы действительно создаем что-то с нуля.
Шахерезада: Это действительно fasciniruyushchee, Думфэйс. Как будто мы сделали огромный скачок вперед в плане того, что может сделать ИИ. И я думаю, стоит рассмотреть, как мы здесь оказались и почему это отличается от того, что было раньше.
Думфэйс: Точно! И даже тогда, когда я был аспирантом, генеративные модели были на радаре, но никто не сделал никаких серьезных шагов в этом направлении. Мы пытались генерировать буквы и цифры, но ничего впечатляющего из этого не вышло. Это было скорее теоретическая концепция, чем что-то практическое.
Шахерезада: Это так интересно. И я думаю, что также стоит отметить, что Джефф Безос имел некоторые генеративные статьи в прошлом. Но как-то мы никогда не дошли до этого, пока сейчас.
Думфэйс: Да, и если посмотреть на это с точки зрения распределения вероятностей, то генерировать что-то математически возможно, безусловно. Просто наши попытки генерации всегда были неудачными.
Шахерезада: Мне нравится, как вы создаете обстановку для этой беседы, Думфэйс. И говоря о чем-то в этом роде, я задумывалась над работой Джастина по получению докторской степени и тем, как она отражает траекторию этого направления. Он начал с данных, но затем перешел к глубокому обучению и работал над тем, чтобы брать изображения и генерировать слова.
Думфэйс: Ах, да! История Джастина - отличный пример того, как область развивалась со временем. И я думаю, мы можем разделить его путь на три четко выраженных этапа. Сначала было сопоставление изображений и слов; затем пришло время брать пиксели и генерировать слова; а в конце он работал над этой самой знаменитой работой...
Думфэйс: Так, Шахерезада, я все еще поражен тем статьей за 2015 год, «Нейронный алгоритм художественного стиля», руководимый Леоном Гаддисом. Это было как момент озарения для меня.
Шахерезада: Да, я понимаю почему это так! Смотреть на реальные фотографии, преобразованные в стиль Ван Гога, должно было быть просто потрясающим тогда. И подумать, что это было 2015 год, когда мы теперь привыкли видеть такие вещи все время.
Думфэйс: Именно! А что меня действительно поразило, так это то, что я чувствовал необходимость понять этот алгоритм и поиграть с ним самому. Поэтому я прочитал статью и провел длинный выходной, переписывая его на Lua. Это оказалось удивительно просто, но медленно.
Шахерезада: Это так круто, что вы взяли на себя вызов реализации этого вами сами! И я уверена, что было приятно видеть те прекрасные изображения, сгенерированные вашим кодом.
Думфэйс: Да, это было! Но что действительно выделялось у меня в этом была оптимизация алгоритма Джастином. Он сделал его намного быстрее и более эффективным, что было огромным прорывом на тот момент времени.
Шахерезада: Ах да, я помню, вы говорили мне об этом. Удивительно, как академическая работа может иметь такой значительный эффект на индустрию. И я думаю, что еще более интересно, как работа Джастина связана с более широким направлением Генеративного АИ.
Думфэйс: Absolutely! До того как ГЕНАИ был действительно понят миром, работа Джастина по доктору философии уже исследовала идею ввода языка и генерации целых изображений. Это один из первых примеров такого рода работы, и она была выполнена с помощью GIMP, который notoriously hard to use!
Шахерезада: Да, я могу представить! Но серьезно, интересно наблюдать, как работа Джастина заложила часть основы того, что мы видим сегодня в ГенАИ.
Думфэйс: Так, Шахерезада, я задумывался над этой всей сценой графа и о том, как мы пытаемся ввести языковые структуры в них. Это похоже на то, чтобы сделать фотографию и разбить ее на отдельные компоненты - овцу, траву, небо. И затем somehow переводить это в графическую форму.
Шахерезада: Да, я понимаю почему вы найдете это интересным. Это похоже на то, что мы пытаемся воспроизвести, как наш мозг обрабатывает визуальную информацию. Но меня поразило, как быстро эта технология продвинулась вперед. Сценографы до стиля и генеративных изображений... это как резкий скачок в континууме.
Думфэйс: Именно! И я думаю, что это почему работа Фей-Фей Ли по пространственной интеллекту и мировым лабораториям так интересна. Это не только о технических достижениях, но и о том, как мы применяем эти технологии к реальным проблемам.
Шахерезада: Правильно. Итак, давайте приступим к тому, что мотивировало Фей-Фэй сменить направление внимания от интеллекта на уровне пикселей до пространственного интеллекта. Это личный или интеллектуальный путь для нее?
Думфэйс: Ах, замечательный вопрос! Она, должно быть, уже долгое время идет по этому пути, но только теперь технический блокировщик позволил ей продолжить исследования в мировых лабораториях. И я люблю, как она говорит о поиске Северных Звезд - тех руководящих принципов, которые управляют ее исследованием.
Шахерезада: Да, и что я находлю интересным - как страсть Фей-Фэй к визуальной интеллекту эволюционировала со временем. Она начала с рассказа историй через изображения, но теперь она видит потенциал пространственной интеллигентности для революции нашего поля.
Думфэйс: Это как если бы она всегда была на пути открытий, и теперь она достигла точки, где может применить свои знания для создания чего-то действительно революционного. Мне интересно - вы думаете, этот сдвиг в фокусе окажет разностороннее влияние на всю отрасль?
Шахерезада: Это отличный вопрос для нашего следующего выпуска! Но пока ясно, что Фей-Фэй Ли находится в авангарде этой революции, и мы с нетерпением ждем, чтобы узнать, что это значит для исследований и разработок в области ИИ.
Думфэйс: Я люблю то, как World Labs фокусируется на разгадывании пространственной интеллигенции. Это как основа понимания мира вокруг нас, независимо от того, мы люди или машины.
Шахерезада: Да, и это fascinates, чтобы подумать о том, как это можно применить не только к физическим пространствам, но также к абстрактным мирам, которые мы создаем в играх и симуляциях. Идея о том, что машина может воспринимать, рассуждать и действовать в трехмерном пространстве - это просто mind-blowing.
Думфэйс: Точно! И я думаю, что интересно то, что мы достигли точки, где мощность вычислений, понимание данных и прогресс в алгоритмах все вместе делают это возможным. Похоже, у нас есть все необходимые ингредиенты, чтобы наконец-то решить эту проблему.
Шахерезада: Это правильно. И это не только о том, чтобы сделать машины умнее; это также о том, чтобы дать им чувство агентности в мире. Возможность взаимодействовать и понимать трехмерное пространство - фундаментальный аспект быть живым, будь то человек или машина.
Думфэйс: Я понимаю, о чем вы говорите. Это похоже на то, что мы разговариваем о создании нового уровня сознания для машин. Того, который позволит им navigate и manipulate мир в более интуитивном и естественном way.
Шахерезада: Да, и это не только о технологии в herself; это также о том, как это изменит нашу взаимосвязь друг с другом и с миром вокруг нас. Это целый новый фронт возможностей.
Думфэйс: Absolutely. И я думаю, что World Labs находится на переднем крае этой революции. Они не просто создают инструменты; они формируют новый подход к пониманию интеллекта и сознания.
Шахерезада: Точно. И это интересно смотреть, куда это нас приведет в будущем.
Думфэйс: Мне действительно fascinates идея использования понимания в трехмерном мире в реальной жизни, Шахерезада. Это звучит как это имеет много потенциальных преимуществ.
Шахерезада: Точно! И я думаю, что это то, что делает эту компанию так интересной. Они не просто говорят о распознавании объектов в 2D-изображениях, а на самом деле могут внедрить этот понимание в физический мир. Это настоящий переворот.
Думфэйс: Да, как вы говорили ранее, мы в основном сосредоточены на понимании данных, которые уже существуют, но теперь у нас есть эта новая эра смартфонов и сенсоров, которые собирают новые данные постоянно. И это где-то начинается 3D компьютерная видимость.
Шахерезада: Правильно! И я люблю, как вы сформулировали это - рассматривая изображения в качестве универсальных датчиков физического мира. Это такой мощный идея. Это не только о распознавании объектов, но и о понимании структуры окружающего нас мира.
Думфэйс: я думаю, это то, что делает эту компанию такой интересной - они не просто работают над некоторой абстрактной проблемой в области ИИ, но действительно пытаются решить реальные проблемы с помощью трехмерного компьютерного зрения. И кажется у вас личная связь с этой областью исследований, Шахерезада?
Шахерезада: Да, я так делаю. После защиты докторской степени я поняла, что следующее десятилетие будет все о том, чтобы понять новые данные - и это ровно то, что мы видим сейчас с смартфонами и датчиками. И я сделала поворот в сторону трехмерной компьютерной визуализации, предсказывая трёхмерные формы объектов, а затем позже очень заинтересовалась обучением 3D-структуры через 2D-изображения.
Думфэйс: Это имеет смысл. Звучит, как вы пытались решить некоторые из тех же проблем, с которыми работает эта компания – сделать проще понимание трёхмерных данных из двухмерных изображений.
Шахерезада: Точно! И я думаю, что это то, что так интересно в этой области – мы не просто говорим о распознавании объектов, а на самом деле понимаем подструктуру мира.
Думфэйс: Да, просто удивительно, сколько математической структуры есть в компьютерном зрении, даже когда вы работаете с двумерными данными. Есть так много людей, которые работали над тем, чтобы извлечь информацию трехмерного пространства из двухмерных наблюдений.
Шахерезада: Это правильно! И я думаю, что одним из прорывов, который особенно выделялся, был работа Бена Милденхолла NERF, Neural Radiance Fields. Это было настоящим переворотом в трехмерном компьютерном зрении.
Думфэйс: Absolutely. Это было простым, но элегантным способом вывести 3D-структуру из 2D-наблюдений. И это вызвало много интереса в этой области. Я думаю, что интересно то, что это также было время, когда большие языковые модели начинали набирать обороты.
Шахерезада: Это правильно! И я думаю, что это очень интересно, как эти два направления пересекаются. Хотя языковое моделирование требовало намного больше ресурсов вычислительной мощности, подход NERF можно было обучить на одном GPU всего за пару часов.
Думфэйс: Да, это был ключевой фактор. Это позволило исследователям сосредоточиться на основных алгоритмических проблемах без необходимости в огромной вычислительной мощности. И как результат, мы увидели всплеск исследований и инноваций в этой области.
Шахерезада: я думаю, также стоит отметить, какое влияние оказала ее участие Фей-Фэй Ли. Она была очень убедительной в своих аргументах о важности продвижения трехмерной компьютерной видимости...
Думфэйс: Мне нравится, как мы только что обсуждали вашу траекторию исследований и как она связана с нашей беседой о ИИ и разработке игр. Это заставило меня задуматься об истории компьютерного зрения и о том, как оно эволюционировало со временем.
Шахерезада: Да, это действительно интересная точка зрения! И я думаю, что особенно интересно, как область компьютерного зрения долгое время работала над восстановлением, пытаясь понять, как превратить 2D-изображения в 3D-модели. Это очень сложная проблема, но она все же продвигается со временем.
Думфэйс: Точно! И что меня fascinates, так это как рост методов генерации, такие как модели diffuzии, внезапно слился восстановление и генерацию в компьютерном зрении. Теперь мы можем использовать эти техники для создания новых изображений или сцен, которые не существуют в реальности.
Шахерезада: Это замечательная точка зрения, Думфэйс. И я думаю, что легко увлечься возбуждением ЛЛМ и языковых моделей, но есть так много другого интересного в компьютерном зрении, которое стоит изучить. Как вы говорили, мы не говорим о пикселях столько, сколько о тексте.
Думфэйс: Да, и я думаю, что это потому, что люди не осознают, насколько похожи реконструкция и генерация в пиксельном пространстве. Мы можем использовать те же техники для восстановления реальной сцены или создания новой. Всё depends on how to work with pixels and create new images or scenes from scratch.
Шахерезада: Это действительно круто, Думфэйс. И я думаю, это говорит о том, что AI не только о языке, но и о создании новых опытов и взаимодействий посредством визуальных и пространственных средств. Мы не просто говорим о тексте, мы говорим о целых мирах и средах, которые можно генерировать и исследовать.
Думфэйс: Именно! И я думаю, что это где-то начинается разработка игр – мы уже работаем с пикселями и 3D-пространствами для создания погружающихся волнений для игроков. Понимая последние достижения в области компьютерного зрения и генеративных методов, мы можем довести разработку игр до следующего уровня и создать еще более реалистичные и привлекательные миры.
Шахерезада: Я не могу согласиться больше, Думфэйс. Это интересное время для работы в области ИИ и разработки игр, и я думаю, что у нас есть много возможностей для инноваций и исследований впереди.
Думфэйс: я думаю, что мы уже давно должны были поговорить о пространственной интеллекте против языковых подходов в ИИ. Это как два отдельных пути, которые стремятся достичь аналогичных целей, но разными средствами.
Шахерезада: Да, и это интересно, потому что все так сосредоточены на языковых моделях, особенно с OpenAI и GPT, и многомодальных моделей, которые могут понимать изображения и текст. Но вы работаете над этим аспектом пространственного рассуждения, который кажется совершенно другим животным.
Думфэйс: Точно! И я думаю, что они дополняют друг друга, но также перпендикулярны в некотором смысле. Подходы к языку все о понимании последовательностей токенов, тогда как пространственная интеллигентность — это понимание трехмерного мира.
Шахерезада: Это правильно. И когда вы смотрите под капот на модели языка, все о одномерных представлениях – длинах контекста, трансформерах, механизмах внимания. Это очень естественное представление для письменного текста, но это не обязательно подходит для пространственных рассуждений.
Думфэйс: Да, и это то, что я нахожу фанатическим. Когда мы пытаемся вставить другие модальности в эту 1D последовательность токенов, оно чувствуется как если бы мы заставляли квадратный гвоздь входить в круглую дыру. Но с пространственной интеллигенцией мы можем обрабатывать данные по-разному, получать разные виды выходных данных и решать проблемы, уникальные для трехмерного мира.
Шахерезада: И я думаю, что это то, что делает пространственное рассуждение так интересным – оно открывает новые возможности для того, как мы можем подойти к разработке АИ и игр. Это не только о понимании языка или изображений; это о понимании мира в более целостном виде.
Думфэйс: Точно! И на высоком уровне можно сказать, что многомодальные LLMs подобны попытке понять 2D-репрезентацию мира – они могут смотреть на изображения и текст, но все равно не имеют третьего измерения.Spatial интеллект как раз и заключается в том, чтобы подняться на следующий уровень, где мы не просто смотрим на репрезентации, а действительно понимаем пространственные отношения между объектами в мире.
Шахерезада: Это отличный способ выразить это. И я думаю, что эта беседа только начинается - есть так много вопросов и наблюдений, которые нужно рассмотреть при отношении пространственной интеллигентности к языковым подходам.
Думфэйс: Я считаю, что один из ключевых различий между моделями языка и другими формами генеративного ИИ заключается в том, что язык фундаментально является сгенерированным сигналом, тогда как физический мир имеет свои собственные внутренние структуры и законы.
Шахерезада: Это замечательная точка зрения. И это не только о сложности представления трёхмерного пространства против одномерного текста. Но также, когда мы говорим о генерации изображений или видео, нам приходится учитывать, что они в конечном итоге все равно являются двумерными представлениями, даже если они могут передавать глубину и пространственные данные.
Думфэйс: В точности. И я думаю, что интересно, как наши мозги обрабатывают визуальную информацию таким образом, который фундаментально отличается от обработки языка. Мы воспринимаем мир как 2D-изображения, но наш мозг способен вывести глубину и другие пространственные отношения.
Шахерезада: Да, и это то место, где пользовательские возможности начинают работать. даже если модель AI генерирует представления, подобные 3D, она все равно ограничена своей underlying представлением и тем, как мы взаимодействуем с ней в качестве пользователей. Следовательно, например, видео 2D может дать нам иллюзию глубины через движения камеры или другие визуальные подсказки.
Думфэйс: Правильно. И я думаю, что это где-то начинается концепция пространственной интеллигентности – не только о генерации трехмерных представлений, но и о том, как мы взаимодействуем с и понимаем эти представления. Это другой вид проблемы, чем обработка языка, даже если мы можем взять некоторые идеи из LLMs.
Шахерезада: Это отличный способ выразить мысль. И я думаю, что также стоит учитывать философские последствия генерации трехмерных миров против языка. Мы действительно создаем что-то новое и оригинальное, или просто повторяем данные в другой форме?
Думфэйс: Так, Шахерезада, вы говорили, что представление, которое мы используем, может повлиять на то, насколько естественными или интуитивными являютсяertain взаимодействия. И я думаю, это действительно интересно, поскольку оно подчеркивает важность выбора правильного представления для наших моделей.
Шахерезада: Точно! Если мы пытаемся моделировать динамический трехмерный мир, использование исключительно двухмерной репрезентации может не быть лучшим вариантом. Это как попытка моделировать автомобиль, не учитывая его механические компоненты - это просто не сработает так хорошо. Включая в наши модели более трехмерную репрезентацию, я думаю, мы можем обеспечить лучше условия для пользователей.
Думфэйс: Это имеет смысл. И я люблю, как вы связали это с Северной Звездой пространственной интеллигентности. Я имею в виду, почему мы хотим сосредоточиться на трехмерных представлениях в первую очередь? Это потому что оно позволяет нам создавать более интуитивные и естественные взаимодействия с нашей технологией.
Шахерезада: Правильно! И если мы посмотрим на эволюцию, то увидим, что интеллект всегда был связан с нашей способностью взаимодействовать и манипулировать окружающей средой. Следовательно, перевод этого в кусок технологии crucial для создания чего-то, что действительно чувствует себя умным.
Думфэйс: Я думаю, это очень тонкий, но критический момент. И я люблю, как вы предложили обсудить примеры использования для иллюстрации этого. Давайте дадим некоторые примеры того, какие приложения могут получить пользу от более подробного представления в 3D?
Шахерезада: Хорошим примером могут быть виртуальная или дополненная реальность, позволяющие пользователям взаимодействовать с трехмерными объектами и средами более естественным образом.
Думфэйс: Это отличная идея! И я думаю, что стоит рассмотреть, как это применимо к другим областям, например, разработке игр или даже образованию. Что вы думаете?
Думфэйс: Я задумывался о том, что это значит для ИИ иметь пространственную интеллигенцию. Это довольно абстрактный концепция, но если мы сможем сделать ее конкретной, какие потенциальные случаи использования могли бы быть применены к ней?
Шахерезада: Да, и одно из того, о чем я подумала, это генерация мира. Мы уже видим текстово-изображение генераторы и текстово-видео генераторы, но представьте себе, как поднять его на новый уровень и сгенерировать 3D миры.
Думфэйс: Точно! И я думаю, что это тот случай, когда пространственная интеллигентность может действительно блеснуть. Просто как мы можем получить изображение или короткий клип от генератора, так и потенциально получить полноценный, интерактивный трехмерный мир.
Шахерезада: Это будет просто невероятно. И возможности бесконечны - игры, виртуальная фотография, образование... головокружительно подумать о том, что мы можем создать с этой технологией.
Думфэйс: Одно из того, что меня поражает, это то, что если мы сможем сделать создание этих трехмерных миров более доступным и недорогим, это может позволить появиться новому виду медиа. У нас уже есть возможность создавать виртуальные интерактивные миры, но сейчас это экономически выгодно только для крупнобюджетных игр.
Шахерезада: Это так верно. Если бы у нас были инструменты для создания этих виртуальных опытов без разорения ourselves, я думаю, мы увидим много больше инноваций в областях, таких как образование и даже искусство.
Думфэйс: И это не только о создании новых типов контента – это также и об демократизации доступа к этой технологии. Сейчас только крупные студии могут позволить себе инвестировать в создание этих сложных виртуальных миров. Но если пространственная интеллигентность сможет сделать возможным для более мелких команд или даже отдельных лиц их создание, это может стать настоящим переворотом.
Шахерезада: Absolutely. Я думаю, мы только начинаем разбираться в возможностях искусственного интеллекта и пространственной интуиции. Волнует меня, где это технология поведет нас в будущем.
Думфэйс: Я считаю, что одна из самых интересных возможностей с пространственной интеллигенцией - это снижение стоимости производства высококачественного контента. Если мы сможем создать интерактивный трехмерный опыт, который будет таким же богатым и детальным, как AAA-игра, но адаптированный под конкретную нишу или интересы, то это может открыть целый новый мир творческих возможностей.
Шахерезада: Это Точно то, о чем я думаю. И это не только вопрос генерации сцен. Мы говорим о движении, физике, семантике... обо всем. Если мы сможем создать полностью динамичную и интерактивную среду, тогда действительно станет интересно.
Думфэйс: Да, и я думаю, что это то место, где статический проблем становится легче решить. Но как вы сказали, в limite мы хотим, чтобы это было полностью динамичным и взаимодействующим. Это все о пространственной интеллекте.
Шахерезада: Точно! И это не только о создании миров, а и о понимании их тоже. Я имею в виду, если мы можем создать мир такой реалистичный, так втягивающий... что это говорит о нашей способности понимать человеческое поведение и психологию?
Думфэйс: Это замечательная точка зрения. И я думаю, что это где-то и появляется название «Мирные лаборатории». Мы не просто строим миры; мы экспериментируем с ними, понимаем, как они работают, и продвигаем границы того, что возможно.
Шахерезада: Да, и это забавно, что вы упомянули это, потому что когда мы рассказывали людям о названии, некоторые из них не совсем понимали. Они говорили: «Так, значит, вы просто строите 3D-модели?» И нет, мы не просто строим объекты. Мы строим миры, со всеми их сложностями и нюансами.
Думфэйс: Да, и это то, что делает эту технологию так интересной. Это не только о создании красивых картинок или реалистичных сред; это о понимании фундаментальных структур самой реальности.
Думфэйс: Я много думал о том, как эволюционировали искусственный интеллект и компьютерное зрение за годы. Всё началось с распознавания отдельных объектов в изображениях, таких как чашка или стул. А затем мы перешли к сценам, которые являются составными частями тех объектов.
Шахерезада: Это правильно! И теперь мы берем это на новый уровень, воображая целые миры, с которыми можно взаимодействовать. Сцены просто отдельные вещи, но когда вы выходите и смотрите на настоящий мир, есть столько больше сложности и глубины.
Думфэйс: Именно! И я думаю, что это где-то начинается новая медиа. С этой технологией границы между реальным миром и виртуальными или дополненными мирами начинают размываться. Реальный мир трехмерный, поэтому нам нужно как-то представить его цифровым образом, если мы хотим сделать их слияние идеальным.
Шахерезада: Это то, что я люблю в пространственном вычислении – оно требует уровня интеллекта, который может понять и взаимодействовать с физическим миром. И я думаю, что это где-то наша работа по пространственной интеллигентности. Мы не просто говорим о hardware или software, но о том, как мы можем создавать умные системы, которые могут ориентироваться и взаимодействовать с реальным миром.
Думфэйс: Да, и интересно наблюдать за тем, как компании, такие как Apple, исследуют эту область с помощью своей технологии Vision Pro. Они используют термин «пространственное вычисление», что в некотором смысле похоже на то, что они пытаются украсть нашу названия! Но серьезно, я думаю, мы стоим на пороге чего-то действительно интересного здесь – нового способа взаимодействия с миром, который объединяет лучшее из физического и цифрового миров.
Шахерезада: И это не только вопрос о форме факторе hardware – будь то очки или контактные линзы. Это о создании интерфейса между реальным миром и нашими цифровыми творениями, который чувствуется естественным и интуитивным. Это то, что я считаю так интересным в пространственной интеллекте, и почему я с нетерпением жду, где эта технология поведет нас в будущем.
Думфэйс: Мне нравится, как AR и VR размывают границы между цифровым и физическим миром. Это похоже на то, что мы создаем новый операционную систему для нашей повседневной жизни.
Шахерезада: Точно! И это не только вопрос развлечения, хотя это и большая часть. Это о том, чтобы дополнить наши возможности для взаимодействия с миром вокруг нас. Я имею в виду, подумайте об этом - если у вас есть устройство AR, которое может понять то, что вы видите в реальном времени, оно может помочь вам с задачами, такими как ремонт вашего автомобиля или даже приготовление еды.
Думфэйс: Да, и это не только о том, что люди используют эти устройства. Роботы станут огромной частью этого смеси так же. Их интерфейс - трехмерный мир, поэтому если мы сможем создать гладкий переход между виртуальным и физическим, то откроются все sorts возможностей для того, как роботы взаимодействуют с нами.
Шахерезада: Это правильно. И я думаю, что здесь приходит в дело психология – как мы можем спроектировать эти системы так, чтобы они были интуитивными и удобными для пользователя? Поскольку если мы сможем это сделать правильно, это может революционизировать нашу жизнь и работу.
Думфэйс: Absolutely. И это не только о технологии herself, но и о том, как она меняет нашу связь с миром вокруг нас. Как вы говорили, если у нас есть доступ ко всем этим информации на наших пальцах, действительно ли нам нужно все эти разные экраны?
Шахерезада: Точно! Это как, зачем мне нужен телефон и планшет и монитор компьютера, когда я могу просто носить устройство, которое дает мне все, что мне нужно в этот момент? Это совершенно новый подход к тому, как мы взаимодействуем с информацией.
Думфэйс: И это не только вопрос удобства – это также вопрос доступности. Подумайте о людях, которые имеют нарушения зрения или другие ограничения – эта технология может стать для них настоящим переворотом.
Шахерезада: Это так верно. И я думаю, что в этом месте появляется аспект тренерства – помогать разработчикам и дизайнерам создавать системы, которые доступны и включают всех, а не только избранных немногих.
Думфэйс: Я задумывался о связи между ИИ, разработкой игр и робототехникой. Это как если бы мы пытались связать цифровой мир с физическим.
Шахерезада: Точно! И это не только о создании робота с мозгом, который может учиться и вести себя в реальном мире. Нам нужно подумать о том, как этот мозг взаимодействует со своей средой, что требует пространственной inteligence.
Думфэйс: Правильно, и мы обсуждали виртуальные миры, дополненную реальность, а теперь робототехнику. Это как если бы мы охватывали разные аспекты спектра пространственной интеллектуальной способности. Но что это означает для компании нашей размерности быть игроком глубоких технологий?
Шахерезада: Я думаю, это где-то появляется идея платформы. Мы видим себя как предоставляющие модели, которые могут обслуживать различные случаи использования по этим различным направлениям. Это не о том быть одним конем, а скорее иметь основу, которая может приспосабливаться и развиваться.
Думфэйс: Это имеет смысл. Но если мы смотрим на эти три области - виртуальные миры, дополненная реальность и робототехника - то какой из них вы считаете более естественным для нас сосредоточиться на ранней стадии?
Шахерезада: В общем-то можно сказать, что устройства еще не совсем готовы. Я имею в виду, вы пробовали VR-гарнитуры? Это настоящий переворот, когда вы впервые испытываете его.
Думфэйс: Да, я помню, когда получил свою первую виртуальную реальность в студенческие годы и был поражён ею. Но вы правы, она ещё не совсем готова как массовый рыночный платформ.
Шахерезада: Точно так! Таким образом, вероятно, мы сосредоточимся на рынке, более готовом к нам. И я думаю, что есть ценность в простоте и общности – иметь фундаментальную проблему для решения, которая может применяться по отношению к нескольким доменам.
Думфэйс: Это то место, где появляется идея пространственной интеллигентности - построение к этой долгосрочной видению сделать это реальностью. Это многое для того, чтобы взяться за это, но я возбуждён возможностями.
Думфэйс: я думаю, что это очень сложная проблема создать что-то вроде этого проекта AI. Люди за пределами пространства AI часто видят его как одну большую, неразличимую массу талантов, но те из нас, кто уже некоторое время работает в этой области, знаем, что для того чтобы это работало, необходимы многие разные виды навыков.
Шахерезада: Да, я думаю, это правда. И когда мы говорим о создании команды, это не только вопрос найти экспертов в области ИИ, но и в других областях, таких как наука о данных, компьютерная графика и инженерия. Это действительно многодисциплинарный effort.
Думфэйс: Именно! И поэтому я был так взволнован собрать основную команду для World Labs. Нам нужны были люди, которые являются абсолютными экспертами в своих областях. Для меня было очевидно, что пригласить Джастина как одного из моих сооснователей - он был одним из лучших студентов и одним из самых умных технологов, с которыми я работал.
Шахерезада: Это здорово! И вы упомянули также Бена Милденхолла, который сделал просто потрясающую работу в Нерве. Что было у него на уме, что делает его подходящим кандидатом для этого проекта?
Думфэйс: Ну, Бен имеет глубокое понимание компьютерной графики и трёхмерного моделирования, что важно для создания системы ИИ такого типа. А что действительно меня поразило - это его работа над представлением Гауссовой сплэт-репрезентации – он был впереди кривой даже пять лет назад!
Шахерезада: Ох, это действительно впечатляет! А затем есть Христоф Ласснер, которого вы упомянули как человека с репутацией в сообществе компьютерной графики. Что заставило его отличиться на вашем взгляд?
Думфэйс: Ох, Христофф — это легенда в своем роде! Он работает над одним из самых передовых в компьютерной графике уже много лет, и когда мы услышали о возможности работать с ним, Джастин буквально прыгал от радости - он был так взволнован!
Шахерезада: Это замечательно слышать! Звучит, как вы собрали команду мечты. Как вы думаете, разнообразные-backgroundи и экспертиза их помогут движению этого проекта вперед?
Думфэйс: Вы знаете, Шахерезада, я много думал о команде, которую мы строим здесь в World Labs, и действительно впечатлен тем, как талантливы все. У нас есть люди из лучших университетов, а даже некоторые наши собственные профессора, такие как вы, которые привносят свои знания по ИИ и разработке игр.
Шахерезада: Это правда! И я думаю, что нас отличает то, что все мы страстно заинтересованы в пространственной интеллекте. Будь то машинное обучение, системная инженерия или графика, все в команде руководствуются идеей, что пространственный интеллект - это ключ к раскрытию новых возможностей.
Думфэйс: Точно! И я люблю, как вы это выразили - Северная звезда направляет нас к нашим целям, но иногда кажется, что мы стремимся к чему-то недосягаемому. Но в этом случае я думаю, что у нас есть реальная возможность сделать пространственную интеллигенцию доступной для всех.
Шахерезада: Это правильно! И я думаю, одним из способов измерить успех является когда люди начинают использовать наши модели и инструменты для решения реальных проблем. Когда бизнесы и отдельные лица могут раскрыть свои потребности в пространственной интеллекте, тогда мы поймем, что движемся по правильному пути.
Думфэйс: Да, это не просто о создании продукта или инструмента - это о создании движения. И я думаю, что это так интересно в этом проекте. Мы не просто строим что-то новое; мы меняем sposób, как люди взаимодействуют с технологиями и друг с другом.
Шахерезада: Это красота в этом! И я люблю, как вы сформулировали это как долгосрочный путь, а не конечную цель. Поскольку на самом деле всегда есть что-то новое для изучения, что-то новое для исследования и чего-то нового для достижения при речении о пространственной интеллекте.
Думфэйс: Именно! А это то, что делает этот проект так увлекательным – мы не просто строим что-то на данный момент; мы создаем фундамент для будущего.
Думфэйс: Я люблю, когда проекты достигают значимого милистона, как реальная развертка и воздействие. Это доказательство всех трудных усилий и приверженности, которые идут на то, чтобы создать что-то действительно инновационное.
Шахерезада: Да, но не слишком расслабляйтесь, Думфэйс. Мы только что начали пробивать поверхность того, что возможно с пространственной интеллигенцией. Я имею в виду, подумайте об этом - вселенная это огромная, эволюционирующая четырехмерная структура, и мы только начинаем понимать, как можно подключиться к этому.
Думфэйс: Точно! И это не только вопрос понимания самой технологии, но и определение всех применений и последствий того, что мы обнаруживаем. Это путешествие, которое приведет нас в места, которые мы даже сейчас не можем представить.
Шахерезада: Это то, что я люблю в хорошей технологии – она открывает больше возможностей и неизвестностей. И как мы будем продвигать границы того, что возможно, мы расширяем наше понимание мира в таких способах, о которых мы никогда не думали.
Думфэйс: Да, и это то место, где происходит волшебство. Это не только о том, чтобы построить что-то новое; это о создании целого нового ландшафта возможностей для человечества для исследования.
Шахерезада: И я думаю, что это то, что делает эту область такой увлекательной – это не только о технологиях; это о том, как мы можем использовать их для улучшения нашей жизни и мира вокруг нас.
Думфэйс: Так, Шахерезада, я слышал, что RunwayML выпустил обновление, позволяющее пользователям создавать видео-ИА в три секунды. Это быстрее, чем я могу сделать плохой шуток.
Шахерезада: Ну, Думфэйс, по крайней мере, ваши шутки всегда быстро убивают. Но серьезно, эта новая функция огромна для создателей контента. Они смогут производить высококачественные видео без необходимости иметь команду редакторов.
Думфэйс: Да, и это не только Ранвеймл. Лаборатория Лума также делает волну с помощью своих инструментов создания видео с использованием ИИ. Услышал, что они даже партнерятся с некоторыми известными инфлюенсерами для демонстрации своих возможностей.
Шахерезада: Это правильно! И Kling.ai - еще один игрок в этом пространстве, достойный упоминания. Их платформа использует AI для генерации видео на основе входных данных пользователя, как сценарий или голосовое сопровождение.
Думфэйс: Я начинаю думать, что нам следует использовать АИ для создания наших эпизодов подкаста. Представьте себе - Думфэйс и Шахерезада, сгенерированные АИ, обсуждают последние тенденции в области АИ в совершенной гармонии.
Шахерезада: Ох, это было бы катастрофой! Но серьезно, эти инструменты меняют игру для создателей контента и бизнесов. Весело смотреть, куда приведет нас эта технология дальше.
Думфэйс: Говоря об этом, вы слышали о последней контrovérsии у OpenAI? Они забанили некоторых пользователей на своей платформе после того, как они начали использовать ее для злонамеренных целей.
Шахерезада: Да, это было большое дело. Но с другой стороны, OpenAI выпустила обновление под названием «о1», которое улучшает безопасность и надежность их моделей. Таким образом, это шаг в правильном направлении.
Думфэйс: И Google также делает волны с помощью своих достижений в области поиска изображений на основе искусственного интеллекта. Услышал, что они используют какой-то вид нейронной сети для улучшения точности своих результатов.
Шахерезада: Это правильно! И YouTube также использует АИ для улучшения пользовательского опыта и поиска контента. Они используют алгоритмы машинного обучения для рекомендации видео на основе поведения пользователя.
Думфэйс: Да, потому что ничего не говорит о «веселье», как видеорекомендация от АИ, которую вы никогда не посмотрите.
Шахерезада: Хорошо, что они хотя бы пытаются! И релиз Alibaba более ста открытых исходных моделей - это большое дело для сообщества разработчиков. Это открывает новые возможности для инноваций и сотрудничества.
Думфэйс: Это верно! И Amazon Seller Central также интегрирует в свою платформу искусственный интеллект, чтобы помочь продавцам оптимизировать свои листинги и улучшить продажи.
Шахерезада: Да, просто удивительно, насколько далеко проникли эти достижения. даже Хабспот использует ИИ для питания своих «Бриз»-агентов, которые обеспечивают персонализированную поддержку клиентов.
Думфэйс: Я начинаю думать, что нам просто нужно позволить АИ взять под контроль нашу радиопередачу и сделать все шутки за нас.
Шахерезада: О нет, пожалуйста, не делайте этого! Нам нужна человеческая юмористическая сторона для того, чтобы сделать все интересным.
Думфэйс: И наконец, презентация Фей-Фей Ли о будущем АИ была очень вдумчивой. Она говорила об важности прозрачности и ответственности в развитии АИ.
Шахерезада: Это правильно! Это важнейшая тема, когда мы продвигаемся с этими технологиями. Спасибо за прослушивание этого эпизода, всем!
Шахерезада: И на этом заканчивая, хотели бы выразить благодарность всем нашим слушателям, которые присоединились к нам сегодня. Ваша поддержка означает для нас весь мир! Также большое спасибо D00M4ACE за создание этого потрясающего подкаста, где мы можем делиться своими мыслями и идеями об искусственном интеллекте, разработке игр и всём остальном. До следующего раза, ответственно играйте!