

Как Google DeepMind меняет реальность: от умных очков до создания целых миров за секунды
Недавно в эфире 60 Minutes (CBS News) вышел подробный репортаж о прорывных разработках Google DeepMind в сфере ИИ. Корреспондент Скотт Пелли протестировал сразу несколько по‑настоящему впечатляющих технологий — от «умных очков» Astra до моделей, мгновенно создающих интерактивные 3D‑миры в том числе для обучения роботов. Давайте посмотрим, как это работает и чем все это может быть полезно.
Astra - это ИИ‑ассистент, подключенный к камере и микрофонам на специальных очках. Astra распознает объекты, читает эмоции и даже придумывает истории о том, что видит. На видео видно, как журналист надел очки и спросил: «Что это за здание?» — и услышал: «Это Coal Drops Yard, торгово‑развлекательный район». В галерее Astra узнала картину Эдварда Хоппера «Автомат». На вопрос об эмоциях героини ИИ ответил, что она «задумчива и одинока», а затем придумал короткий рассказ о ее мыслях и чувствах. В интервью глава DeepMind Демис Хассабис признался, что не ожидал, насколько быстро ИИ‑системы смогут так уверенно понимать физический мир.
Еще два года назад демо‑версия модели DeepMind создавала размазанные ролики по тексту вроде «золотистый ретривер с крыльями». В новом Veo 2 при более подробном описании получился почти что фильм: четко прорисованный щенок с прозрачными перистыми крыльями, бегущий по цветущему лугу, с солнечными бликами на перьях.
Пару примеров видео, созданных Veo 2:
Главный сюрприз показа — модель Genie 2, которая на основе одной статичной картинки строит интерактивную трёхмерную локацию. Сотрудник DeepMind загрузил фото водопада в Калифорнии. Genie 2 сгенерировала из него видео от первого лица: сперва вы стоите у края водопада, а затем ИИ «домысливает» дальше — появляются новые скалы, деревья и пейзажи за горизонтом. В другом
Читать на habr.com