Об этом же в других СМИ

habr.com / 1 год назад

Meta* назначает бывшего директора Google DeepMind руководителем своей исследовательской лаборатории AI

habr.com / 1 год назад

Google запускает «скрытое кэширование», чтобы сделать доступ к своим новейшим моделям AI дешевле

habr.com / 1 год назад

Генеральный директор Instacart Фиджи Симо присоединяется к OpenAI

habr.com / 1 год назад

Anthropic запускает API для веб-поиска на базе AI

habr.com / 1 год назад

Apple и Anthropic объединяются для создания платформы кодирования AI

Больше по теме

28.04.2025 - 12:26 / habr.com

Генеральный директор Anthropic хочет «открыть черный ящик» моделей AI к 2027 году

Генеральный директор Anthropic Дарио Амодеи опубликовал в четверг статью, в которой подчеркивается, как мало исследователи понимают внутреннюю работу ведущих в мире моделей AI. Чтобы решить эту проблему, Амодеи поставил перед Anthropic амбициозную цель — надежно обнаруживать большинство проблем моделей AI к 2027 году.

Амодей осознает предстоящую задачу. В статье «The Urgency of Interpretability» генеральный директор говорит, что Anthropic совершила первые прорывы в отслеживании того, как модели приходят к своим ответам, — но подчеркивает, что для расшифровки этих систем, которые становятся все более мощными, необходимо гораздо больше исследований.

«Я очень обеспокоен развертыванием таких систем без лучшего управления интерпретируемостью», — написал Амодей в своем эссе.

«Эти системы будут абсолютно центральными для экономики, технологий и национальной безопасности и будут способны на такую большую автономность, что я считаю в принципе неприемлемым для человечества полностью игнорировать то, как они работают».

Anthropic — одна из пионеров в области механистической интерпретируемости, области, которая стремится открыть черный ящик моделей AI и понять, почему они принимают те или иные решения. Несмотря на быстрое улучшение производительности моделей AI в технологической отрасли, мы все еще имеем относительно мало представления о том, как эти системы принимают решения.

Например, OpenAI недавно запустила новые модели рассуждений AI, o3 и o4-mini, которые лучше справляются с некоторыми задачами, но и галлюцинируют больше, чем другие модели. Компания не знает, почему это происходит.

«Когда генеративная система AI что-то делает, например, резюмирует финансовый документ, мы не имеем ни малейшего представления на конкретном или

технологии экономика общество законопроект google dilnaz04

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Новая небольшая модель искусственного интеллекта Ai2 превосходит аналогичные по размеру модели от Google и Meta* habr.com / 1 год назад

Meta* прогнозирует, что к 2035 году выручка от генеративного AI составит $1,4 трлн habr.com / 1 год назад

LM Arena обвиняют в предоставлении «избранным» AI-компаниям несправедливых преимуществ при тестировании моделей habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

22.07 / 01:44

люди экономика общество климат вода Тарифы за воду вырастут в два раза – прогноз ученых из Стэнфорда

Специалисты Стэнфорда разработали модель для оценки стоимости водоснабжения. Программа учитывает поведение потребителей и климатические угрозы.

22.07 / 01:02

LG Шоу бизнес Телевизоры LG OLED evo 2026 года получат новый режим изображения Creator Original: как он повлияет на просмотр контента

Компания LG Electronics анонсировала новый режим изображения Creator Original, который появится на отдельных моделях телевизоров LG OLED evo 2026 года. Его создали в сотрудничестве с Prime Video, чтобы киностудии и создатели контента могли точнее настраивать отображение своих фильмов и сериалов на совместимых телевизорах.

22.07 / 00:25

здоровье общество самит психология психика Фразы, которые произносит только искренне любящий муж

Мужчина, который искренне уважает свою жену, обычно говорит о ней 7 приятных вещей.

22.07 / 00:18

общество Meta Threads вводит новые функции родительского контроля: что нужно знать пользователям

Компания Meta объявила о запуске функции Parental Supervision в социальной сети Threads. Она станет доступной в США уже на следующей неделе и позволит родителям и опекунам контролировать использование платформы подростками через сервис Family Center. Нововведение расширяет возможности уже существующих Teen Accounts, которые автоматически имеют повышенный уровень защиты.

21.07 / 23:24

люди алкоголь общество самит мозг 5 привычек людей, которые не умеют расслабляться без алкоголя

Ловушка дофамина: что на самом деле происходит с мозгом, когда вы глушите усталость алкоголем.

21.07 / 23:24

продукты общество человек врачи сон Продукты, которые могут испортить сон, назвали врачи

Даже полезные на первый взгляд продукты, съеденные вечером, могут нарушить сон, вызвать ночные пробуждения и ухудшить самочувствие.

21.07 / 22:06

люди ученые наука история общество Снимки на орбите: как прошел первый рентген человека в космосе

Главным неудобством в невесомости стало правильное позиционирование тела. Фиксировать человека без гравитации оказалось затруднительно.

21.07 / 21:53

технологии Apple история самит журналист Apple готовит крупнейший iPhone в истории: юбилейная модель может получить почти 7-дюймовый экран

О новой разработке сообщил известный китайский инсайдер Digital Chat Station. Пока речь идет лишь о внутреннем прототипе, поэтому окончательные характеристики устройства могут измениться до официальной презентации.

21.07 / 20:35

технологии Nvidia общество Обновление Nvidia App позволит некоторым игрокам записывать игровой процесс со скоростью 240 кадров в секунду

Nvidia выпустила версию 11.0.8 приложения Nvidia App. Обновление добавляет возможность записи видео через ShadowPlay с частотой 240 кадров в секунду, новые опции отображения в панели управления, а также поддержку функций DLSS Override и «Оптимальные настройки» (Optimal Settings) для большого списка игр.

21.07 / 20:35

технологии общество предприятия жертва стартап Уязвимость в Zoom для Windows 11 позволяет хакерам удалённо захватить учётную запись жертвы

Zoom выпустила экстренное обновление безопасности после раскрытия информации о критической уязвимости в своих приложениях для Windows. Хотя компания не предоставила технических подробностей об этой ошибке, она подтвердила, что успешная её эксплуатация может позволить неавторизованному злоумышленнику захватить контроль над учётной записью через интернет.

Лента новостей

На главную страницу