Об этом же в других СМИ

habr.com / 2 месяца назад

Anthropic купила стартап, на котором держатся SDK конкурентов — и сворачивает его продукты

habr.com / 2 месяца назад

Microsoft отзывает у внутренних команд лицензии Claude Code и переводит разработчиков на GitHub Copilot CLI

habr.com / 2 месяца назад

Эксперимент по переписыванию проекта Bun с Zig на Rust при помощи ИИ-ассистента Claude Code признали успешным

gagadget.com / 2 месяца назад

Мальта раздаёт ChatGPT Plus: как островное государство решило подсадить граждан на ИИ

habr.com / 2 месяца назад

С 15 июня у подписчиков Claude появится отдельный ежемесячный кредит на API

Больше по теме

06.05.2026 - 08:02 / habr.com

Архив, на котором учились ChatGPT, Claude и DeepSeek, попал под атаку 20 крупных издателей

29 апреля News/Media Alliance — ассоциация крупнейших издателей США — отправила формальное письмо некоммерческому фонду Common Crawl с требованием закрыть его архив для обучения AI и удалить из него контент входящих в ассоциацию 20 медиа. Среди подписавших — NBCUniversal, CNN, USA Today, Vox Media, McClatchy, Boston Globe Media. Парадокс в том, что под удар попала не AI-компания, а некоммерческий архив открытого веба, на котором за 17 лет существования обучились почти все главные LLM — от GPT-3 до Claude и DeepSeek.

Common Crawl основан в 2008 году. Каждый месяц фонд скачивает и архивирует открытый веб — десятки петабайт данных, выложенных в публичный доступ на Amazon S3. Изначально это делалось для исследователей и историков, но фактически именно из этого архива почти все большие LLM получили базовый корпус — например, он составляет до 60% знаний GPT-3. Тот же механизм превратил Common Crawl в обходной путь для AI-компаний: издатель блокирует у себя ботов OpenAI и Anthropic — формально защитился, но Common Crawl уже собрал у себя копии. AI-компания берет нужное из архива, без прямого контакта с CNN или NYT. В ноябре 2025 года расследование The Atlantic показало, что в архиве оказывался даже контент за пейволлом.

В письме, адресованном директору Common Crawl Ричу Скренте, NMA выдвинула четыре требования: удалять контент по запросу, публично заявить, что фонд не разрешает использовать архив для AI-обучения, изменить правила использования и явно запретить такое использование, добавить в реестр отказов (opt-out registry) прямое предупреждение для пользователей. Ранее NMA уже воевала с обходчиками пейволлов, а ее президент Даниэль Коффи последовательно отстаивает позицию: бесплатный доступ к контенту через любую прокладку —

Amazon президент расследование симптомы runawayllm eps США Boston

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Главный критик LLM почти похвалил Claude Mythos. Почти habr.com / 2 месяца назад

В США чиновники резали гранты через ChatGPT. Потом сделали бота крайним в суде habr.com / 2 месяца назад

DeepSeek V4 силен только в «своих» бенчмарках. На независимых — отстает на 8 месяцев habr.com / 2 месяца назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

21.07 / 20:35

технологии Nvidia общество Обновление Nvidia App позволит некоторым игрокам записывать игровой процесс со скоростью 240 кадров в секунду

Nvidia выпустила версию 11.0.8 приложения Nvidia App. Обновление добавляет возможность записи видео через ShadowPlay с частотой 240 кадров в секунду, новые опции отображения в панели управления, а также поддержку функций DLSS Override и «Оптимальные настройки» (Optimal Settings) для большого списка игр.

21.07 / 20:35

технологии общество предприятия жертва стартап Уязвимость в Zoom для Windows 11 позволяет хакерам удалённо захватить учётную запись жертвы

Zoom выпустила экстренное обновление безопасности после раскрытия информации о критической уязвимости в своих приложениях для Windows. Хотя компания не предоставила технических подробностей об этой ошибке, она подтвердила, что успешная её эксплуатация может позволить неавторизованному злоумышленнику захватить контроль над учётной записью через интернет.

21.07 / 20:05

технологии люди Apple журналист Нет денег на iPhone или Mac? — Apple даст их в лизинг: Марк Гурман сообщил о скором запуске платформы Apple Upgrade

Для многих людей принципиально важно обладать новеньким iPhone или MacBook, но с каждым годом это становится все дороже. Вскоре после того, как Apple подняла цены на многие свои гаджеты и намекнула на дальнейший рост, компания готовится предоставить покупателям новый способ приобретения своих товаров.

21.07 / 19:57

продукты продукты питания общество отдых отпуск Опасный шведский стол – от чего лучше отказаться утром

Отдых по системе «все включено» манит изобилием блюд. Однако диетолог предупреждает об опасности некоторых утренних продуктов.

21.07 / 19:57

история Мусульмане tiktok Вышла замуж после одной встречи и едет в Афганистан – история из сети

Блогерша активно делится планами переезда в Кабул в социальной сети. Подписчики умоляют ее отказаться от опасной и безумной затеи.

21.07 / 19:14

продукты Apple общество Apple попросила бывших сотрудников из OpenAI сохранять потенциально важные документы и сообщения

Apple направила юридические уведомления с требованием сохранить документы и переписку десяткам своих бывших сотрудников, перешедших в OpenAI. Эти меры принимаются в рамках продолжающегося судебного разбирательства, касающегося незаконного использования коммерческой тайны.

21.07 / 19:14

Вышел открытый браузерный эмулятор телефонов Nokia 3310/3410/3350/3330/5110/5210/7110

Представлен открытый проект браузерного эмулятора для телефонов Nokia моделей 3310/3410/3350/3330/5110/5210/7110. Исходный код решения написан на C и JavaScript и опубликован (проект Nokia DCT3 Emulator) на GitHub под лицензией GNU General Public License v2.0.

21.07 / 19:09

Samsung технологии промышленность общество предприятия Samsung запускает масштабный проект в робототехнике: компанию ждет переход к «умным» заводам и гуманоидным роботам

Samsung Electronics официально объявила о создании нового подразделения Robotics eXperience (RX) Business Promotion Office, которое займется развитием робототехники и искусственного интеллекта. Возглавит направление генеральный директор мобильного подразделения компании Тэ Мун Ро (TM Roh), что подчеркивает стратегическую важность проекта для южнокорейского гиганта.

21.07 / 18:57

технологии Представлен открытый проект FSearch — утилита для быстрого поиска файлов

Разработчик Кристиан Боксдорфер представил открытый проект под названием FSearch (аналог проекта Everything для Windows). Это решение представляет собой небольшую утилиту для быстрого поиска файлов. Исходный код FSearch написан на C и опубликован на GitHub под лицензией GNU General Public License v2.0.

21.07 / 18:47

происшествия семья смерть больница актер Сердце актера остановилось на семь минут – он признался, что "увидел"

Мужчина находился в состоянии комы целый месяц после инцидента. Он подробно рассказал о том, что происходило с ним в "потустороннем мире".

Лента новостей

На главную страницу