Google собирает в три раза больше данных об искусственном интеллекте OpenAI благодаря своей монополии в сфере поиска
Данные Cloudflare показывают, что сочетание поиска Google и сканирования с помощью искусственного интеллекта даёт компании огромное преимущество в плане данных перед OpenAI и Anthropic.
Генеральный директор Cloudflare Мэтью Принс утверждает, что Google получает выгоду от необычайно привилегированного уровня доступа к интернету благодаря тому, как поисковый робот связан с системами сбора данных для искусственного интеллекта.
По словам Принса, внутренние измерения Cloudflare показывают, что в настоящее время Google просматривает в 3,2 раза больше страниц, чем OpenAI. Разница ещё больше, если сравнивать с другими конкурентами: Google просматривает в 4,6 раза больше контента, чем Microsoft, и в 4,8 раза больше, чем Anthropic. По мнению Принса, этот дисбаланс связан с решением Google объединить поискового робота с роботом для ИИ. Владельцы сайтов не могут заблокировать обучение ИИ, не исчезнув при этом из поисковой системы Google, что создаёт дилемму, которая фактически дает Google эксклюзивный доступ к огромным объёмам данных.
Принс рассматривает это как злоупотребление давним доминированием на рынке, предполагая, что поведение Google позволяет компании распространить свою историческую монополию на развивающуюся сферу искусственного интеллекта.
Масштаб дисбаланса становится более очевидным, если посмотреть, насколько агрессивно владельцы сайтов пытаются дать отпор. С 1 июля Cloudflare уже заблокировала 416 миллиардов запросов ИИ для своих клиентов. Эти блокировки в основном затрагивают компании, которые следуют стандартам или идентифицируют своих краулеров отдельно. Однако Google обходит этот барьер благодаря тесному взаимодействию своих поисковых систем и ИИ.
Перед издателями стоит дилемма: разрешить использовать свой контент
Читать на habr.com