

ИИ может столкнуться с дефицитом данных с 2026 г. по 2032 г
Развитие искусственного интеллекта, особенно чат-ботов, подобных ChatGPT, может столкнуться с серьезным препятствием уже в ближайшем будущем: в период с 2026 г. по 2032 г. технологическим компаниям может не хватить человеческого текста для обучения языковых моделей.
Тамай Бесироглу, один из авторов исследования, описывает эту ситуацию как своеобразную "золотую лихорадку" в сфере искусственного интеллекта. Подобно истощению природных ресурсов во время золотой лихорадки, запасы доступных текстовых данных, созданных человеком, могут иссякнуть, что способно существенно затормозить прогресс в развитии ИИ.
Технологические гиганты, такие как OpenAI и Google, ведут активную борьбу за высококачественные данные, необходимые для обучения своих языковых моделей. Они заключают крупные сделки с платформами, подобным Reddit, и различными новостными агентствами, стремясь получить доступ к обширным массивам текстовой информации.
Однако эксперты предупреждают: в будущем потока новых блогов, новостных статей и комментариев в социальных сетях может оказаться недостаточно, чтобы удовлетворить растущие потребности ИИ.
Это ставит перед разработчиками сложный выбор: использовать конфиденциальные данные, например, личные переписки, что порождает серьезные этические и юридические проблемы, или обратиться к синтетическим данным, созданными самими чат-ботами. Но этот путь чреват снижением качества и точности работы систем искусственного интеллекта.
Первоначально эксперты предсказывали, что острый дефицит высококачественных текстовых данных для обучения ИИ наступит уже к 2026 году. Хотя разработчики и научились эффективнее использовать имеющуюся информацию, проблема не решена, а лишь отложена на ближайшие 2-8 лет.
Обучение искусственного интеллекта на
Читать на habr.com
