У ИИ-подрядчиков Mercor украли 4 ТБ голосовых сэмплов
Группа вымогателей группировки Lapsus$ опубликовала на своём сайте утечек данные компании Mercor, которые включают 4 ТБ голосовых образцов от 40 000 подрядчиков, занимающихся разработкой ИИ.
Утечка содержит биометрические данные голоса в сочетании с удостоверением личности, выданным государством. Согласно индексу утёкших образцов, архив охватывает более 40 000 подрядчиков, которые зарегистрировались для разметки данных, записи отрывков для чтения и проведения проверочных звонков для обучения ИИ.
В течение десяти дней после публикации было подано пять исков от подрядчиков. Истцы утверждают, что компания собирала голосовые отпечатки под видом «обучающих данных», не уточняя, что они также являются постоянным биометрическим идентификатором.
Отмечается, что в Mercor при приёме на работу подрядчика запрашивали скан паспорта или водительского удостоверения, затем селфи с веб-камеры, а также запись голоса, читающего заученные фразы в тихой комнате.
В феврале 2026 года издание Wall Street Journal сообщило, что для высококачественного клонирования голоса теперь требуется примерно 15 секунд чистого эталонного аудио в случае с инструментами, доступными «из коробки». При этом записи Mercor в среднем содержат от двух до пяти минут студийной чистой речи на одного подрядчика.
Полученные данные потенциально позволяют хакерам обходить банковскую верификацию, организовывать вишинг (голосовой фишинг) работодателя жертвы, проводить видеозвонки с использованием технологии дипфейков, а также организовывать иные схемы мошенничества.
Тем, кто мог пострадать от утечки Mercor, рекомендуют:
провести автоаудит своего публичного аудиоследа. Поискать на YouTube, в каталогах подкастов и старых записях Zoom образцы своего голоса, которые можно
Читать на habr.com