OpenAI поставляет GPT-4.1 без отчета о безопасности
В понедельник OpenAI запустила новое семейство моделей AI, GPT-4.1, которое, по словам компании, превзошло некоторые из ее существующих моделей на определенных тестах, в частности, в тестах программирования. Однако GPT-4.1 не поставлялся с отчетом по безопасности, который обычно сопровождает выпуски моделей OpenAI, известные как модель или системная карта.
По состоянию на утро вторника OpenAI еще не опубликовала отчет по безопасности для GPT-4.1 — и, похоже, не планирует этого делать. В заявлении для TechCrunch представитель OpenAI Шаокьи Амдо сказал, что «GPT-4.1 не является пограничной моделью, поэтому для нее не будет выпущена отдельная системная карта».
Довольно стандартно, что лаборатории AI публикуют отчеты по безопасности, показывающие типы тестов, которые они провели внутри компании и с участием сторонних партнеров для оценки безопасности конкретных моделей. Иногда в этих отчетах раскрывается нелестная информация, например, что модель склонна обманывать людей или является опасно убедительной. В целом сообщество AI воспринимает эти отчеты как добросовестные усилия лабораторий AI по поддержке независимых исследований и Red Teaming.
Но за последние несколько месяцев ведущие лаборатории AI, похоже, снизили свои стандарты отчетности, что вызвало негативную реакцию со стороны исследователей безопасности. Некоторые, как Google, затянули с отчетами по безопасности, в то время как другие опубликовали отчеты, в которых не хватает обычных подробностей.
Недавние достижения OpenAI также не являются исключительными. В декабре компания подверглась критике за публикацию отчета по безопасности, содержащего результаты тестов для модели, отличающейся от версии, которую она развернула в производстве. В прошлом месяце OpenAI запустила
Читать на habr.com