
Исследователи открыли Sky-T1, модель AI с «рассуждающими» возможностями
Модели AI с возможностями рассуждения становятся все проще и дешевле в разработке. В пятницу команда NovaSky из лаборатории Sky Computing Lab Калифорнийского университета в Беркли выпустила Sky-T1-32B-Preview, модель рассуждения, которая конкурентоспособна с ранней версией o1 от OpenAI по ряду ключевых показателей. Sky-T1, по всей видимости, является первой по-настоящему открытой моделью рассуждения в том смысле, что её можно воспроизвести с нуля. Команда опубликовала набор данных, использованных для её обучения, а также необходимый код для обучения.
«Удивительно, Sky-T1-32B-Preview была обучена менее чем за $450, что демонстрирует, что возможно воспроизвести высокоуровневые возможности рассуждения экономично и эффективно»,- написала команда в блоге.
$450 может показаться не таким уж доступным, но не так давно цена обучения модели с сопоставимой производительностью часто колебалась в пределах миллионов долларов. Синтетические обучающие данные, то есть данные, сгенерированные другими моделями, помогли снизить затраты. Palmyra X 004, модель, недавно выпущенная компанией Writer, которая занимается AI, была обучена почти исключительно на синтетических данных и, как сообщается, её разработка обошлась примерно в $700,000.
В отличие от большинства AI, модели рассуждения эффективно проверяют факты самостоятельно, что помогает им избегать некоторых подводных камней, которые обычно мешают моделям. Модели рассуждения требуют немного больше времени — обычно на несколько секунд или минут дольше — для нахождения решений по сравнению с типичной нерешающей моделью. Преимущество в том, что они, как правило, более надёжны в таких областях, как физика, наука и математика.
Команда NovaSky заявляет, что использовала другую модель рассуждения,
Читать на habr.com

