



Мира Мурати и её стратегия в Thinking Machines Lab: от универсального ИИ к специализированным решениям
В Thinking Machines Lab бывший технический директор OpenAI Мира Мурати использует более целенаправленный подход к моделям ИИ. Вместо того чтобы стремиться к созданию универсального сверхразума, она считает, что создание индивидуального ИИ для конкретных бизнес-задач более ценно.
Согласно The Information, новая компания Мурати, Thinking Machines Lab (TML), специализируется на разработке моделей ИИ, адаптированных к основным бизнес-показателям клиента. Цель состоит в том, чтобы предложить специализированные решения для таких отраслей, как обслуживание клиентов, инвестиционный банкинг и розничная торговля, — модели ИИ, разработанные для достижения измеримых бизнес-результатов и продаваемые по высокой цене.
Сообщается, что в основе стратегии TML лежит обучение с подкреплением, при котором модели вознаграждаются за достижение поставленных целей и наказываются за ошибки. Инвесторы начали называть это «RL для бизнеса». Этот метод лежит в основе так называемых моделей рассуждений, таких как OpenAI o1.
Такой акцент на обучении с подкреплением для специализированных приложений соответствует рекомендациям исследователя OpenAI Рохана Панди, который назвал парадигму LLM-RL особенно перспективной для стартапов в сфере вертикального ИИ. Обучение с подкреплением позволяет добиться глубокой специализации, что даже OpenAI с трудом удается масштабировать. В конце 2024 года OpenAI представила собственный интерфейс для разработчиков, позволяющий проводить тонкую настройку с подкреплением (RFT), но доступ к этому методу по-прежнему ограничен несколькими партнерами.
Что касается технической стороны, The Information сообщает, что TML объединяет слои нейронной сети из ряда моделей с открытым исходным кодом — процесс, аналогичный слиянию
Читать на habr.com