Новые открытые LLM-программы от OpenAI уже доступны
В 2019 году, впервые после GPT-2, OpenAI выпускает новые модели языка с открытым весом. Это важная веха для компании, которую всё чаще обвиняют в отказ от Первоначальная миссия проекта — «предоставить преимущества искусственного интеллекта всему человечеству». Теперь, после многочисленных задержек, связанных с дополнительным тестированием безопасности и доработками, gpt-oss-120b и gpt-oss-20b доступны для загрузки с сайта Hugging Face.
Прежде чем продолжить, стоит пояснить, чем именно занимается OpenAI. Компания не выпускает новые модели с открытым исходным кодом, включающие базовый код и данные, которые использовались для их обучения. Вместо этого она делится весовыми коэффициентами (то есть числовыми значениями, которые модели научились присваивать входным данным в процессе обучения), которые используются новыми системами. По словам Бенджамина С. Ли, профессора инженерии и информатики Пенсильванского университета, модели с открытыми весовыми коэффициентами и модели с открытым исходным кодом служат двум совершенно разным целям.
«Модель с открытыми весами предоставляет значения, полученные в ходе обучения большой языковой модели, и, по сути, позволяет использовать эту модель и дорабатывать её. Вы можете использовать модель «из коробки» или переопределить или модифицировать её для конкретного приложения, настроив веса по своему усмотрению», — сказал он. Если коммерческие модели — это абсолютный чёрный ящик, а система с открытым исходным кодом допускает полную настройку и модификацию, то ИИ с открытыми весами находится где-то посередине.
OpenAI не выпускает модели с открытым исходным кодом, вероятно, потому, что конкурент может использовать данные для обучения и код для реверс-инжиниринга своей технологии. «Модель с
Читать на hitechexpert.top
