Об этом же в других СМИ

cursorinfo.co.il / 1 год назад

Из-за мощной солнечной бури Земле угрожают отключения света и связи

habr.com / 1 год назад

DeepSeek утверждает, что его модель рассуждений превосходит o1 от OpenAI по некоторым показателям

udf.name / 1 год назад

В США запустили самый мощный суперкомпьютер в мире

habr.com / 1 год назад

OpenAI разработала языковую модель для проектирования белков и превращения клеток в стволовые

cursorinfo.co.il / 1 год назад

Кофе становится роскошью: арабика бьет рекорды по стоимости

Больше по теме

04.01.2025 - 06:12 / habr.com

Deepseek V3 становится самой мощной открытой языковой моделью в Китае на сегодня

Китайская компания Deepseek только что выпустила свою самую мощную языковую модель. Первые тесты показывают, что новая модель V3 может конкурировать с ведущими проприетарными моделями в отрасли и демонстрирует значительное улучшение в задачах логического мышления.

Модель, доступная на Github, использует архитектуру Mixture-of-Experts (MoE) с общим количеством параметров 671 миллиард, из которых 37 миллиардов активируются для каждого токена. Это значительное увеличение по сравнению с V2, которая имеет 236 миллиардов параметров, из которых 21 миллиард активен во время вывода.

Обучение также было более обширным, обработав 14.8 триллионов токенов — почти вдвое больше данных, чем в V2. По данным Deepseek, полное обучение заняло 2.788 миллиона часов на H800 GPU и стоило примерно $5.576 миллионов.

Особенно впечатляет то, что они достигли этого результата, используя кластер всего из 2,000 GPU — это лишь малая часть из 100,000 графических карт, которые компании, такие как xAI и OpenAI, обычно используют для обучения AI. Deepseek объясняет эту эффективность оптимизированным совместным проектированием алгоритмов, фреймворков и аппаратного обеспечения. Одним из самых больших улучшений V3 является его скорость — он может обрабатывать 60 токенов в секунду, что в три раза быстрее, чем его предшественник.

Команда сосредоточилась на улучшении мышления, используя специальный процесс пост-обучения, который использовал данные из их модели "Deepseek-R1", специально разработанной для сложных задач логического мышления. При тестировании на фоне как открытых, так и проприетарных моделей он достиг наивысших результатов в трех из шести основных бенчмарков LLM, с особенно сильными показателями на бенчмарке MATH 500 (90.2%) и тестах программирования,

общество самит крипто токен dilnaz04 eps Китай

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Новая модель искусственного интеллекта «Тitans» от Google обеспечивает долговременную память языковых моделей habr.com / 1 год назад

DeepSeek запустила «думающую» ИИ-модель R1 — как o1 от OpenAI, только бесплатно itc.ua / 1 год назад

MiniMax представляет AI-модели с самой большой длиной контекста для агентов с «долговременной памятью» habr.com / 1 год назад

Сайт vsenovosti.life - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

15.07 / 03:17

общество рубль В России запускают производство печатных плат для принтеров

В России начнётся производство печатных плат для принтеров. К осени 2026 года контрактный производитель электроники «Цифровые телевизионные системы» (ЦТС, входит в GS Group) поставит 50 тысяч российских высоковольтных плат и плат питания для производителя печатной техники «Катюша». Это будет первая партия после запуска производства. Об этом сообщило издание «Ведомости» со ссылкой на коммерческого директора ЦТС Егора Макеева и управляющего директора ГК «Катюша» Дмитрия Владимирова.

15.07 / 03:17

общество крипто токен Релиз пакетного менеджера NPM 12.0, в новой версии по умолчанию прекращён запуск скриптов во время установки пакетов

8 июля 2026 года состоялся выпуск пакетного менеджера NPM 12.0. Это решение входит в поставку Node.js и применяется для распространения модулей на языке JavaScript. Новая версия проекта примечательна прекращением по умолчанию запуска скриптов во время установки пакетов. Это изменение должно усложнить проведение атак через компрометацию зависимостей и замедлить распространение червей, активируемых из установочных скриптов.

15.07 / 02:27

продукты здоровье Здоровье и красота питание кулинария Ужин, который остановит старение, назвали эксперты

Полезный ужин может быть еще и очень вкусным, говорят специалисты и рассказывают, что нужно есть для молодости и хорошего самочувствия.

15.07 / 01:22

люди ученые наука история общество Археологи обнаружили пещеру с доисторическими рисунками (ФОТО)

Международная группа исследователей совершила крупное открытие на востоке страны. На стенах скрытого грота ученые нашли около сотни древних фигур.

15.07 / 00:31

медицина люди общество лечение медики Война с прыщами: 5 ошибок, которые навсегда испортят вашу кожу

Специалист объяснила, почему попытки пересушить кожу агрессивными средствами приводят к обратному эффекту и вызывают тяжелые воспаления.

14.07 / 23:23

общество семья отдых человек врачи Привычки, которые незаметно разрушают сердце, назвали врачи

Обычные действия, которые многие считают безобидными, способны со временем серьезно навредить сердцу.

14.07 / 23:23

животные общество природа самит биологи Кашалоты общаются с помощью двух разных диалектов

Крупные морские биологи опубликовали отчет об акустических исследованиях в Европе. Ученые выявили четкие различия в сигналах млекопитающих.

14.07 / 22:14

технологии Apple прогноз журналист предприятия Поставщики Apple завершили подготовку к производству iPhone 20

В новой публикации инсайдер сообщил, что для юбилейной модели Apple выбрала концепцию «возвращения к стеклу». По его словам, качество изготовления устройства должно соответствовать уровню первого поколения iPhone Air.

14.07 / 22:06

продукты медицина люди здоровье общество Почему эксперты просят избегать солнцезащитных спреев

Эксперты выяснили, что популярные аэрозоли могут вредить здоровью. Узнайте, какие три опасных компонента не должны быть указаны на упаковке вашей косметики.

14.07 / 21:13

происшествия люди общество самит животный мир Живут в каждом доме: действительно ли пауки-сенокосцы смертельно ядовиты

Пауки-сенокосцы встречаются по всему миру, населяя разнообразные среды и в частности жилища людей. Они имеют длинные, тонкие лапки, благодаря которым они кажутся намного больше, чем есть на самом деле. Однако с их ядом не все так просто.

Лента новостей

На главную страницу