



Алгоритм CatBoost от «Яндекса» вошёл в топ инструментов машинного обучения в мире
Алгоритм CatBoost от «Яндекса» вошёл в число наиболее широко используемых инструментов машинного обучения в академических исследованиях по версии американского издания Marktechpost. Доклад ML Global Impact Report 2025 охватывает исследования из 125 стран и подчёркивает ведущую роль США и Китая в области машинного обучения. Российская разработка попала в узкую группу из пяти неамериканских технологий, наиболее часто упоминаемых в научных исследованиях мира. Помимо CatBoost в этот список вошли Scikit‑learn из Франции, AlphaFold из Великобритании, U‑Net из Германии, а также GAN и RNN из Канады.
Авторы отчёта отмечают, что 90% инструментов машинного обучения с открытым исходным кодом разработаны в США. Эти инструменты включают многие основополагающие мировые фреймворки для обработки изображений, геномики и экологии. Китай при этом лидирует по числу публикаций. На долю Китая приходится 43% всех статей, посвящённых машинному обучению, или 2,1 тысячи публикаций в 2025 году.
CatBoost используется в каждой 30-й статье с применением машинного обучения. Алгоритм применяют учёные из 51 страны, включая США, Китай, Саудовскую Аравию. Например, на долю США приходится 13% статей с использованием CatBoost. У американских аналогов схожие показатели: XGBoost имеет 15%, классический Gradient Boosting Model — 12%, а LightGBM от Microsoft — 10%.
Инструмент CatBoost разработан изначально для задач поиска «Яндекса» и на декабрь 2025 года применяется в разных сервисах компании. Алгоритм используется в «Погоде», «Директе», «Маркете», «Музыке» и других продуктах. В открытый доступ его выложили в 2017 году. Основная причина популярности заключается в том, что большинство практических задач машинного обучения опираются на табличные данные. CatBoost
Читать на habr.com