ИТМО провёл исследование open source в сферах машинного обучения и анализа данных
Специалисты центра «Сильный ИИ в промышленности» при ИТМО опубликовали результаты исследования особенностей и направления развития опенсорс-сообщества в сфере машинного обучения и анализа данных в России. В лидерах российского опенсорса оказались «Яндекс», Сбер и Т-Банк.
Исследование состояло из двух частей, сообщают в ИТМО. В первой части авторы проанализировали использование опенсорс-решений в России и выяснили, что почти все компании ориентируются как на отечественный, так и на международный рынок. Пользователи же выбирают решения по их эффективности, не обращая внимания на страну происхождения разработчика.
Опросив экспертов рынка и проанализировав данные с GitHub и PyPI, исследователи составили топ-5 проектов в различных категориях: ML и алгоритмы, математика, инфраструктура, визуализация бизнеса, хранение данных и MLOps. Топ решений выглядит так:
ML и алгоритмы:
CatBoost
LightAutoML
PyTorch
Scikit-learn
TensorFlow
Математика:
NumPy
Optuna
SciPy
Theano
Statsmodels
Инфраструктура:
YTsaurus
Spark
Hadoop
Pandas
Caffe
Визуализация и BI:
Metabase
Superset
DataLens
Matplotlib
Plotly
Хранение данных:
MongoDB
Tarantool
PostgreSQL
ClickHouse
YDB
MLOps:
LangChain
Kubeflow
MLflow
WandB
GigaChain
Вторая часть исследования была посвящена определению лидеров в опенсорс-сообществе среди российских компаний-разработчиков. Авторы учли несколько критериев: количество опенсорс-проектов в тематических категориях, их использование в России, качество репозиториев, число контрибьюторов и их активность. По большинству показателей лидирует «Яндекс», за ним следуют Сбер и Т-Банк. В десятку также вошли Postgres Pro, VK, «Авито», Evrone, МТС, Selectel и ведущие университеты, включая сам ИТМО.
«”Яндекс”
Читать на habr.com
