
Новый запуск курса Natural Language Processing
Этой весной сообщество Open Data Science и компания MTS AI делают новый запуск курса по обработке естественного языка. Вот страница нашего курса. Для того, чтобы его пройти, нужно зарегистрироваться.
Всем привет! Мы делаем новый запуск курса Natural Language Processing. Курс состоит из основных 10 занятий, посвященных разным ключевым темам NLP. Если кратко:
Закон Ципфа;
TF-IDF;
Word2Vec;
RNN;
CNN;
Transformer.
Это набор инструментов, но конечно мы рассмотрим и задачи - классификации текста, тэггирования, генерации, включая само собой всеми любимый машинный перевод. Каждое занятие будет состоять из лекции и семинара. Полный список тем можно посмотреть на странице курса.
В этом запуске мы посвятим больше времени большим языковым моделям (LLM). Про ChatGPT в наше время не слышал только ленивый, но про него можно рассказать только слухи, поэтому я расскажу об открытых моделях, таких как Llama и Mistral, а на семинаре можно будет поработать с этими моделями.
Также в курсе будет два задания, одно на вышеупомянутый Word2Vec, одно в виде соревнования наподобие тех, что проводят на платформе Kaggle. Оба задания были недавно обновлены и, надеюсь, стали более интересными. Помимо 10 основных занятий, будет еще две (или как получится) гостевых лекции, посвященные связанным с NLP темам от специалистов в этих темах. В прошлые запуски курса были лекции про обработку и генерацию речи, информационному поиску, графам знаний.
Лекции и семинары будут онлайн. После каждой лекции будет квиз. Сдача заданий и квизов будет происходить на платформе ODS. Самое важное, на мой взгляд, что большую часть курса составляет создание собственного проекта. Проект - это произведение одного или нескольких людей, которые делают одну программу, модель машинного обучения
Читать на habr.com

