RAG, self-hosting, обучение и оптимизация LLM – 25 докладов про генеративный AI на Conversations 6 декабря
Conversations – ежегодная конференция по разговорному и генеративному AI для бизнеса и разработчиков. В этом году 6 декабря в Москве и онлайн – save the date!
В этом году участников Conversations ждут несколько тематических секций: «Generation AI. Новое поколение кейсов», «RAG или не RAG? Трезвый взгляд разработчиков», «Self-hosting. Обучение и оптимизация генеративных моделей», две дискуссии в бизнес- и технотреке, выставка AI-решений и, как всегда, мощный нетворкинг.
В программе конференции – аналитика, кейсы, погружение в разработку AI-решений от Timeweb, Альфа-Банка, Ozon, Дом.ру, Т-Банк, Северсталь, Fabula AI, Авито, Ecom.tech и других компаний. 1 день, 2 сцены, 35+ спикеров – не пропусти! Подробности докладов и промокод на билеты внутри.
LLM в действии: как с помощью чат-бота автоматизировать SQL-запросы и получать актуальную аналитику за минуты, а не дни? Расскажут Арнольд Сааков и Ирина Дворянинова из Ecom.tech. Вы узнаете, как устроен аналитический бот, и какие задачи решаются с помощью LLM text2sql и text2text. Также ребята поделятся процессом ресерча и тестирования open-source моделей: какие метрики важны, и что помогло команде Ecom.tech выбрать лучшую модель.
Как за месяц создать свою LLM на базе опенсорса и вывести в прод? С опорой на реальные кейсы расскажет Вадим Данильченко, Ozon. И ответит на самые актуальные вопросы: какую модель выбрать, если у вас ограничены ресурсы? Где брать данные для fine-tuning? Как снизить требования к VRAM и ускорить обучение? Что обязательно нужно учесть при оценке результатов? Какой фреймворк выбрать для вывода модели в прод? Как запустить 5+ проектов на одной LLM?
Билингвальные голосовые боты от A до Ў: как работает ASR-движок, как поменять язык в риалтайме и обучать
Читать на habr.com
