Grammarly створила перший анотований GEC-корпус української мови і виклала його у відкритий доступ
Компанія Grammarly, яка розробляє онлайн-сервіс на основі штучного інтелекту для допомоги в написанні текстів англійською мовою, анонсувала створення та публікацію у відкритому доступі першого анотованого GEC-корпусу української мови.
GEC — це Grammatical Error Correction, тобто виправлення граматичних помилок, а мовний корпус — сукупність текстів, авторами яких є звичайні люди. Професійні українські лінгвісти ці тексти потім опрацювали (проанотували — позначили помилки і вказали відповідні виправлення). Призначення корпусу — наукове та практичне вивчення мови. Схожі корпуси існують для багатьох мов, але до сьогодні не було такого анотованого корпусу для вивчення української мови.
Презентований GEC-корпус української мови налічує понад
Читать на itc.ua

