Україна переходить до практичного етапу створення власної національної великої мовної моделі: 28 січня 2026 року пресофіс Міністерства повідомив про старт збору даних разом із Київстаром. Команді потрібні якісні тексти українською, аби модель навчалася на релевантному контенті та коректно працювала в наших реаліях. Ідеться про фундамент для українських аналогів Gemini та ChatGPT – зручних ШІ‑помічників для держави й бізнесу.
Що саме збирають і від кого
Міністерство запрошує партнерів із медіа, освітнього та наукового середовищ, культурних інституцій і компаній. Йдеться про контент, що покриває різні стилі та домени мови – від новин і художніх текстів до технічних описів і наукових робіт.
- Медіа: новини, інтерв’ю, блоги, публіцистика.
- Наука та освіта: курси, підручники, наукові статті, дисертації.
- Література: художні твори, критика, рецензії.
- Історія: оцифровані архівні матеріали.
- Бізнес-дані: технічна документація, описи товарів, відкриті відгуки, матеріали корпоративних блогів.
Такі набори дозволять задати моделі еталон грамотності та стилю, створити міцну інтелектуальну базу й навчити її розуміти галузеву специфіку ринку.
Навіщо це Україні
Національна LLM стане платформою для ШІ‑помічників у держсекторі та бізнесі: від роботи з документами й сервісами до підтримки клієнтів. Локальне навчання забезпечить коректну роботу з українським контекстом, термінами та правописом. Кожен переданий гігабайт допоможе зберегти український культурний код у цифровому світі і зробить відповіді моделі точнішими для мільйонів користувачів.
Хто виграє від участі
| Медіа | Формують стандарт мови та стилю для моделі. |
| Університети та науковці | Дає інтелектуальну основу для розуміння складних тем. |
| Культурні інституції | Забезпечують доступ до історії й літератури українською. |
| Бізнес | Навчає модель галузевій термінології та практикам. |
Мінцифри та Київстар відкрили прийом українських текстів для навчання національної LLM; партнери будуть офіційно відзначені у підсумковому звіті, а матеріали захищені прозорими юридичними умовами.
Безпека, права і довіра
Організатори наголошують на прозорих юридичних умовах: інтелектуальна власність партнерів захищена, а дані використовуються виключно для посилення українського ШІ. Усі, хто долучиться, отримають офіційне відзначення у фінальному звіті про розробку моделі.
Як подати свої дані
- Коротко опишіть типи та обсяги матеріалів у формі: forms.gle/TssBxATbA3XLZo61A
- Питання чи консультації – пишіть на ai@thedigital.gov.ua
До участі запрошені всі, хто має якісні тексти українською – від редакцій і видавців до кафедр, архівів та продуктових компаній.









