💳 Trustee Plus — твоя персональна картка європейського банку: 3 хвилини і 10 євро 👉
Вікторія ГорбікШІ
28 серпня 2024, 08:31
2024-08-28
Партнери української компанії-розробника ШІ моделей представили LLM для литовської мови
Литовський партнер українських розробників з компанії Talan Systems, що працюють над інноваційним ШІ-рішенням для виявлення ворожої техніки та об'єктів безпілотними системами, компанія Neurotechnology представила нову LLM для литовської мови.
Компанія анонсувала появу своєї першої литовської великої мовної моделі з відкритим кодом, розробленої для сприяння розвитку рішень ШІ в регіоні.
LLM побудовано на базі трансформатора архітектури LlamaV2 із 7 і 13 млрд параметрів і навчено на величезному наборі даних із понад 14 млрд токенів литовською мовою.
«Ми пишаємося тим, що вносимо наш LLM у спільноту з відкритим кодом», — сказав Артурас Наквосас, технічний керівник відділу обробки природної мови компанії Neurotechnology. За його словами, роблячи його загальнодоступним, розробники прагнуть заохотити інших використовувати модель та розширити розробку програм ШІ литовською мовою.
Для прискорення процесу навчання Neurotechnology використовували графічні процесори NVIDIA H100. Результати порівняльного аналізу, проведеного компанією, показали, що модель Neurotechnology перевершує Llama 2 за замовчуванням у багатьох сферах, що робить її надійною основою для розробки широкого спектру програм ШІ литовською мовою.
«Пропоновані відкриті LLM для литовської мови оцінюються за допомогою багатьох тестів. Крім того, ці моделі є повністю прозорими, що дозволяє ефективно використовувати їх як у комерційному, так і в академічному контексті», — сказав доктор Повілас Данюшіс, науковець з машинного навчання в Neurotechnology. .
Дослідницькі статті з більш широкою інформацією та результатами порівняльного аналізу доступні в архіві arXiv, а моделі з відкритим кодом і набори даних доступні на платформі Hugging Face.
Литовський LLM з відкритим кодом Neurotechnology є першим кроком до просування технологій НЛП серед країн Балтії. Поділяючись цим складним інструментом, компанія прагне заохотити інших і продовжити дослідження з моделями великих мов у балтійських, скандинавських і східноєвропейських регіонах і мовах.
Партнери литовців, українська компанія Talan Systems, відзначила, що представлення LLM литовською — величезний крок вперед для розвитку штучного інтелекту і обробки природної мови для малих мов. Литовська тепер має свій потужний інструмент, який сприятиме збереженню та популяризації національної мови в цифрову епоху.
«Цей проєкт є важливим прикладом того, як сучасні технології можуть підтримувати й зміцнювати мовну ідентичність, забезпечуючи можливість користуватися передовими AI-інструментами рідною мовою. Це не лише піднімає статус литовської, але й прокладає шлях для розвитку інших мов, які потребують цифрової підтримки. Тепер ми зобовʼязані зробити це і в Україні, адже мова — це душа нації!» — зауважили в Talan Systems.
«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого
Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті.
Хочете повідомити важливу новину? Пишіть у Telegram-бот
Головні події та корисні посилання в нашому Telegram-каналі