💳 Trustee Plus — твоя персональна картка європейського банку: 3 хвилини і 10 євро 👉
Вікторія ГорбікШІ (ai)
28 августа 2024, 08:31
2024-08-28
Партнери української компанії-розробника ШІ моделей представили LLM для литовської мови
Литовський партнер українських розробників з компанії Talan Systems, що працюють над інноваційним ШІ-рішенням для виявлення ворожої техніки та об'єктів безпілотними системами, компанія Neurotechnology представила нову LLM для литовської мови.
Компанія анонсувала появу своєї першої литовської великої мовної моделі з відкритим кодом, розробленої для сприяння розвитку рішень ШІ в регіоні.
LLM побудовано на базі трансформатора архітектури LlamaV2 із 7 і 13 млрд параметрів і навчено на величезному наборі даних із понад 14 млрд токенів литовською мовою.
«Ми пишаємося тим, що вносимо наш LLM у спільноту з відкритим кодом», — сказав Артурас Наквосас, технічний керівник відділу обробки природної мови компанії Neurotechnology. За його словами, роблячи його загальнодоступним, розробники прагнуть заохотити інших використовувати модель та розширити розробку програм ШІ литовською мовою.
Для прискорення процесу навчання Neurotechnology використовували графічні процесори NVIDIA H100. Результати порівняльного аналізу, проведеного компанією, показали, що модель Neurotechnology перевершує Llama 2 за замовчуванням у багатьох сферах, що робить її надійною основою для розробки широкого спектру програм ШІ литовською мовою.
«Пропоновані відкриті LLM для литовської мови оцінюються за допомогою багатьох тестів. Крім того, ці моделі є повністю прозорими, що дозволяє ефективно використовувати їх як у комерційному, так і в академічному контексті», — сказав доктор Повілас Данюшіс, науковець з машинного навчання в Neurotechnology. .
Дослідницькі статті з більш широкою інформацією та результатами порівняльного аналізу доступні в архіві arXiv, а моделі з відкритим кодом і набори даних доступні на платформі Hugging Face.
Литовський LLM з відкритим кодом Neurotechnology є першим кроком до просування технологій НЛП серед країн Балтії. Поділяючись цим складним інструментом, компанія прагне заохотити інших і продовжити дослідження з моделями великих мов у балтійських, скандинавських і східноєвропейських регіонах і мовах.
Партнери литовців, українська компанія Talan Systems, відзначила, що представлення LLM литовською — величезний крок вперед для розвитку штучного інтелекту і обробки природної мови для малих мов. Литовська тепер має свій потужний інструмент, який сприятиме збереженню та популяризації національної мови в цифрову епоху.
«Цей проєкт є важливим прикладом того, як сучасні технології можуть підтримувати й зміцнювати мовну ідентичність, забезпечуючи можливість користуватися передовими AI-інструментами рідною мовою. Це не лише піднімає статус литовської, але й прокладає шлях для розвитку інших мов, які потребують цифрової підтримки. Тепер ми зобовʼязані зробити це і в Україні, адже мова — це душа нації!» — зауважили в Talan Systems.
«Есть ли у меня талант, если компьютер может имитировать меня?». Искусственный интеллект пишет книги авторам Amazon Kindle. The Verge пообщался с авторами и обнаружил много интересного
Писатели-романисты используют искусственный интеллект для создания своих произведений. Издание о технологиях The Verge пообщалось с писательницей Дженнифер Лепп, выпускающей новую книгу каждые девять недель, и узнало о том, как работает искусственный интеллект для написания романов. Приводим адаптированный перевод статьи.
Хотите сообщить важную новость? Пишите в Telegram-бот
Главные события и полезные ссылки в нашем Telegram-канале