Олександр Кузьменко ШІ 11 червня 2024, 14:29

«Усе зводиться до того, щоб мати найкращу технологію». Як працює DeepL — один із найкращих ШІ-перекладачів у світі

Німецька компанія DeepL є одним із лідерів на ринку машинного перекладу, дехто вважає її найуспішнішою технологічною компанією в перекладацькій галузі за останні 15 років. У чому секрет успіху DeepL.

Залишити коментар

«Усе зводиться до того, щоб мати найкращу технологію». Як працює DeepL — один із найкращих ШІ-перекладачів у світі

Німецька компанія DeepL є одним із лідерів на ринку машинного перекладу, дехто вважає її найуспішнішою технологічною компанією в перекладацькій галузі за останні 15 років. У чому секрет успіху DeepL.

Компанія використовує власну модель нейронних мереж, спеціально навчену для кращого рівня точності у перекладі для бізнесу. Базою для сервісу та навчання ШІ-моделі став її великий онлайн-словник Linguee, який допомагає легко конкурувати з такими платформами, як Google Translate та Grammarly, йдеться в матеріалі «Економічної правди».

Як з’явилася DeepL

Історія DeepL почалася у 2009 році, коли колишній науковий співробітник Google Гереон Фралінг створив один з найкращих багатомовних словників на ринку під назвою Linguee.

Намагаючись вдосконалити Linguee, команда із 20 дослідників під керівництвом польського вченого-комп’ютерника Ярослава (Ярека) Кутиловського почала використовувати передові нейронні мережі, аби покращити процес верифікації різних перекладів. Для цього вони почали навчати нейронну мережу машинному перекладу на базі даних, які збирали протягом 10 років, і, зрештою, у 2017 році оголосили про запуск онлайн-перекладача DeepL.

Як працює перекладач

Онлайн-перекладач використовує архітектуру глибокої нейронної мережі Transformer, яка розроблена для подолання обмежень попередніх нейронних моделей машинного перекладу (зокрема, RNN). Вона стала високоефективною у створенні якісних перекладів.

RNN обробляє вхідні послідовності по одному слову за раз, і вплив попередніх слів на наступні зменшується, коли послідовність стає довшою. А Transformer використовує механізм самообізнаності, який дозволяє їй одночасно звертати увагу на всі слова в реченні, фіксуючи всі залежності.

«У той час, як Google Translate часто робить дослівний переклад, який пропускає деякі нюанси та ідіоми (або робить переклад цих ідіом абсолютно неправильним), DeepL забезпечує природний переклад, який ближче до перекладу досвідченого перекладача», — зауважили у виданні TechCrunch на релізі продукту.

В DeepL можна завантажувати й перекладати документи у форматах PDF, Word, HTML чи PowerPoint зі збереженням їхнього оригінального формату.

Монетизація DeepL

Компанія пропонує безплатні та платні послуги, й підтримує понад 30 мов — у тому числі українську (з вересня 2022 року). Безплатний рівень обмежує кількість символів, які користувач може перекласти за раз, безпеку даних користувача, та кількість документів, які він може перекладати на місяць. Рівень API DeepL дозволяє отримати доступ до більшої кількості глосаріїв і перекладів.

Тариф DeepL Pro призначений для корпоративного користування і має три рівні, які оплачуються за кожного користувача на рік: початковий — від $100, розширений — від $300, а найкращий — майже $700.

Дослідження компанії Forrester, проведене у 2024 році, показало, що використання DeepL забезпечило 345% рентабельності інвестицій для глобальних компаній, скоротивши час перекладу на 90% і знизивши робоче навантаження на 50%.

Така ефективність дозволила компанії зібрати вже понад 100 000 корпоративних клієнтів, найвідоміші серед яких — японський медіахолдинг Nikkei, провайдер онлайн-курсів Coursera, німецький залізничний холдинг Deutsche Bahn та компанія Zendesk, що займається розробкою програмного забезпечення.

«Сектор машинних перекладів обслуговує всі сфери, тому що будь-яка галузь потребує перекладу», — пояснив виконавчий директор постачальника новин і досліджень у сфері мовного перекладу Slator Флоріан Фаес. Він впевнений, що DeepL — найуспішніша технологічна компанія в перекладацькій галузі за останні 15 років.

Інвестиції DeepL

За останній рік компанія удвічі збільшила штат — до 900 співробітників. Наразі компанія має офіси в Німеччині, Нідерландах, Польщі, Великій Британії, Японії та у США.

DeepL, який досі не є прибутковим, у травні 2024 року залучив $300 млн у рамках нового раунду фінансування, очолюваному Index Ventures. Ринкова оцінка стартапу зросла до $2 млрд: фонди Iconiq Growth і Teachers' Venture Growth стали новими інвесторами, чинні інвестори IVP, Atomico і WiL також долучилися до нового фінансування.

За словами Кутиловського, наразі близько 60% штату компанії — це розробники, і в майбутньому сервіс найматиме більше нетехнічного персоналу для збільшення продажів і покращення маркетингової стратегії. Наступний крок розвитку інструменту DeepL полягатиме в тому, щоб зосередитися не на змісті тексту, а на «невловних тонах і формулюваннях».

Конкуренція з Google, Microsoft і Facebook

DeepL заявляє, що розробляє найкраще у світі програмне забезпечення для машинного перекладу. Це твердження ґрунтується на «сліпих тестах», під час яких професійні перекладачі обирають найточніший варіант перекладу тексту, не знаючи, яка компанія його створила, пояснюють в компанії.

Під час тестування, проведеного компанією, професійні перекладачі віддали перевагу сервісу DeepL у співвідношенні 3:1 у порівнянні з конкурентими інструментами від Google, Microsoft і Facebook. Версія DeepL показала кращі результати й в тесті на точність перекладу за системою BLEU, ніж її конкуренти.

«Усе зводиться до того, щоб мати найкращу технологію», — каже Кутиловський. Він запевняє, що нейронні мережі компанії можуть аналізувати величезні обсяги даних, зібраних з Інтернету, щоб дізнатися найбільш вірогідний переклад для будь-якого речення.

Утім, конкуренти DeepL також використовуючи нейронні мережі. Зокрема, материнська компанія Facebook Meta випустила програмне забезпечення на базі ШІ, яке може автоматично перекладати з близько 100 мов як усне мовлення, так і текст. Google, крім Google Translate, розвиває також Google Cloud, який дає змогу компаніям динамічно перекладати текст на своїх вебсайтах і в застосунках за допомогою програмного інтерфейсу API. А Microsoft Translator дозволяє підприємствам, розробникам додатків і постачальникам мовних послуг створювати індивідуальні системи нейронного машинного перекладу.

Однак Кутиловський, схоже, не боїться конкуренції. За його словами, DeepL і надалі зосереджуватиметься на дослідженнях нейронних мереж для перекладу й отриманні найкращих даних для навчання.

«Насправді, ми конкуруємо з Google Translate, а отже, і з усім Google, з моменту заснування компанії. Тому для нас ландшафт не надто змінився», — каже засновник DeepL. Також на горизонті потенційно може з’явитися ще один конкурент — OpenAI, який випускає низку гучних інструментів на основі ШІ.

Кутиловський каже, що наразі немає конкретних планів щодо того, як і чи буде DeepL коли-небудь співпрацювати з OpenAI, і якої форми це може набути. Засновник стартапу визнає, що мовні моделі, які використовує DeepL, схожі на ті, що є в OpenAI, і що обидві компанії мають багато спільних клієнтів.

Нагадаємо, що штучний інтелект заощадив Ajax Systems до 40% на перекладачах та акторах дубляжу для щорічного Special Event. Для організації Special Event компанія делегувала штучному інтелекту переклад онлайн-трансляції, промов спікерів і дубляж їхніх голосів. А тексти для презентації Ajax Systems переклали технологію німецького стартапу DeepL.

Читайте головні IT-новини країни в нашому Telegram

«Перекладач із бюрократичної» та «генератор виправдань». 9 цікавих GPT-асистентів від українського ентузіаста ШІ-технологій

Розробники ШІ-застосунку ConnectAbility який навчає людей із порушенням слуху мови жестів хочуть додати підтримку англійської мови та озвучення перекладу

Стартап Cotia розробляє ШІ-ошийник який перекладає що «кажуть» коти. Як він працює

Залишити коментар

Текст: Олександр Кузьменко Фото: SandVox Джерело: Українська Правда Теги: deepl, переклад, штучний інтелект

Знайшли помилку в тексті – виділіть її та натисніть Ctrl+Enter. Знайшли помилку в тексті – виділіть її та натисніть кнопку «Повідомити про помилку».

Розміщення реклами

Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає

Штучний інтелект почав озвучувати фільми на MEGOGO

3 коментарі

Штучний інтелект навчився реставрувати старі фотографії, перетворюючи їх на якісні зображення: відео

2 коментарі

«Чи є у мене талант, якщо комп’ютер може імітувати мене?». Штучний інтелект пише книги авторам Amazon Kindle. The Verge поспілкувався з авторами та виявив багато цікавого

Письменники-романісти використовують штучний інтелект для створення своїх творів. Видання про технології The Verge поспілкувалося з письменницею Дженніфер Лепп, яка випускає нову книгу кожні дев’ять тижнів, й дізналося про те, як працює штучний інтелект для написання романів. Наводимо адаптований переклад статті.

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Коментарів поки немає.

Увійдіть, щоб залишити коментар