🚨⚡🚨 Біткоін по $100к. Час встановлювати Trustee Plus і випускати картку для розрахунків безкоштовно 👉
Наталя ХандусенкоШІ (ai)
1 ноября 2024, 13:51
2024-11-01
Американський стартап Patronus AI розробив перший self-serve API для зупинки галюцинацій ШІ. Це як перевірка орфографії для штучного інтелекту
Patronus AI, стартап із Сан-Франциско, запустив першу платформу для виявлення та запобігання збоям ШІ в режимі реального часу. Цей новий інструмент призначений допомогти розробникам гарантувати, що їхні програми штучного інтелекту генерують точні результати.
Уявіть собі, що це складна перевірка орфографії для систем штучного інтелекту, яка виявляє помилки ще до того, як вони досягнуть користувачів.
Розробники можуть використовувати Patronus AI для порівняння набору великих мовних моделей і визначення, яка з них найкраще підходить для конкретного проєкту. Платформа також обіцяє полегшити кілька супутніх завдань, таких як виявлення технічних проблем у додатках ШІ після їхнього розгортання.
Цей інструмент бізнес може інтегрувати у свої робочі процеси, які пов’язані з ШІ.
«Ви можете налаштувати оцінку відповідно до потреб свого продукту. Ми дозволяємо клієнтам писати англійською те, що вони хочуть оцінити та перевірити», — сказав Ананд Каннаппан, генеральний директор Patronus AI, в інтерв’ю VentureBeat. Наприклад, компанія, яка надає фінансові послуги, може визначати правила дотримання нормативних вимог, тоді як постачальник медичних послуг може зосередитися на конфіденційності пацієнтів і медичній точності.
В основі платформи лежить Lynx — ШІ-модель виявлення галюцинацій, яка на 8,3% перевершує GPT-4 у виявленні медичних неточностей.
Платформа працює на двох швидкостях: версія швидкого реагування для моніторингу в режимі реального часу та більш ретельна версія для глибшого аналізу. Малі версії можна використовувати для моніторингу в режимі реального часу, а великі можуть бути більш придатними для офлайн-аналізу, сказали у стартапі.
Окрім традиційної перевірки помилок, стартап розробив спеціалізовані інструменти, такі як CopyrightCatcher, який виявляє, коли системи штучного інтелекту відтворюють захищений контент, і FinanceBench, перший у галузі бенчмарк для оцінки ефективності штучного інтелекту у фінансових питаннях. Ці інструменти працюють разом із Lynx, щоб забезпечити комплексний захист від збоїв у роботі ШІ.
Patronus AI вже залучив таких клієнтів, як HP, AngelList та Pearson, а також уклала угоди про партнерство з такими технологічними гігантами, як Nvidia, MongoDB та IBM.
Компанія прийняла модель оплати в міру використання, починаючи з $10 за 1000 викликів API для менших оцінювачів і $20 за 1000 викликів API для великих.
«Есть ли у меня талант, если компьютер может имитировать меня?». Искусственный интеллект пишет книги авторам Amazon Kindle. The Verge пообщался с авторами и обнаружил много интересного
Писатели-романисты используют искусственный интеллект для создания своих произведений. Издание о технологиях The Verge пообщалось с писательницей Дженнифер Лепп, выпускающей новую книгу каждые девять недель, и узнало о том, как работает искусственный интеллект для написания романов. Приводим адаптированный перевод статьи.
Хотите сообщить важную новость? Пишите в Telegram-бот
Главные события и полезные ссылки в нашем Telegram-канале