Дістали русняві шахеди й ракети? Підсилюймо ППО — донать на SkyLock 👉

Судові документи розкрили секретні експерименти Meta у навчанні ШІ

Гучна судова справа проти Meta розкрила безліч внутрішніх документацій компаній. Один документ особливо зацікавив деяких дослідників ШІ: в ньому говорилося про метод покращення ШІ-моделей Llama. 

Залишити коментар
Судові документи розкрили секретні експерименти Meta у навчанні ШІ

Гучна судова справа проти Meta розкрила безліч внутрішніх документацій компаній. Один документ особливо зацікавив деяких дослідників ШІ: в ньому говорилося про метод покращення ШІ-моделей Llama. 

У цих судових матеріалах міститься опис того, як дослідники Meta використовували процес під назвою абляція, щоб визначити, які дані допомогли покращити ШІ-моделі Llama, пише Business Insider.

Абляція — це медична методика, яка цілеспрямовано руйнує тканини, щоб покращити роботу мозку. В ШІ вона передбачає видалення частин системи для вивчення того, як ці компоненти впливають на продуктивність.

В експериментах Meta з абляції компанія замінила частину даних для навчання ШІ піратськими книжками з гігантської бази даних LibGen. Потім компанія перенавчила свою модель Llama, щоб побачити, як це вплине на результат.

Про російську піратську бібліотеку LibGen ми писали раніше. Meta намагалася не допустити розголосу за судовим позовом того факту, що компанія використовувала LibGen для навчання ШІ. Справа стосувалася порушення авторських прав, так звана «Kadrey проти Meta». Крім того, пізніше виявилося, що Meta можливо тренувала свої ШІ-моделі на ще не опублікованих книгах.

В одному експерименті Meta додала до навчальних даних книги про науку і техніку, а також художні книги. У другому експерименті вона додала лише художні книги.

В обох експериментах продуктивність Llama помітно покращилася в галузевих тестах, згідно з внутрішнім документом Meta (ст. 18-19).

Це свідчить про те, що Meta має можливість присвоювати значення конкретним навчальним даним, — каже Нік Вінсент, доцент Школи комп’ютерних наук в Університеті Саймона Фрейзера.

Наприклад, один інженер Meta на LinkedIn згадує про виконання понад 100 абляцій під час розробки Llama 4 і попередніх версій великих моделей ШІ компанії.

Meta не публікує результати цих експериментів, а інші компанії зі штучного інтелекту також тримають цю інформацію в таємниці, сказав Вінсент.

Одна з можливих причин: якщо технологічні гіганти розкажуть світові, які саме навчальні дані допомогли їхнім моделям штучного інтелекту, то творці цієї інформації захочуть, щоб їм заплатили — і вони зможуть підрахувати, скільки грошей їм заборгували.

Оприлюднення результатів експериментів з абляції також може вплинути на серйозні судові процеси щодо авторських прав, які лютують у технологічній індустрії — гарним прикладом є ця справа «Kadrey проти Meta».

У таких випадках технологічні гіганти та стартапи зі створення штучного інтелекту стверджують, що «навчання» машин на основі опублікованих в Інтернеті матеріалів не є порушенням авторських прав. А такі внутрішні документи, що визначають цінність певного контенту, можуть зіграти проти них. 

Секретні результати абляції Meta

Експерименти Meta з абляції зосереджені на цьому першому етапі навчання, який використовує гори даних, щоб допомогти моделям зрозуміти світ. Наприклад: щоб навчити машину розпізнавати ламу, ви повинні показати їй якомога більше фотографій лам і альпак, щоб вона могла розрізнити цих двох тварин.

Перший експеримент Meta з абляції показав, що додавання наукових, технологічних і художніх книг до навчальних даних покращило продуктивність Llama на 4,5% за галузевим тестом BooIQ. Лише додавання художніх книг призвело до покращення на 6%.

BoolQ — це тест з 15 942 запитань типу «так/ні», на які повинні відповісти моделі ШІ. Чим більше запитань вони відповідатимуть, тим вища продуктивність. Поліпшення на 5% еквівалентно правильній відповіді на майже 800 додаткових запитань.

Згідно з внутрішнім документом Meta, приріст продуктивності від цих експериментів з абляції становив 5,5% за іншим тестом, відомим як SIQA.

Пітер Хендерсон, доцент кафедри інформатики в Прінстоні, опублікував у Twitter кілька діаграм із судового документа, які демонструють ці досягнення.

Хоча приріст продуктивності приблизно на 5% здається невеликим, у перегонах ШІ будь-яка перевага важлива.

«Насправді це багато, тому що дуже важко отримати кожен додатковий бал у тестах ШІ», — сказав Білл Гросс, генеральний директор ProRata, стартапу, який намагається компенсувати творцям їхній внесок у ШІ.

Meta презентує нове покоління відкритих моделей ШІ: Llama 4. Контекстне вікно на 10 млн токенів. Порівнюємо з конкурентами
Meta презентує нове покоління відкритих моделей ШІ: Llama 4. Контекстне вікно на 10 млн токенів. Порівнюємо з конкурентами
По темi
Meta презентує нове покоління відкритих моделей ШІ: Llama 4. Контекстне вікно на 10 млн токенів. Порівнюємо з конкурентами
Meta надала Мінцифри консультантів та розробників для створення української «національної мовної моделі» на базі Llama
Meta надала Мінцифри консультантів та розробників для створення української «національної мовної моделі» на базі Llama
По темi
Meta надала Мінцифри консультантів та розробників для створення української «національної мовної моделі» на базі Llama
У фреймворку Llama від Meta виявили вразливість яка наражає ШІ-системи на ризики віддаленого виконання коду
У фреймворку Llama від Meta виявили вразливість, яка наражає ШІ-системи на ризики віддаленого виконання коду
По темi
У фреймворку Llama від Meta виявили вразливість, яка наражає ШІ-системи на ризики віддаленого виконання коду
Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Читайте також
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Штучний інтелект DALL-E навчився домальовувати картини. Як це виглядає
Жодних ігор у метавсесвіті: Facebook припинить підтримку свого сервісу для геймерів
Жодних ігор у метавсесвіті: Facebook припинить підтримку свого сервісу для геймерів
Жодних ігор у метавсесвіті: Facebook припинить підтримку свого сервісу для геймерів
«В жовтні випускаємо VR-шолом для аватарів, в «чіпування» Neuralink Маска вірю мало». Про що глава Meta Цукерберг 3 години говорив в подкасті Джо Рогана
«В жовтні випускаємо VR-шолом для аватарів, в «чіпування» Neuralink Маска вірю мало». Про що глава Meta Цукерберг 3 години говорив в подкасті Джо Рогана
«В жовтні випускаємо VR-шолом для аватарів, в «чіпування» Neuralink Маска вірю мало». Про що глава Meta Цукерберг 3 години говорив в подкасті Джо Рогана
25 серпня вийшла чергова серія популярного подкасту The Joe Rogan Experience, гостем якого став глава компанії Meta Марк Цукерберг. Розповідаємо про головне з майже 3-годинного інтерв’ю.
Марк Цукерберг показав нове зображення свого метавсесвіту. Він виглядає просто жахливо
Марк Цукерберг показав нове зображення свого метавсесвіту. Він виглядає просто жахливо
Марк Цукерберг показав нове зображення свого метавсесвіту. Він виглядає просто жахливо
1 коментар

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Обговорення
Коментарів поки немає.