Збираємо базу IT-компаній. Приєднуйтесь 👇

Азійські конкуренти ChatGPT. Або що ми знаємо про те, як розвивається штучний інтелект у Китаї

Гігантський технологічний стрибок, який продемонстрували моделі машинного навчання за останні кілька місяців, змушує всіх хвилюватися щодо майбутнього штучного інтелекту, а також викликає занепокоєння через його потенційні неприємні наслідки.

1 коментар
Азійські конкуренти ChatGPT. Або що ми знаємо про те, як розвивається штучний інтелект у Китаї

Гігантський технологічний стрибок, який продемонстрували моделі машинного навчання за останні кілька місяців, змушує всіх хвилюватися щодо майбутнього штучного інтелекту, а також викликає занепокоєння через його потенційні неприємні наслідки.

Після того, як інструменти перетворення тексту в зображення від Stability AI й OpenAI стали предметом розмов, здатність ChatGPT вести інтелектуальні бесіди перетворилася на предмет одержимості в різних сферах. У Google навіть почалася паніка через цей чат-бот.

Цікаво, а що відбувається зі штучним інтелектом у Китаї, де технічне співтовариство завжди уважно стежило за прогресом на Заході?

Видання TechCrunch нещодавно підготувало на цю тему цілий огляд. Ось його стислий переклад.

ERNIE-ViLG від Baidu

Завдяки платформам для створення вірусного мистецтва, таким як Stable Diffusion і DALL-E 2, генеративний штучний інтелект раптово став на вустах у всіх. Китайські технологічні гіганти також захопили громадськість своїми еквівалентними продуктами, додавши родзинку відповідно до смаків і політичного клімату країни.

Так, Baidu, яка зробила собі ім’я в пошукових системах і останнім часом активізує свою гру в автономному водінні, використовує ERNIE-ViLG, модель з 10 мільярдами параметрів, навчену на наборі даних зі 145 мільйонів китайських пар зображення-текст. 

Нижче наведено результати запиту «діти їдять шумай у китайському кварталі Нью-Йорка», наданого Stable Diffusion, у порівнянні з тим самим запитом китайською мовою (纽约唐人街小孩吃烧卖) для ERNIE-ViLG.

Stable Diffusion
ERNIE-ViLG

«Як людина, яка виросла, харчуючись димсамом у Китаї та китайських кварталах, я б сказав, що результат — нічия. Жодна з них не отримала правильного шумаї, який є різновидом соковитих пельменів із креветками та свининою в напіввідкритій жовтій упаковці», — коментує зображення автор тексту.

Stable Diffusion створює атмосферу китайського кварталу, але справжнього шумая там немає. ERNIE-ViLG справді генерує тип шумай, але це різновид, яку частіше зустрічають у східному Китаї, а не його кантонська версія.

Швидкий тест відображає труднощі в охопленні культурних нюансів, коли набори даних, що використовуються, за своєю суттю упереджені. Якщо припустити, що Stable Diffusion матиме більше даних про китайську діаспору, то ERNIE-ViLG, ймовірно, навчається на більшій різноманітності зображень шумай, які рідше зустрічаються за межами Китаю.

Different Dimension Me від Tencent

Ще один китайський інструмент, який наробив шуму, — Different Dimension Me від Tencent, який може перетворювати фотографії людей на персонажів аніме. Генератор ШІ демонструє власну упередженість. Призначений для китайських користувачів, він несподівано отримав популярність в інших регіонах, де люблять аніме, наприклад у Південній Америці. Але незабаром користувачі зрозуміли, що платформа не в змозі ідентифікувати темношкірих і великих людей — групи, яких помітно бракує в японському аніме, що призвело до образливих результатів, створених ШІ.

Taiyi, дітище IDEA

Крім ERNIE-ViLG, ще однією широкомасштабною китайською моделлю перетворення тексту в зображення є Taiyi, дітище IDEA, дослідницької лабораторії під керівництвом відомого комп’ютерного вченого Гаррі Шума, який є співзасновником найбільшої дослідницької філії Microsoft за межами США, Microsoft Research Asia. Модель штучного інтелекту з відкритим кодом навчена на 20 мільйонах відфільтрованих китайських пар зображення-текст і має один мільярд параметрів.

На відміну від Baidu та інших прибуткових технологічних фірм, IDEA є однією з небагатьох установ, які останніми роками підтримували місцеві органи влади для роботи над передовими технологіями. Це означає, що центр, ймовірно, насолоджується більшою свободою досліджень без тиску для досягнення комерційного успіху. Розташована в технологічному центрі Шеньчжень і підтримана одним із найбагатших міст Китаю, це перспективна компанія, на яку варто звернути увагу.

Регулювання ШІ в Китаї

Генеративні інструменти штучного інтелекту в Китаї характеризуються не лише внутрішніми даними, на яких вони навчаються; вони також формуються місцевими законами. Як зазначає MIT Technology Review, модель Baidu для перетворення тексту в зображення відфільтровує політично чутливі ключові слова. Це очікувано, враховуючи, що цензура вже давно є загальною практикою в китайському інтернеті.

Що ще важливіше для майбутнього новонародженої галузі, так це новий набір регуляторних заходів. Він спрямований на те, що уряд називає «технологією глибокого синтезу». Це означає «технологію, яка використовує глибоке навчання, віртуальну реальність та інші алгоритми синтезу для створення тексту, зображень, аудіо, відео та віртуальні сцени».

Як і в інших типах інтернет-сервісів у Китаї, від ігор до соціальних мереж, користувачів просять підтвердити свої імена перед використанням генеративних додатків AI. Це неминуче має обмежувальний вплив на поведінку користувачів.

Позитивний бік — ці правила можуть призвести до більш відповідального використання генеративного штучного інтелекту, яким уже зловживають в інших місцях для випуску сексистського контенту. Китайське законодавство, наприклад, прямо забороняє людям створювати та поширювати фейкові новини, створені ШІ. Однак як це буде реалізовано, залежить від постачальників послуг.

«Цікаво, що Китай знаходиться в авангарді спроб регулювати [генеративний ШІ] як країна», — сказав в інтерв’ю Йоав Шохам, співзасновник AI21 Labs, ізраїльського конкурента OpenAI.

Але поки що немає єдиної думки щодо того, як слід керувати цією сферою, що швидко змінюється. 

Монетизація ШІ

Поки митці хвилюються, що їх замінять на потужний штучний інтелект, багато хто в Китаї використовує алгоритми машинного навчання, щоб заробляти гроші безліччю способів. І вони не з найбільш технічно підкованих людей.

Швидше, вони опортуністи або мами, які залишаються вдома і шукають додаткового джерела доходу.

Вони усвідомлюють, що, покращивши свої підказки, вони можуть обманом змусити штучний інтелект створювати креативні емодзі чи приголомшливі шпалери, які вони можуть публікувати в соціальних мережах, щоб збільшити доходи від реклами або безпосередньо зможуть брати плату за завантаження цього контенту.

Досвідчені представники індустрії також продають свої підказки іншим, хто хоче приєднатися до заробляння грошей, або навіть навчають їх за певну плату.

В Китаї люди також використовують штучний інтелект на своїй офіційній роботі, як і в решті світу. Письменники примітивної фантастики, наприклад, можуть дешево виготовляти ілюстрації для своїх творів. Інтригуючий варіант використання — це використання штучного інтелекту для дизайну футболок і принтів для інших споживчих товарів. Швидко створюючи великі партії прототипів, виробники економлять витрати на проєктування та скорочують виробничий цикл.

«Кілька засновників сказали мені, що компанії та професіонали загалом із задоволенням платять за штучний інтелект, оскільки вони бачать пряму віддачу від інвестицій, тому стартапи прагнуть створювати варіанти використання в галузі», — розповідає автор.

Цікавий кейс — застосунок від Surreal (Movio), який підтримує Sequoia China та стартап ZMO.ai, який підтримує Hillhouse. Під час пандемії їхні засновники виявили, що продавцям електронної комерції важко було знаходити іноземних моделей одягу, оскільки Китай тримав свої кордони закритими. Дві ці компанії розробили алгоритми, які генерували модних моделей усіх форм, кольорів і рас.

Але деякі підприємці не вірять, що їхні SaaS на основі штучного інтелекту зазнають такого стрімкого зростання, як їхні західні колеги, як-от Jasper і Stability AI.

«Протягом багатьох років багато китайських стартапів говорили мені, що їх хвилює те саме: корпоративні клієнти Китаю, як правило, менш готові платити за SaaS, ніж клієнти з розвинених економік, тому багато з них починають експансію за кордон», — пише автор тексту.

Конкуренція в китайському просторі SaaS також є собакою. «У США ви можете досягти успіху, створюючи продуктове програмне забезпечення, яке не покладається на людський ресурс для залучення або утримання користувачів. Але в Китаї, навіть якщо у вас є чудовий продукт, ваш суперник може викрасти ваш вихідний код за одну ніч і найняти десятки персоналу служби підтримки клієнтів, який коштує не так багато, щоб випередити вас», — сказав засновник китайського стартапу генеративного ШІ.

Попереду власні чіпсети?

Навіть якщо китайські технологічні фірми хочуть інвестувати в навчання великих нейронних мереж, їм може бракувати інструментів.

У вересні уряд США наклав на Китай санкцію у вигляді контролю над експортом високоякісних чіпів штучного інтелекту.

Хоча багато китайських стартапів зі штучним інтелектом зосереджені на прикладних програмах і їм не потрібні високопродуктивні напівпровідники, які обробляють моря даних, для тих, хто займається фундаментальними дослідженнями, використання менш потужних чіпів означає, що обчислення триватимуть довше та коштуватимуть більше. Про це сказав інвестор корпоративного програмного забезпечення у провідній китайській фірмі венчурного капіталу, який побажав залишитися анонімним.

Хороша новина, стверджував він, полягає в тому, що такі санкції змушують Китай інвестувати в передові технології в довгостроковій перспективі.

Доу Шен, виконавчий віцепрезидент фірми та голова AI Cloud Group, компанії, яка називає себе лідером у галузі штучного інтелекту в Китаї, вважає, що вплив санкцій США щодо чіпів на її бізнес штучного інтелекту є «обмеженим» як у короткостроковій, так і в довгостроковій перспективі.

Це тому, що «значна частина» хмарного бізнесу Baidu зі штучним інтелектом «не надто покладається на передові чіпи». А у випадках, коли йому потрібні високоякісні мікросхеми, він «вже має достатньо запасів, фактично, щоб підтримати наш бізнес у найближчій перспективі».

А як же майбутнє? «Якщо ми подивимося на це в середньостроковій та довгостроковій перспективі, ми фактично маємо наш власний розроблений чіп штучного інтелекту, який називається Kunlun», — упевнено сказав керівник.

«Завдяки нашим чіпам Kunlun у великих мовних моделях ефективність виконання завдань розпізнавання тексту та зображень на нашій платформі штучного інтелекту підвищилася на 40%, а загальна вартість зменшилася на 20–30%».

Час покаже, чи дадуть Kunlun та інші місцеві мікросхеми ШІ Китаю перевагу в гонці генеративного ШІ.

Читайте головні IT-новини країни в нашому Telegram
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
dev.ua запускає джобборд з акційною пропозицією для IT-роботодавців

Надсилайте вакансії

Ми запускаємо розсилку про українське IT-ком’юніті. Залиште email, аби розуміти більше. Прем’єра — скоро!
Дякую! На вказану адресу надіслано листа для підтвердження підписки.
Читайте також
Roosh запускає нову освітню платформу AI HOUSE CLUB для ML/AI-спеціалістів та дата сайнтистів. Розповідаємо, як подати заявку та чому навчатимуть
Roosh запускає нову освітню платформу AI HOUSE CLUB для ML/AI-спеціалістів та дата сайнтистів. Розповідаємо, як подати заявку та чому навчатимуть
Roosh запускає нову освітню платформу AI HOUSE CLUB для ML/AI-спеціалістів та дата сайнтистів. Розповідаємо, як подати заявку та чому навчатимуть
Як нейромережі бачать вільну та незалежну Україну? Тест dev.ua
Як нейромережі бачать вільну та незалежну Україну? Тест dev.ua
Як нейромережі бачать вільну та незалежну Україну? Тест dev.ua
Нейронні мережі для генерації зображень бачать світ по-своєму, їхню логіку зрозуміти часом зовсім неможливо. Але таки хочеться. На честь Дня Незалежності України редакція dev.ua вирішила провести невеликий експеримент. Ми задали чотирьом різним нейронним мережам п’ять однакових запитів: «прапор України», «День Незалежності України», «український Крим», «перемога України» та «українці». Отриманими результатами ми ділимося з вами нижче.
У TikTok тепер можна генерувати фон за допомогою нейромережі. Ми протестували її та ділимося результатами
У TikTok тепер можна генерувати фон за допомогою нейромережі. Ми протестували її та ділимося результатами
У TikTok тепер можна генерувати фон за допомогою нейромережі. Ми протестували її та ділимося результатами
У TikTok з’явилася нова функція «Розумний фон». З її допомогою як фон для тіктоків можна підставляти згенеровані нейромережею зображення. Редакція dev.ua протестувала цю технологію і ділиться своїми враженнями.
Які IT-спеціальності будуть потрібні в найближчі п'ять років? Ми з'ясували у голови американського стартапу ADAM Дениса Гурака
Які IT-спеціальності будуть потрібні в найближчі п'ять років? Ми з'ясували у голови американського стартапу ADAM Дениса Гурака
Які IT-спеціальності будуть потрібні в найближчі п'ять років? Ми з'ясували у голови американського стартапу ADAM Дениса Гурака

Хочете повідомити важливу новину? Пишіть у Telegram-бот

Головні події та корисні посилання в нашому Telegram-каналі

Обговорення

Коментар прихований за порушення правил коментування.
П. 4.1.2. Угода користувача — https://dev.ua/pages/agreement