Реклама партнера — Название партнёра
UNIT.City — місце, де люди працюють... КРАЩЕ! Обирай свій простір просто зараз 👉

OpenAI engineers say they can rebuild GPT-4 from scratch with a team of up to 10 people thanks to breakthroughs in their latest model. Previously, they needed hundreds of specialists

Building GPT-4 required the collaboration of hundreds of people. Now, OpenAI claims it can rebuild GPT-4 with just 5-10 people, thanks to the experience gained from building its latest model, GPT-4.5.

Leave a comment
OpenAI engineers say they can rebuild GPT-4 from scratch with a team of up to 10 people thanks to breakthroughs in their latest model. Previously, they needed hundreds of specialists

Building GPT-4 required the collaboration of hundreds of people. Now, OpenAI claims it can rebuild GPT-4 with just 5-10 people, thanks to the experience gained from building its latest model, GPT-4.5.

On Friday's OpenAI podcast, Sam Altman asked three key engineers behind GPT-4.5: What is the smallest OpenAI team that could rework GPT-4 from scratch today?

At the same time, Altman noted that almost all of the company's efforts went into creating GPT-4, which involved hundreds of people, Business Insider writes .

Alex Paino, who led the machine learning training for GPT-4.5, said that retraining GPT-4 will now likely require only 5 to 10 people.

“We trained GPT-4o, a GPT-4-caliber model that we retrained using a lot of the same material as the GPT-4.5 research program,” Paino said. “It actually requires a lot fewer people to run the actual run.”

Daniel Selsam, an OpenAI researcher who works on data efficiency and algorithms, agreed that rebuilding GPT-4 will now be much easier.

"Just knowing that someone else has done something makes it a lot easier," he said. "I feel like the very fact that something is possible is a huge cheat code."

In February, OpenAI released GPT-4.5, claiming it was the company’s largest and most powerful model to date. It was designed to be “10 times smarter” than GPT-4, which was released in March 2023, according to Paino.

“We are 10 times better than what we did before with these GPT pre-trainings,” Paino said.

As for what's needed for the next 10- or 100-fold leap in scale, Selsam said it's data efficiency.

GPT models process information very efficiently, but there is a “ceiling that limits the depth of understanding they can extract from the data,” he said. “At a certain point, as the computations keep growing and growing, the data grows much more slowly and it becomes a bottleneck.”

Going beyond that, he said, would require “some algorithmic innovation” to extract more value from the same amount of data.

A shortage of graphics chips forced OpenAI to suspend the deployment of the new GPT-4.5 model
A shortage of graphics chips forced OpenAI to suspend the deployment of the new GPT-4.5 model
On the topic
A shortage of graphics chips forced OpenAI to suspend the deployment of the new GPT-4.5 model
Scientists have calculated how much water or electricity is needed to operate ChatGPT-4
Scientists have calculated how much water or electricity is needed to operate ChatGPT-4
On the topic
Scientists have calculated how much water or electricity is needed to operate ChatGPT-4
Read the country's main IT news in our Telegram
Read the country's main IT news in our Telegram
On the topic
Read the country's main IT news in our Telegram
Also Read
Roosh запускає нову освітню платформу AI HOUSE CLUB для ML/AI-спеціалістів та дата сайнтистів. Розповідаємо, як подати заявку та чому навчатимуть
Roosh запускає нову освітню платформу AI HOUSE CLUB для ML/AI-спеціалістів та дата сайнтистів. Розповідаємо, як подати заявку та чому навчатимуть
Roosh запускає нову освітню платформу AI HOUSE CLUB для ML/AI-спеціалістів та дата сайнтистів. Розповідаємо, як подати заявку та чому навчатимуть
Як нейромережі бачать вільну та незалежну Україну? Тест dev.ua
Як нейромережі бачать вільну та незалежну Україну? Тест dev.ua
Як нейромережі бачать вільну та незалежну Україну? Тест dev.ua
Нейронні мережі для генерації зображень бачать світ по-своєму, їхню логіку зрозуміти часом зовсім неможливо. Але таки хочеться. На честь Дня Незалежності України редакція dev.ua вирішила провести невеликий експеримент. Ми задали чотирьом різним нейронним мережам п’ять однакових запитів: «прапор України», «День Незалежності України», «український Крим», «перемога України» та «українці». Отриманими результатами ми ділимося з вами нижче.
У TikTok тепер можна генерувати фон за допомогою нейромережі. Ми протестували її та ділимося результатами
У TikTok тепер можна генерувати фон за допомогою нейромережі. Ми протестували її та ділимося результатами
У TikTok тепер можна генерувати фон за допомогою нейромережі. Ми протестували її та ділимося результатами
У TikTok з’явилася нова функція «Розумний фон». З її допомогою як фон для тіктоків можна підставляти згенеровані нейромережею зображення. Редакція dev.ua протестувала цю технологію і ділиться своїми враженнями.
1 comment
Які IT-спеціальності будуть потрібні в найближчі п'ять років? Ми з'ясували у голови американського стартапу ADAM Дениса Гурака
Які IT-спеціальності будуть потрібні в найближчі п'ять років? Ми з'ясували у голови американського стартапу ADAM Дениса Гурака
Які IT-спеціальності будуть потрібні в найближчі п'ять років? Ми з'ясували у голови американського стартапу ADAM Дениса Гурака

Have important news to share? Message our Telegram bot

Key events and useful links in our Telegram channel

Discussion
No comments yet.