UNIT.City — місце, де люди працюють... КРАЩЕ! Обирай свій простір просто зараз 👉

Claude Opus 4.6 from Anthropic spent $20,000 trying to write a C compiler

Anthropic researcher Nicolas Carlini tried to get the newly releasedOpus 4.6 model to produce a C compiler. The experiment left him with mixed feelings of "excitement," "concern," and "embarrassment."

Leave a comment
Claude Opus 4.6 from Anthropic spent $20,000 trying to write a C compiler

Anthropic researcher Nicolas Carlini tried to get the newly releasedOpus 4.6 model to produce a C compiler. The experiment left him with mixed feelings of "excitement," "concern," and "embarrassment."

Carlini tasked 16 agents with writing a C compiler from scratch in Rust that could compile the Linux kernel. After nearly 2,000 Claude Code sessions and spending $20,000 on the API, the team of agents created a 100,000-line compiler that could compile Linux 6.9 for x86, ARM, and RISC-V architectures, The Register reports .

According to him, the work of agent teams looks like this: “multiple instances of Claude work in parallel on a common code without active human intervention.”

One of the key challenges was to get around the need for an “operator who needs to be online and ready to collaborate.” This is likely to mean that Claude Code no longer has to wait for human guidance for each next step.

“To achieve sustained autonomous progress, I created a shell that loops Claude in a simple algorithm… As soon as he completes one task, he instantly takes on the next one,” the researcher explained.

Carlini let each Claude agent decide for itself what to do. In most cases, Claude would choose the next most obvious problem. This taught him a number of lessons, including the need to “write extremely high-quality tests.”

The researcher advised “putting yourself in Claude’s shoes.” This means that “the test shell should not output thousands of unnecessary bytes” so that Claude can more easily find the information he needs.

He also added: "Claude has no sense of time and, if left unattended, will happily spend hours running tests instead of moving forward."

What is the result?

Over nearly 2,000 Claude Code sessions in two weeks, Opus 4.6 consumed 2 billion input tokens and generated 140 million output tokens; the total cost was just under $20,000.

This made the project “extremely expensive” compared to even Claude Max’s most expensive plans, Carlini noted. “But that’s a fraction of what it would have cost me to build it myself, let alone hire a whole team.”

Conclusions

The compiler successfully compiles many projects, but not all. It is not yet a full replacement for a real compiler. Moreover, the generated code is not very efficient.

The quality of Rust code is acceptable, but far from the level that an experienced Rust developer could produce.

Carlini concluded: “Agent teams demonstrate the ability to autonomously implement complete complex projects.”

But as a former pentester, he noted that fully autonomous development carries real risks. “The idea that programmers would be implementing software that they’ve never personally tested is a serious concern.” Ultimately, the experiment “excited me, but it also left me feeling uneasy.”

A shopper in the UK convinced an AI assistant to give him an 80% discount using flattery
A shopper in the UK convinced an AI assistant to give him an 80% discount using flattery
On the topic
A shopper in the UK convinced an AI assistant to give him an 80% discount using flattery
A man asked Claude Cowork to tidy up his wife's files. A few minutes later, he almost had a heart attack.
A man asked Claude Cowork to tidy up his wife's files. A few minutes later, he almost had a heart attack.
On the topic
A man asked Claude Cowork to tidy up his wife's files. A few minutes later, he almost had a heart attack.
In two years, the amount of code written by AI has increased sixfold — study
In two years, the amount of code written by AI has increased sixfold — study
On the topic
In two years, the amount of code written by AI has increased sixfold — study
AI toy leaked 50,000 chat records with children: anyone could access them via a Gmail account
AI toy leaked 50,000 chat records with children: anyone could access them via a Gmail account
On the topic
AI toy leaked 50,000 chat records with children: anyone could access them via a Gmail account
Read the country's main IT news in our Telegram
Read the country's main IT news in our Telegram
On the topic
Read the country's main IT news in our Telegram
Also Read
Roosh запускає нову освітню платформу AI HOUSE CLUB для ML/AI-спеціалістів та дата сайнтистів. Розповідаємо, як подати заявку та чому навчатимуть
Roosh запускає нову освітню платформу AI HOUSE CLUB для ML/AI-спеціалістів та дата сайнтистів. Розповідаємо, як подати заявку та чому навчатимуть
Roosh запускає нову освітню платформу AI HOUSE CLUB для ML/AI-спеціалістів та дата сайнтистів. Розповідаємо, як подати заявку та чому навчатимуть
Як нейромережі бачать вільну та незалежну Україну? Тест dev.ua
Як нейромережі бачать вільну та незалежну Україну? Тест dev.ua
Як нейромережі бачать вільну та незалежну Україну? Тест dev.ua
Нейронні мережі для генерації зображень бачать світ по-своєму, їхню логіку зрозуміти часом зовсім неможливо. Але таки хочеться. На честь Дня Незалежності України редакція dev.ua вирішила провести невеликий експеримент. Ми задали чотирьом різним нейронним мережам п’ять однакових запитів: «прапор України», «День Незалежності України», «український Крим», «перемога України» та «українці». Отриманими результатами ми ділимося з вами нижче.
У TikTok тепер можна генерувати фон за допомогою нейромережі. Ми протестували її та ділимося результатами
У TikTok тепер можна генерувати фон за допомогою нейромережі. Ми протестували її та ділимося результатами
У TikTok тепер можна генерувати фон за допомогою нейромережі. Ми протестували її та ділимося результатами
У TikTok з’явилася нова функція «Розумний фон». З її допомогою як фон для тіктоків можна підставляти згенеровані нейромережею зображення. Редакція dev.ua протестувала цю технологію і ділиться своїми враженнями.
1 comment
Які IT-спеціальності будуть потрібні в найближчі п'ять років? Ми з'ясували у голови американського стартапу ADAM Дениса Гурака
Які IT-спеціальності будуть потрібні в найближчі п'ять років? Ми з'ясували у голови американського стартапу ADAM Дениса Гурака
Які IT-спеціальності будуть потрібні в найближчі п'ять років? Ми з'ясували у голови американського стартапу ADAM Дениса Гурака

Have important news to share? Message our Telegram bot

Key events and useful links in our Telegram channel

Discussion
No comments yet.