Велика мовна модель для кодування Code Llama від Meta вже доступна на GitHub. Що потрібно, щоб нею скористатись
Мовна модель Code Llama, налаштована для завдань кодування, яку Meta представила у серпні 2023 року, днями стала доступна на GitHub.
Мовна модель Code Llama, налаштована для завдань кодування, яку Meta представила у серпні 2023 року, днями стала доступна на GitHub.
«Ми розкриваємо потужність великих мовних моделей, і наша остання версія Code Llama тепер доступна для окремих осіб, творців, дослідників і компаній будь-якого розміру, щоб вони могли експериментувати, впроваджувати інновації та відповідально масштабувати свої ідеї», — повідомили в анонсі.
Code Llama включає вагові коефіцієнти моделі та початковий код для попередньо підготовлених і точно налаштованих моделей мови Llama — параметри від 7B до 34B. Цей репозиторій призначений як мінімальний приклад для завантаження моделей та запуску висновків.
Code Llama підтримує різні мови програмування, такі як Python, Java, C++, PHP, TypeScript, C#, Bash тощо. Модель може обробляти до 100 000 токенів контексту. Для порівняння, ChatGPT зазвичай працює лише з приблизно 4000–8000 токенами, хоча довші доступні через API OpenAI.
Завантажити модельні ваги та токенізери Code Llama можна на сайті Meta, попередньо прийнявши ліцензію. Після схвалення запиту користувач отримає підписану URL-адресу електронною поштою. Потім необхідно буде запустити сценарій download.sh, передавши URL-адресу, надану під час запиту на початок завантаження.
Посилання закінчуються через 24 години та розраховані на певну кількість завантажень. Після вичерпання ліміту зʼявиться повідомлення про помилку «403: Forbidden», але в анонсі повідомляють, що можна буде надіслати запит на посилання повторно.
Деталі на приклади використання коду можна знайти на сторінці.
Інформацію про переваги та параметри Code Llama, а також результати порівняння з іншими ШІ-моделями для кодування на HumanEval, Multilingual HumanEval та MBPP, можна знайти тут. Крім того, раніше ми писали про батл між ChatGPT та Code Llama, який влаштував іспанський програміст.