Перейти к содержанию

Слив: новая Llama 3.1 405B которая может превзойти GPT-4o от OpenAI


Рекомендуемые сообщения

В апреле 2024 года компания Meta* представила Llama 3, новое поколение открытых языковых моделей, которые устанавливают новые стандарты в своей категории. Первые две модели, Llama 3 8B и Llama 3 70B, уже продемонстрировали выдающиеся результаты, однако всего через три месяца появились новые модели, которые превзошли их по производительности. Meta* также анонсировала, что самая большая модель Llama 3 будет иметь более 400 миллиардов параметров и все еще находится в процессе обучения.

Недавно в сообществе LocalLLaMA были опубликованы ранние результаты тестирования моделей Llama 3.1 8B, 70B и 405B. Утечка данных указывает на то, что Llama 3.1 405B может превзойти текущего лидера, модель GPT-4o от OpenAI, по нескольким ключевым показателям. Это важный шаг для сообщества открытого ИИ, так как это первый случай, когда открытая модель может обойти закрытую модель, считающуюся эталоном.

image.png.08102b6654f0626d8c618d1a841a9f9c.png

Meta* подтвердила свою приверженность развитию открытой экосистемы ИИ, заявив, что открытость способствует созданию лучших и более безопасных продуктов, ускоряет инновации и создает более здоровый рынок. В тестах Llama 3.1 показала лучшие результаты, чем GPT-4o, в таких тестах, как GSM8K, Hellaswag, boolq и MMLU по различным направлениям. Однако в тестах HumanEval и MMLU по социальным наукам Llama 3.1 уступает.

Важно отметить, что эти результаты получены на базовых моделях Llama 3.1, и для полного раскрытия потенциала модели необходимо ее дообучение с использованием инструкций. Ожидается, что результаты улучшатся с выходом версий Instruct моделей Llama 3.1. Хотя предстоящая модель GPT-5 от OpenAI, обладающая продвинутыми возможностями рассуждения, может составить конкуренцию Llama 3.1, сильные результаты последней подчеркивают мощь и потенциал развития открытого ИИ. Этот прогресс может способствовать демократизации доступа к передовым технологиям ИИ и ускорению инноваций в технологической отрасли.

* Признана экстремистской организацией и запрещена в РФ

image.png.9d5b4205072e7e483a6f7d59aebe58e3.pngimage.png.401b8a419d2091e7d0b7f9d60646a724.png

Ссылка на комментарий
Поделиться на другие сайты

Краткое описание текста: В апреле 2024 года Meta представила Llama 3, новую серию открытых языковых моделей. Уже через три месяца появились обновленные модели Llama 3.1, которые по предварительным тестам превзошли GPT-4o от OpenAI по многим показателям. Llama 3.1 405B, самая большая модель в серии, демонстрирует превосходные результаты в тесте GSM8K, Hellaswag, boolq и MMLU. Однако в тестах HumanEval и MMLU по социальным наукам она пока уступает GPT-4o.

Важно отметить, что эти результаты получены на базовых моделях Llama 3.1. Ожидается, что после дообучения с инструкцией результаты улучшатся. Несмотря на то, что предстоящая модель GPT-5 от OpenAI может составить конкуренцию Llama 3.1, сильные показатели последней подчеркивают потенциал открытого ИИ. Данный прогресс может способствовать democratization доступа к передовым технологиям и ускорить инновации в сфере ИИ.
Ссылка на комментарий
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...