1. Главная
  2. »
  3. Технологии
  4. »
  5. Meta представила крупнейшую бесплатную модель ИИ Llama 3, владеющую 8 языками

Meta представила крупнейшую бесплатную модель ИИ Llama 3, владеющую 8 языками

Новая модель Llama 3 может общаться на восьми языках, писать качественный компьютерный код и решать более сложные математические задачи, чем предыдущие версии.

С 405 миллиардами параметров, или переменных, которые алгоритм учитывает для генерации ответов на запросы пользователей, он превосходит предыдущую версию, выпущенную в прошлом году, хотя все еще уступает ведущим моделям конкурентов — модель GPT-4 от OpenAI имеет один триллион параметров, а Amazon готовит модель с 2 триллионами параметров, передает incrussia.ru. Марк Цукерберг надеется, что будущие модели Llama обгонят конкурентов уже к концу этого года. По его словам, чат-бот Meta AI*, работающий на этих моделях, должен стать самым популярным помощником AI, а сотни миллионов людей уже используют его. В компании заявили, что в дополнение к своей флагманской модели с 405 миллиардами параметров компания выпускает обновленные версии своих более легких моделей Llama 3 с 8 миллиардами и 70 миллиардами параметров, которые были представлены весной.Все три новые модели являются многоязычными и могут обрабатывать более крупные пользовательские запросы с помощью расширенного «контекстного окна». «Это был главный отзыв, который мы получили от сообщества», — рассказал руководитель отдела генеративного ИИ компании Meta Ахмад Аль-Дахле, отметив, что большие контекстные окна дают моделям что-то вроде более длинной памяти, которая помогает обрабатывать многоэтапные запросы.Meta выпускает свои модели Llama в основном бесплатно для использования разработчиками. По словам Цукерберга, эта стратегия окупится в виде инновационных продуктов, меньшей зависимости от потенциальных конкурентов и более активного участия в социальных сетях компании. Однако некоторые инвесторы удивились, увидев связанные с этим расходы.Результаты тестов, предоставленные Meta свидетельствуют о том, что Llama 3 почти соответствует, а в некоторых случаях и превосходит Claude 3.5 Sonnet от Anthropic и GPT-4o от OpenAI. Например, на тесте MATH по решению математических текстовых задач соревновательного уровня модель Meta показала результат 73,8, тогда как у GPT-4o он составил 76,6, а у Claude 3.5 Sonnet — 71,1. Модель набрала 88,6 баллов по MMLU — тесту, охватывающему десятки предметов по математике, естественным наукам и гуманитарным дисциплинам, в то время как GPT-4o набрала 88,7 баллов, а Claude 3.5 Sonnet — 88,3 баллов. В Meta также рассказали о «мультимодальных» версиях моделей, которые должны выйти в этом году и которые будут накладывать возможности обработки изображений, видео и речи на базовую текстовую модель Llama 3. Ранние эксперименты показывают, что эти модели могут конкурировать с другими мультимодальными моделями, такими как Gemini 1.5 от Google и Claude 3.5 Sonnet от Anthropic.

Комментировать

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Читайте также

Сейчас читают