科技

Mistral's Large 2 - ответ на последние модели Meta и OpenAI

Для передовых моделей искусственного интеллекта, когда идет дождь, это льет как из ведра. В среду Mistral выпустил новую флагманскую модель Large 2, которую он утверждает на уровне с последними передовыми моделями от OpenAI и Meta по кодогенерации, математике и рассуждениям.

Релиз Mistral Large 2 случился всего на один день позже, чем Meta выпустила свою последнюю и самую лучшую модель с открытым исходным кодом, Llama 3.1 405B. Mistral говорит, что Large 2 поднимает планку производительности и стоимости для открытых моделей, подкрепляя это несколькими бенчмарками.

Large 2, по всей видимости, опережает Llama 3.1 405B по генерации кода и математической производительности, и делает это с менее чем третью частью параметров: 123 миллиарда, что точно.

В пресс-релизе Mistral говорит, что одним из его ключевых упорных пунктов во время тренировки было минимизировать проблемы галлюцинаций модели. Компания говорит, что Large 2 был обучен быть более различительным в своих ответах, признавая, когда не знает что-то, вместо того, чтобы выдумывать что-то, что кажется правдоподобным.

Парижская стартап-компания по искусственному интеллекту недавно привлекла $640 млн в раунде финансирования серии B, возглавленном General Catalyst, под оценку $6 млрд. Хотя Mistral является одним из новых участников в пространстве искусственного интеллекта, он быстро доставляет модели искусственного интеллекта на или около передовых позиций.

Тем не менее, важно отметить, что модели Mistral, как и большинство других, не являются открытыми в традиционном смысле слова - любое коммерческое применение модели требует платной лицензии. И хотя она более открытая, чем, скажем, GPT-4o, немногие в мире обладают экспертизой и инфраструктурой для внедрения такой крупной модели. (Это относится вдвойне к 405 миллиардам параметров Llama, конечно.)

Что отсутствует в Mistral Large 2, и отсутствовало в релизе Llama 3.1 от Meta вчера, - это мультимодальная способность. OpenAI находится далеко впереди конкурентов по мультимодальным системам искусственного интеллекта, способным обрабатывать изображения и текст одновременно, функцию, которую некоторые стартапы все чаще пытаются создавать.

Модель имеет окно из 128 000 токенов, что означает, что Large 2 может принимать очень много данных в одной подсказке (128 000 токенов равно примерно книге на 300 страниц). Новая модель Mistral также включает улучшенную многоязычную поддержку. Large 2 понимает английский, французский, немецкий, испанский, итальянский, португальский, арабский, хинди, русский, китайский, японский и корейский, а также 80 языков программирования. Заметно, что Mistral утверждает, что Large 2 также производит более краткие ответы, чем ведущие модели искусственного интеллекта, которые имеют тенденцию болтать.

Mistral Large 2 доступен для использования на Google Vertex AI, Amazon Bedrock, Azure AI Studio и IBM watsonx.ai. Вы также можете использовать новую модель на La Plateforme Mistral под названием "mistral-large-2407" и протестировать ее бесплатно на конкуренте стартапа ChatGPT, Le Chat.

Related Articles

Back to top button Back to top button