mistral-large 2
Mistral Large 2 est le nouveau modèle phare de Mistral qui est nettement plus capable de générer du code, de mathématiques et de raisonner avec une fenêtre contextuelle de 128k et la prise en charge de dizaines de langues. https://mistral.ai/en/news/mistral-large-2407
tools123b
120.9K PullsUpdated 2 months ago
Mistral-Large-Instruct-2411 est un modèle de langage large (LLM) dense avancé de 123B avec des capacités de raisonnement, de connaissances et de codage de pointe.
Caractéristiques principales
- Multilingue par conception : des dizaines de langues prises en charge, dont l’anglais, le français, l’allemand, l’espagnol, l’italien, le chinois, le japonais, le coréen, le portugais, le néerlandais et le polonais.
- Maîtrise du codage : Formé sur 80+ langages de codage tels que Python, Java, C, C++, JavacScript et Bash. Également formé sur des langages plus spécifiques tels que Swift et Fortran.
- Centré sur l’agentique : les meilleures capacités agentiques de leur catégorie avec appel de fonction natif et sortie JSON.
- Raisonnement avancé : Capacités mathématiques et de raisonnement de pointe.
- Licence Mistral Research : Permet l’utilisation et la modification à des fins de recherche et d’utilisation non commerciale.
- Grand contexte : une grande fenêtre contextuelle de 128 ko.
Mistral Large 2 dispose d’une fenêtre contextuelle de 128k et prend en charge des dizaines de langues, dont le français, l’allemand, l’espagnol, l’italien, le portugais, l’arabe, l’hindi, le russe, le chinois, le japonais et le coréen, ainsi que 80+ langages de codage, dont Python, Java, C, C++, JavaScript et Bash.
Mistral Large 2 est conçu pour l’inférence à nœud unique avec des applications à contexte long à l’esprit - sa taille de 123 milliards de paramètres lui permet de fonctionner à un débit élevé sur un seul nœud. Nous lançons Mistral Large 2 sous la licence de recherche Mistral, qui permet l’utilisation et la modification pour la recherche et les utilisations non commerciales. Pour une utilisation commerciale de Mistral Large 2 nécessitant un auto-déploiement, une licence commerciale Mistral doit être acquise en nous contactant.
Performances générales
Mistral Large 2 établit une nouvelle frontière en termes de performance / coût de service sur les métriques d’évaluation. En particulier, sur MMLU, la version pré-entraînée atteint une précision de 84,0 % et pose un nouveau point sur le front de Pareto performance/coût des modèles ouverts.
Code et raisonnement
Suite à notre expérience avec Codestral 22B et Codestral Mamba, nous avons formé Mistral Large 2 sur une très grande partie du code. Mistral Large 2 surpasse largement le précédent Mistral Large et offre des performances comparables à celles de modèles de premier plan tels que GPT-4o, Claude 3 Opus et Llama 3 405B.
Un effort important a également été consacré à l’amélioration des capacités de raisonnement du modèle. L’un des principaux domaines d’intérêt de la formation était de minimiser la tendance du modèle à « halluciner » ou à générer des informations plausibles, mais factuellement incorrectes ou non pertinentes. Pour ce faire, le modèle a été affiné afin qu’il soit plus prudent et plus perspicace dans ses réponses, en veillant à ce qu’il fournisse des résultats fiables et précis.
De plus, le nouveau Mistral Large 2 est entraîné à accuser réception lorsqu’il ne trouve pas de solutions ou qu’il ne dispose pas de suffisamment d’informations pour fournir une réponse fiable. Cet engagement envers la précision se reflète dans l’amélioration des performances du modèle sur les benchmarks mathématiques populaires, démontrant ses capacités améliorées de raisonnement et de résolution de problèmes :
Précision des performances sur les benchmarks de génération de code (tous les modèles ont été benchmarkés via le même pipeline d’évaluation)
Vous pouvez utiliser Mistral Large 2 dès aujourd’hui via la Plateforme sous le nom de , et le tester sur le Chat. Il est disponible sous la version 24.07 (une version YY. MM que nous appliquons à tous nos modèles), et le nom de l’API . Les poids pour le modèle instruct sont disponibles et sont également hébergés sur HuggingFace.mistral-large-2407mistral-large-2407
mistral-large/model
mistral-large/license
Nous consolidons l’offre sur la Plateforme autour de deux modèles généralistes, Mistral Nemo et Mistral Large, et de deux modèles spécialisés, Codestral et Embed. Au fur et à mesure que nous déprécions les anciens modèles sur la Plateforme, tous les modèles Apache (Mistral 7B, Mixtral 8x7B et 8x22B, Codestral Mamba, Mathstral) restent disponibles pour le déploiement et la mise au point à l’aide de nos SDK mistral-inference et mistral-finetune.
À partir d’aujourd’hui, nous étendons les capacités de mise au point de la Plateforme : elles sont désormais disponibles pour Mistral Large, Mistral Nemo et Codestral.
Accédez aux modèles Mistral via des fournisseurs de services cloud
Nous sommes fiers de nous associer aux principaux fournisseurs de services cloud pour proposer le nouveau Mistral Large 2 à un public mondial. En particulier, nous étendons aujourd’hui notre partenariat avec Google Cloud Platform pour apporter les modèles de Mistral AI sur Vertex AI via une API managée. Les meilleurs modèles de Mistral AI sont désormais disponibles sur Vertex AI, en plus d’Azure AI Studio, Amazon Bedrock et IBM watsonx.ai.
Source en anglais :
Large Enough | Mistral AI https://mistral.ai/en/news/mistral-large-2407
Mistral Large 2 :
llama3.3
New state of the art 70B model. Llama 3.3 70B offers similar performance compared to the Llama 3.1 405B model.
Mistral AI traite vos données personnelles ci-dessous pour fournir le modèle et faire respecter sa licence. Si vous êtes affilié à une entité commerciale, nous pouvons également vous envoyer des communications sur nos modèles. Pour plus d’informations sur vos droits et le traitement des données, veuillez consulter notre politique de confidentialité.
Licence de recherche Mistral AI
Si vous souhaitez utiliser un Modèle Mistral, un Dérivé ou une Sortie à des fins qui ne sont pas expressément autorisées par le présent Contrat, Vous devez demander une licence à Mistral AI, que Mistral AI peut Vous accorder à la seule discrétion de Mistral AI. Pour discuter d’une telle licence, veuillez contacter Mistral AI via le formulaire de contact du site : https://mistral.ai/contact/
1. Champ d’application et acceptation
Conditions Générales de Service
Version en vigueur au 6 février 2025
Bienvenue chez Mistral AI ! Nous fournissons des solutions et des services qui permettent d’accéder et d’utiliser nos modèles d'intelligence artificielle depuis notre plateforme accessible à https://mistral.ai/. Les présentes conditions générales de service (les "Conditions Générales") régissent votre utilisation de La Plateforme, Le Chat et des autres sites web, produits, services et solutions que nous proposons (les
"Services"), sauf lorsque nous indiquons expressément que d'autres conditions s'appliquent (nous désignons ces autres conditions par l'expression "Conditions Particulières").
Les Services sont fournis par Mistral AI, société par actions simplifiée de droit français, immatriculée à Paris sous le numéro 952 418 325, dont le siège social est situé au 15 rue des Halles, 75001 Paris, France (“Mistral AI” ou “nous”).
Aucun commentaire:
Enregistrer un commentaire