10 modèles
DeepSeek/DeepSeek V4 Flash
Version réduite et plus économique de DeepSeek V4 Pro, qui conserve la même fenêtre d'un million de jetons en entrée pour l'analyse de très longs documents. Son tarif d'API se situe parmi les plus bas de sa catégorie pour le traitement du long contexte, à un niveau de performance comparable à celui des modèles intermédiaires propriétaires, ce qui en fait une option intéressante en termes de rapport coût/performance. Il intègre une capacité de raisonnement avancée activable à la demande, avec un niveau de raisonnement paramétrable par l'utilisateur ou le développeur.
- Nouveau
Google/Gemini 2.5 Flash
Grand modèle multimodal et multilingue avec deux modalités de réponses: l’utilisateur peut choisir entre un mode de raisonnement, pour des réponses plus approfondies, ou un mode rapide, pour générer directement à la réponse finale.
Google/Gemini 2.5 Pro
Modèle multimodal phare de Google, conçu pour des tâches complexes nécessitant un raisonnement avancé, une compréhension fine et une grande précision.
Google/Gemma 4 31B
Variante dense de la famille Gemma 4, ce modèle de taille moyenne multimodal est performant en génération de code, raisonnement et compréhension de documents. Il intègre une capacité de raisonnement avancée activable à la demande, avec un niveau de raisonnement paramétrable par l'utilisateur ou le développeur.
- Nouveau
OpenAI/GPT OSS-120B
Le plus grand des deux premiers modèles semi-ouverts d'OpenAI depuis GPT-2. Conçu en réponse à la montée en puissance des acteurs open source comme Meta (LLaMA) et Mistral, il s'agit d'un modèle de raisonnement performant, notamment sur des tâches complexes et dans des environnements « agentiques ».
OpenAI/GPT-4o mini
Le plus petit des deux modèles sur lesquels repose ChatGPT d'OpenAI, lancé en juillet 2024.
Meta/Llama 3.1 8B
Petit modèle conçu pour un usage local sur ordinateur portable, tout en offrant de bonnes capacités pour la synthèse de texte et les réponses simples.
Mistral AI/Mistral Medium 3.1
Modèle de taille moyenne multilingue, multimodal et peu couteux par rapport à d’autres modèles qui offrent des performances similaires. Il est devenu particulièrement intéressant après une mise à jour en août 2025 avec des améliorations importantes de performance générale, un ton "amélioré" et une meilleure capacité de chercher des informations sur Internet.
Nvidia/Nemotron 3 Nano Omni 30B-A3B
Grand modèle multimodal de Nvidia, le fabricant de cartes graphiques, capable de traiter du texte, des images, des vidéos et de l'audio en une seule inférence. Fondé sur une architecture hybride Mamba-Transformer à mélange d'experts, il est conçu pour fonctionner comme sous-agent de perception dans des systèmes d'agents d'entreprise. Nvidia publie les poids, les recettes d'entraînement et une grande partie des données d'entraînement.
OpenRouter/Owl Alpha
Modèle fondation haute performance d'OpenRouter, conçu pour les tâches agentiques. Supporte nativement l'appel d'outils et les contextes très longs, avec de bonnes capacités en génération de code, automatisation de workflows et exécution d'instructions complexes. Compatible avec Claude Code, OpenClaw et d'autres outils de productivité. Publié en tant que modèle « stealth » : l'identité de l'équipe de développement n'est pas divulguée.