Turtle Blog > Intelligence Artificielle > Actualités IA > Google dévoile son modèle d'IA de nouvelle génération : Gemini 1.5
Rechercher

Google dévoile son modèle d’IA de nouvelle génération : Gemini 1.5

Table des matières

Sundar Pichai, PDG de Google et d’Alphabet, et Demis Hassabis, PDG de Google DeepMind, ont annoncé la sortie de Gemini 1.5, un modèle d’intelligence artificielle (IA) de nouvelle génération. Ce modèle révolutionnaire offre des performances considérablement améliorées, notamment grâce à des avancées majeures dans la compréhension du long contexte à travers différentes modalités.

Les points clés de l’article : 

1. Architecture et performances accrues

  • Architecture MoE pour une meilleure efficacité.
  • Fenêtre de contexte de 1 million de tokens, la plus grande à ce jour.
  • Performances supérieures à Gemini 1.0 Pro sur 87% des benchmarks.

2. Compréhension du long contexte et capacités étendues

  • Analyse et résumé de grandes quantités de contenu.
  • Raisonnement complexe sur différentes modalités (texte, vidéo, code).
  • Résolution de problèmes plus pertinents dans des blocs de code plus longs.

3. Accès et sécurité

  • Aperçu limité disponible pour les développeurs et les entreprises.
  • Version standard avec une fenêtre de contexte de 128 000 tokens à la sortie officielle.
  • Tests approfondis pour garantir l’éthique et la sécurité du modèle.

Architecture efficace et longue fenêtre de contexte

Gemini 1.5 bénéficie d’une architecture innovante basée sur les Transformers et les modèles Mixture-of-Experts (MoE). Les MoE divisent le réseau neuronal en experts plus petits et spécialisés, permettant une activation sélective en fonction de l’entrée donnée.

Grâce à cette architecture, Gemini 1.5 peut traiter des informations plus complexes et apprendre plus rapidement tout en étant plus efficace à entraîner et à utiliser. Il est capable de traiter des fenêtres de contexte allant jusqu’à 1 million de tokens, ce qui représente la plus grande fenêtre de contexte de tous les modèles de base à grande échelle à ce jour.

Capacités accrues et raisonnement complexe

Cette capacité de traitement de longue durée permet à Gemini 1.5 d’analyser, de classifier et de résumer de grandes quantités de contenu. Il peut par exemple analyser les 402 pages des transcriptions de la mission Apollo 11 sur la Lune, en raisonnant sur les conversations, les événements et les détails présents dans tout le document.

De plus, Gemini 1.5 peut effectuer des tâches sophistiquées de compréhension et de raisonnement sur différentes modalités, y compris la vidéo. Il peut ainsi analyser une vidéo muette de Buster Keaton de 44 minutes et identifier des points clés de l’intrigue, y compris des détails subtils.

Enfin, il est capable de résoudre des problèmes plus pertinents dans des blocs de code plus longs. Face à un prompt contenant plus de 100 000 lignes de code, il peut proposer des modifications utiles et expliquer le fonctionnement de différentes parties du code.

Performances améliorées et sécurité approfondie

Comparé à Gemini 1.0 Pro, Gemini 1.5 surpasse les benchmarks dans 87% des évaluations utilisées pour développer les grands modèles de langage (LLM). Il atteint des performances similaires à Gemini 1.0 Ultra sur les mêmes benchmarks.

Les développeurs et les entreprises peuvent dès aujourd’hui bénéficier d’un aperçu limité de Gemini 1.5 Pro via AI Studio et Vertex AI. Une fenêtre de contexte standard de 128 000 tokens sera proposée lors de la sortie officielle du modèle.

Google accorde une grande importance à l’éthique et à la sécurité de ses modèles d’IA. Gemini 1.5 a subi des tests approfondis pour garantir son utilisation responsable et son atténuation des risques potentiels.

Conclusion

En conclusion, Gemini 1.5 marque une étape majeure dans le développement de l’IA. Sa capacité de compréhension du long contexte et ses performances accrues ouvrent de nouvelles possibilités pour les développeurs et les entreprises.

J’espère que cet article vous donne un aperçu de l’actualité concernant la sortie de Gemini 1.5. N’hésitez pas à me poser des questions si vous souhaitez en savoir plus !

Source : Our next-generation model: Gemini 1.5

Ivann PIERRET

Consultant SEO - Etowline