Google passe à « l'IA ouverte » avec Gemma, une famille de chatbots gratuits et à poids ouvert

[ad_1]

Mercredi, Google a annoncé une nouvelle famille de modèles de langage d'IA appelée Gemma, qui sont des modèles gratuits et à pondération ouverte construits sur une technologie similaire aux modèles Gemini plus puissants mais fermés. Contrairement à Gemini, les modèles Gemma peuvent fonctionner localement sur un ordinateur de bureau ou portable. Il s'agit de la première version importante d'un grand modèle de langage ouvert (LLM) de Google depuis que ChatGPT d'OpenAI a déclenché une frénésie pour les chatbots IA en 2022.

Les modèles Gemma sont disponibles en deux tailles : Gemma 2B (2 milliards de paramètres) et Gemma 7B (7 milliards de paramètres), chacun disponible en variantes pré-entraînées et adaptées aux instructions. En IA, les paramètres sont des valeurs d'un réseau neuronal qui déterminent le comportement du modèle d'IA, et les poids sont un sous-ensemble de ces paramètres stockés dans un fichier.

Développé par Google DeepMind et d'autres équipes d'IA de Google, Gemma s'appuie sur des techniques apprises lors du développement de Gemini, qui est le nom de famille des LLM commerciaux (publics) les plus performants de Google, y compris ceux qui alimentent son assistant Gemini AI. Google dit que le nom vient du latin gemmequi signifie « pierre précieuse ».

Bien que Gemma soit le premier LLM ouvert majeur de Google depuis le lancement de ChatGPT (il a publié des modèles de recherche plus petits tels que FLAN-T5 dans le passé), ce n'est pas la première contribution de Google à la recherche ouverte sur l'IA. La société cite le développement de l'architecture Transformer, ainsi que des versions telles que TensorFlow, BERT, T5 et JAX comme contributions clés, et il ne serait pas controversé de dire que celles-ci ont été importantes dans le domaine.

Un graphique des performances de Gemma fourni par Google.  Google affirme que Gemma surpasse le Llama 2 de Meta sur plusieurs benchmarks.

En raison de leurs capacités moindres et de leurs taux de confabulation élevés, les LLM à poids ouvert plus petits ressemblaient davantage à des démonstrations technologiques jusqu'à récemment, car certains plus grands ont commencé à correspondre aux niveaux de performances GPT-3.5. Pourtant, les experts considèrent les modèles d’IA disponibles à la source et à pondération ouverte comme des étapes essentielles pour garantir la transparence et la confidentialité des chatbots. Google Gemma n'est cependant pas « open source », puisque ce terme fait généralement référence à un type spécifique de licence logicielle avec peu de restrictions.

En réalité, Gemma ressemble à un jeu remarquable pour égaler Meta, qui a fait toute une histoire en lançant des modèles à poids ouverts (tels que LLaMA et Llama 2) depuis février de l'année dernière. Cette technique s'oppose aux modèles d'IA comme le GPT-4 Turbo d'OpenAI, qui n'est disponible que via l'application ChatGPT et une API cloud et ne peut pas être exécuté localement. Un rapport de Reuters sur Gemma se concentre sur l'angle Meta et suppose que Google espère attirer davantage de développeurs vers sa plate-forme cloud Vertex AI.

Nous n'avons pas encore utilisé Gemma ; cependant, Google affirme que le modèle 7B surpasse les modèles Llama 2 7B et 13B de Meta sur plusieurs tests de référence en matière de mathématiques, de génération de code Python, de connaissances générales et de tâches de raisonnement de bon sens. Il est disponible aujourd'hui via Kaggle, une plateforme communautaire d'apprentissage automatique, et Hugging Face.

Par ailleurs, Google a associé la version Gemma à une « boîte à outils d'IA générative responsable », qui, espère Google, offrira des conseils et des outils pour développer ce que l'entreprise appelle des applications d'IA « sûres et responsables ».

[ad_2]

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*