Gemini : Google corrige enfin son générateur d’images d’IA, voici comment

En début d’année, Google a temporairement suspendu la capacité de Gemini à générer des images, après que ce dernier a fait plus ou moins n’importe quoi. Mais, selon le géant du numérique, ce problème est maintenant résolu.

Suite au succès mondial rencontré par ChatGPT d’OpenAI, Google n’aura pas attendu longtemps pour rattraper son retard en matière d’IA. En effet, bien que Bard, l’une des premières IA de l’entreprise, ait raté son lancement, Google a rapidement sorti Gemini, une IA qui aurait pour objectif de détrôner le GPT-4 d’OpenAI. Gemini est d’ailleurs en train de remplacer purement et simplement Google Assistant.

Crédit photo : Google

Mais Google ne s’est pas arrêté là et a rapidement permis à Gemini de générer des images, tout comme le Grok-2 de xAI, l’entreprise d’Elon Musk. Malheureusement, les utilisateurs ont pu constater d’importantes inexactitudes historiques. Lorsqu’on lui demandait, par exemple, de générer une légion romaine, l’IA proposait des personnages particulièrement anachroniques, ce qui a provoqué la risée des internautes.

Gemini : un correctif réservé aux abonnés payants ?

Peu de temps après, le PDG de Google a présenté ses excuses, tandis que Demis Hassabis, cofondateur de DeepMind, a déclaré qu’un correctif devrait arriver « dans les plus brefs délais ». Il aura toutefois fallu attendre de longs mois avant que ce correctif ne soit mis en place. La fonction de génération de personnes devrait ainsi progressivement être réintroduite, en commençant par les abonnés payants à des services tels que Gemini Advanced, Business ou Enterprise.

Afin d’y parvenir, Google aurait modifié Imagen 3, le dernier modèle de génération d’images intégré à Gemini, afin de rendre les images de personnes produites par Gemini plus « équitables » selon l’entreprise. Ce changement aurait ainsi pour but d’« améliorer la variété et la diversité des concepts associés aux images dans [ses] données d’entraînement ».

Le porte-parole de Google précise ainsi : « Nous avons considérablement réduit le potentiel de réponses indésirables grâce à des tests internes et externes approfondis, en collaboration avec des experts indépendants, afin de garantir une amélioration continue. Nous nous sommes attachés à tester rigoureusement la génération de personnes avant de la réactiver ».

Source : techcrunch