Amazon dévoile Nova, un générateur d’image d’IA surpuissant

Par David Laurent
le 05/12/2024
Publié dans Apps et Logiciels

Amazon vient de dévoiler ses derniers modèles de génération de texte, d’image et de vidéo regroupés sous l’appellation Amazon Nova. Les modèles Micro, Lite et Pro sont d’ores et déjà disponibles pour les clients AWS.

De nombreuses entreprises se sont lancées dans la course au générateur de vidéo d’IA. On pense par exemple au créateur de ChatGPT, OpenAI, qui a récemment dévoilé son générateur de vidéo Sora, ou encore à Google, qui a lancé son générateur Veo plus tôt cette année. De son côté, le célèbre logiciel de montage Adobe Premiere Pro dispose lui aussi d’un générateur de vidéo intégré. Mais c’est cette fois au tour du géant de la distribution Amazon, qui vient de présenter ses outils de générations d’images d’IA.

On retrouve tout d’abord Nova Premier, le modèle multimodal le plus performant pour des tâches de raisonnement complexes. On trouve ensuite Nova Micro, une IA conçue pour générer des réponses à faible coût et à faible latence. Nova Lite, de son côté, se veut être un modèle multimodal à faible coût pour le traitement d’images, de vidéos et de textes. Enfin, on trouve Nova Pro, une IA à usage général qui combine « précision, vitesse et coût pour un large éventail de tâches », selon Amazon.

Nova : des modèles d’IA particulièrement économiques

Amazon met en avant le côté économique de ses modèles d’IA. Il est vrai que des IA telles que ChatGPT consomment d’importantes quantités d’énergie. Andy Jassy, PDG d’Amazon, affirme ainsi : « Nous avons optimisé ces modèles pour qu’ils fonctionnent avec des systèmes et des API propriétaires, de sorte que vous pouvez effectuer plusieurs étapes automatiques orchestrées – comportement de l’agent – beaucoup plus facilement avec ces modèles. Je pense donc que ces modèles sont très convaincants. »

Selon Amazon, Nova Micro offre une fenêtre contextuelle de 128 000 tokens. Les modèles Lite et Pro, de leur côté, seraient capables de gérer jusqu’à 300 000 tokens, soit environ 225 000 mots ou 30 minutes de vidéo. L’ensemble de ces modèles prendraient en charge une quinzaine de langues différentes.

« Nous avons continué à travailler sur nos propres modèles de frontières », ajoute le responsable. « Et ces modèles de frontières ont fait d’énormes progrès au cours des quatre ou cinq derniers mois. Nous nous sommes dit que si nous y trouvions de la valeur, vous en trouveriez sans doute aussi. »

Source : digitaltrends

Amazon dévoile Nova, un générateur d’image d’IA surpuissant

Nova : des modèles d’IA particulièrement économiques

La rédaction vous conseille :