CM3leon : l'IA de Meta pour créer des images

Meta arrive en trombe sur le marché des générateurs d’images par IA avec CM3leon ! Cette intelligence artificielle a pour but de rivaliser avec ses concurrents, grâce à des performances nettement améliorées et une consommation moindre de puissance de calcul.

Vous avez un projet visuel ? Faites appel à un graphiste freelance sur Codeur.com pour profiter d’un accompagnement personnalisé.

Envie d’en savoir plus sur l’IA générative de Meta ? De comprendre comment fonctionne CM3leon et ses différences avec Dall-E, Midjourney ou Adobe Firefly ? Continuez votre lecture !

Qu’est-ce que CM3leon, la nouvelle IA de Meta ?

CM3leon (à prononcer « chameleon ») est un puissant générateur d’images par intelligence artificielle (IA), développé par Meta, l’entreprise dirigée par Mark Zuckerberg.

Son modèle d’IA, entraîné à l’aide d’une recette innovante basée sur des modèles de texte linguistiques, démontre une précision supérieure à ses concurrents, comme Midjourney ou Dall-E. Grâce à un processus de pré-entraînement étendu, CM3leon atteint des performances exceptionnelles dans la génération d’image à partir de texte… et inversement ! Et c’est une première car, jusqu’à maintenant, ce type de générateur était uniquement capable de créer un visuel d’après un « prompt » (phrase courte décrivant ce que l’image doit représenter).

CM3leon a la capacité de générer à la fois un descriptif et des images, en fonction de n’importe quelle séquence textuelle ou photo. C’est une avancée considérable dans la génération et la compréhension d’images de haute-fidélité.

En quoi CM3leon se différencie des autres générateurs d’images ?

CM3leon est le premier modèle multimodal dont l’entraînement se compose de deux phases : une étape de pré-entraînement à grande échelle augmentée par la recherche et une deuxième étape de réglage fin supervisé multitâche (SFT).

Cette recette permet à CM3leon d’aller encore plus loin que ses concurrents, avec des performances améliorées, la gestion du image-to-text et des corrections poussées sur les visuels générés.

La gestion du image-to-text

L’approche de la génération de contenu multimodal place CM3leon au cœur d’une avancée significative dans le domaine de l’intelligence artificielle. Outre ses performances exceptionnelles en matière de création d’images à partir de texte, ce générateur d’image par IA est également le premier à pouvoir générer du texte à partir de visuels.

Cela élargit considérablement ses fonctionnalités, puisque les IA génératives actuelles sont soit text-to-image, soit image-to-texte.

Le générateur d’images par IA de Meta peut également suivre une série de prompts pour générer des descriptions courtes ou longues, mais aussi répondre à des questions sur une image, afin d’obtenir une légende précise.

Un entraînement « éthique »

L’entraînement de la plupart des générateurs d’image s’est basé sur la récupération de photos accessibles au public sur le Web. Une méthode ayant généré quelques problèmes juridiques… Meta a donc emprunté une voie différente en utilisant uniquement des images sous licence de Shutterstock. Cela affranchit l’entreprise d’éventuelles poursuites liées à la propriété et à l’attribution des images.

Des images plus précises

Après le pré-entraînement sur des visuels Shutterstock, l’intelligence artificielle de CM3leon passe par une étape de réglage fin supervisé (SFT) qui, selon les chercheurs de Meta, produit des résultats hautement optimisés.

Au total, CM3leon dispose d’un total de 7 milliards de paramètres, soit le double de Dall-E, le générateur d’OpenAI. Grâce à ses capacités, l’outil de génération d’images produit des images plus cohérentes, précises, qui respectent mieux les requêtes textuelles.

Voici, par exemple, la photo que CM3leon a généré à partir du prompt ” Une photo en gros plan d’une main humaine, un modèle de main. Haute qualité.” :

Et ci-dessous, une image élaborée à partir du texte « Un panneau d’arrêt dans un style fantastique avec le texte “1991”» :

Des fonctionnalités correctives

La génération d’images peut s’avérer difficile lorsqu’il s’agit d’objets complexes ou que le prompt comprend de nombreuses contraintes.

Avec CM3leon, il est facile d’apporter des corrections à votre visuel, afin qu’il contienne tous les éléments requis. Vous aurez le choix entre guider l’intelligence artificielle via des instructions textuelles, ou demander à CM3leon d’analyser la structure pour apporter des modifications cohérentes.

+250 000 freelances disponibles sur Codeur.com

Recevoir des devis gratuits

Rapide, gratuit et sans obligation

Comment tester CM3leon de Meta ?

CM3leon est encore en développement dans les labos de Meta. Ce générateur d’image par IA n’est donc pas accessible au public. Il n’est même pas certain que l’outil sera distribué un jour. Cependant, compte tenu de sa puissance et de son efficacité de génération, il est très probable que CM3leon dépasse le stade de la recherche et soit lancé à large échelle par Meta. Quand ? Telle est la question…

Notre astuce pour découvrir CM3leon, la nouvelle IA de Meta

CM3leon semble être une avancée significative dans le domaine de la génération d’images par IA ! Sa grande efficacité, son aspect conversationnel et sa capacité à prendre en charge l’image-to-text sont des fonctionnalités intéressantes pour le futur de l’IA générative.

Il ne reste plus qu’à voir comment cette technologie sera utilisée dans l’avenir, que ce soit pour des applications artistiques, scientifiques ou marketing !

En attendant, si vous avez besoin d’aide pour créer des visuels, graphiques ou images professionnelles, vous pouvez faire appel à un freelance sur Codeur.com.

CM3leon : l’IA de Meta pour créer des images