SaaS Tech StudioSaaS Tech Studio
← Catalogue
🧠 Modèle IAai_modelUS

CoDi

Modèle multimodal qui génère des sorties cohérentes à partir de diverses entrées : texte, audio, image, vidéo.

À propos

CoDi (Conditional Diffusion Model for Any-to-Any Generation) de Microsoft est un modèle génératif multimodal capable de créer des sorties interconnectées provenant de n'importe quelle combinaison de modalités d'entrée, y compris texte, audio, images et vidéo. Il peut par exemple générer une vidéo et une piste audio synchronisées à partir d'une description textuelle, ou enrichir une image avec du son.

Fonctionnalités clés

  • Génération multimodale
  • Entrées diverses
  • Sorties cohérentes
  • Architecture de diffusion

Tarification

Gratuit (open-source)

Avantages

  • Capacités de génération très polyvalentes
  • Nouveauté et innovation
  • Ouvre de nouvelles possibilités créatives

Inconvénients

  • Complexité d'intégration
  • Qualité des sorties variables
  • Intensif en ressources

Alternatives

Meta EMUGoogle Imagen VideoN/A (modèle très novateur)