← Catalogue
🧠 Modèle IAai_modelUS
CoDi
Modèle multimodal qui génère des sorties cohérentes à partir de diverses entrées : texte, audio, image, vidéo.
À propos
CoDi (Conditional Diffusion Model for Any-to-Any Generation) de Microsoft est un modèle génératif multimodal capable de créer des sorties interconnectées provenant de n'importe quelle combinaison de modalités d'entrée, y compris texte, audio, images et vidéo. Il peut par exemple générer une vidéo et une piste audio synchronisées à partir d'une description textuelle, ou enrichir une image avec du son.
Fonctionnalités clés
- Génération multimodale
- Entrées diverses
- Sorties cohérentes
- Architecture de diffusion
Tarification
Gratuit (open-source)
Avantages
- Capacités de génération très polyvalentes
- Nouveauté et innovation
- Ouvre de nouvelles possibilités créatives
Inconvénients
- Complexité d'intégration
- Qualité des sorties variables
- Intensif en ressources
Alternatives
Meta EMUGoogle Imagen VideoN/A (modèle très novateur)