← Catalogue
🧠 Modèle IAai_modelCN
CogVideo
Modèle de génération de vidéos text-to-video à partir de descriptions textuelles en chinois.
À propos
CogVideo est un modèle de génération vidéo de Tsinghua University, conçu pour générer des clips vidéo courts à partir de descriptions textuelles. Il est particulièrement connu pour sa capacité à comprendre et à générer des vidéos basées sur des prompts en chinois. Le modèle exploite une architecture Transformer et a été entraîné sur un large corpus de paires texte-vidéo, montrant des capacités impressionnantes pour créer des séquences visuelles cohérentes à partir de directives linguistiques.
Fonctionnalités clés
- Génération vidéo text-to-video
- Support du chinois
- Clips vidéo courts
- Architecture Transformer
Tarification
Gratuit (open-source, recherche)
Avantages
- Génération vidéo à partir de texte
- Performant en chinois
- Base pour la recherche en génération vidéo
Inconvénients
- Qualité vidéo variable
- Limitations sur la durée des clips
- Nécessite des ressources importantes
Alternatives
Make-A-VideoStable Video Diffusion