SaaS Tech StudioSaaS Tech Studio
← Catalogue
🧠 Modèle IAai_modelCN

CogVideo

Modèle de génération de vidéos text-to-video à partir de descriptions textuelles en chinois.

À propos

CogVideo est un modèle de génération vidéo de Tsinghua University, conçu pour générer des clips vidéo courts à partir de descriptions textuelles. Il est particulièrement connu pour sa capacité à comprendre et à générer des vidéos basées sur des prompts en chinois. Le modèle exploite une architecture Transformer et a été entraîné sur un large corpus de paires texte-vidéo, montrant des capacités impressionnantes pour créer des séquences visuelles cohérentes à partir de directives linguistiques.

Fonctionnalités clés

  • Génération vidéo text-to-video
  • Support du chinois
  • Clips vidéo courts
  • Architecture Transformer

Tarification

Gratuit (open-source, recherche)

Avantages

  • Génération vidéo à partir de texte
  • Performant en chinois
  • Base pour la recherche en génération vidéo

Inconvénients

  • Qualité vidéo variable
  • Limitations sur la durée des clips
  • Nécessite des ressources importantes

Alternatives

Make-A-VideoStable Video Diffusion