← Catalogue
🧠 Modèle IAai_modelUS
AudioLM
Modèle de génération audio de Google DeepMind capable de synthétiser des séquences de parole et de musique.
À propos
AudioLM est un modèle génératif de Google DeepMind capable de synthétiser des séquences audio de haute fidélité, qu'il s'agisse de parole ou de musique, simplement à partir de quelques secondes de contexte. Il a démontré des capacités impressionnantes pour la continuation de morceaux musicaux et la génération de parole cohérente et naturelle.
Fonctionnalités clés
- Génération de parole
- Génération de musique
- Complétion audio
- Représentations auto-supervisées
Tarification
Propriétaire (recherche, non commercialisé directement)
Avantages
- Génération audio réaliste
- Capable de saisir des styles
- Potentiel pour la création musicale
Inconvénients
- Pas d'accès public
- Très gourmand en calcul
- Limité aux scénarios de recherche
Alternatives
WaveNetRiffusion