SaaS Tech StudioSaaS Tech Studio
← Catalogue
🧠 Modèle IAai_modelGB

WaveNet

Modèle génératif de DeepMind pour la synthèse vocale très réaliste utilisant des réseaux convolutifs.

À propos

WaveNet est un modèle de DeepMind initialement introduit en 2016, qui a révolutionné la synthèse vocale en générant des formes d'onde audio brutes avec un réalisme sans précédent. Contrairement aux méthodes paramétriques traditionnelles, WaveNet ne se contente pas de prédire le spectre ou les paramètres vocaux, mais synthétise échantillon par échantillon. Il utilise des réseaux convolutifs dilatés pour encapsuler un large champ réceptif, ce qui lui permet de reproduire des sons vocaux très naturels.

Fonctionnalités clés

  • Synthèse vocale hyper-réaliste
  • Génération échantillon par échantillon
  • Modélisation probabiliste
  • Application en TTS

Tarification

Propriétaire (utilisé dans Google Assistant)

Avantages

  • Qualité vocale inégalée à l'époque
  • Capacité à générer divers styles vocaux
  • Base pour de nombreux modèles de synthèse modernes

Inconvénients

  • Intensif en calcul pour l'inférence
  • Lent pour la génération en temps réel (versions initiales)

Alternatives

Lyrebird AITacotron 2