← Catalogue
🧠 Modèle IAai_modelGB
DeepMind Flamingo
Un modèle multimodal de DeepMind qui intègre la vision et le langage.
À propos
Flamingo est un modèle de DeepMind qui combine un réseau de vision puissant avec un grand modèle de langage, lui permettant de 'voir' et de 'parler' de manière cohérente. Il peut répondre à des questions sur des images ou générer des légendes contextuelles.
Fonctionnalités clés
- Compréhension visuelle et textuelle
- Génération de légendes d'images
- Réponse aux questions visuelles
Tarification
Recherche/Propriétaire
Avantages
- Capacités visio-linguistiques impressionnantes
- Base pour la multimodalité
- Innovation de recherche
Inconvénients
- Accès limité à la recherche
- Non public
Alternatives
Meta ImageBind (concept)CLIP