Exemples de voix générées avec Gemini 2.5 TTS : air triste
Découvrez des exemples de voix tristes générées avec Gemini 2.5 TTS. Ce modèle de synthèse vocale produit des intonations naturelles et expressives. Écoutez des échantillons et explorez les possibilités offertes par cette technologie IA.
Démonstration de Gemini 2.5 Flash Preview TTS dans la restitution d'une tonalité triste. Ce modèle TTS génère des voix expressives et naturelles, adaptées aux projets nécessitant une dimension émotionnelle. Comparez les 30 profils vocaux disponibles pour des résultats variés.
Prompt original (température 0.5)
Prononce cette phrase d'un air triste.
Cette tristesse glaciale s'est enracinée en moi, siphonnant mon énergie et ma volonté. Je me sens comme une coquille vide, un corps qui marche sans but ni joie.
Échantillons vocaux
Voix féminines
Achernar
0:00
/14.810958
Aoede
0:00
/15.050958
Autonoe
0:00
/16.250958
Callirrhoe
0:00
/15.050958
Despina
0:00
/14.690958
Erinome
0:00
/18.050958
Gacrux
0:00
/266.010958
Kore
0:00
/15.610958
Laomedeia
0:00
/16.010958
Leda
0:00
/15.890958
Sulafat
0:00
/17.010958
Vindemiatrix
0:00
/16.290958
Zephyr
0:00
/15.090958
Voix neutre
Pulcherrima
0:00
/15.530958
Voix masculines
Achird
0:00
/15.130958
Algenib
0:00
/18.250958
Algieba
0:00
/15.890958
Alnilam
0:00
/14.690958
Charon
0:00
/16.570958
Enceladus
0:00
/17.730958
Fenrir
0:00
/15.970958
Iapetus
0:00
/14.610958
Orus
0:00
/15.530958
Puck
0:00
/15.810958
Rasalgethi
0:00
/13.810958
Sadachbia
0:00
/20.370958
Sadaltager
0:00
/14.690958
Schedar
0:00
/15.090958
Umbriel
0:00
/18.690958
Zubenelgenubi
0:00
/14.530958
Observations
Hallucinations (long blanc à la fin de Gacrux) et style théatral… Ce sont les limites d'un modèle text-to-speech.
Mes premières expérimentations avec Gemini TTS
Astuces et exemples d’utilisation de Gemini TTS.

D'autres styles sont plus convaincants
Cliquer pour écouter des exemples :
Méthode de génération
Les fichiers audio ont été créés en suivant ces étapes :
- Plateforme : J'ai utilisé Generate speech dans Google AI Studio pour accéder au modèle Gemini 2.5 Flash Preview TTS
- Mode : Sélection du mode "Single-speaker audio" pour une voix cohérente
- Prompt : Utilisation du texte exact fourni dans le prompt
- Paramètres du modèle : Température réduite à 0.5 pour limiter les hallucinations avec ce texte prononcé en une quinzaine de secondes