Exemples de voix générées avec Gemini 2.5 TTS : air triste

Découvrez des exemples de voix tristes générées avec Gemini 2.5 TTS. Ce modèle de synthèse vocale produit des intonations naturelles et expressives. Écoutez des échantillons et explorez les possibilités offertes par cette technologie IA.

Démonstration de Gemini 2.5 Flash Preview TTS dans la restitution d'une tonalité triste. Ce modèle TTS génère des voix expressives et naturelles, adaptées aux projets nécessitant une dimension émotionnelle. Comparez les 30 profils vocaux disponibles pour des résultats variés.

Prompt original (température 0.5)

Prononce cette phrase d'un air triste.
Cette tristesse glaciale s'est enracinée en moi, siphonnant mon énergie et ma volonté. Je me sens comme une coquille vide, un corps qui marche sans but ni joie.

Échantillons vocaux

Voix féminines

audio-thumbnail
Achernar
0:00
/14.810958
audio-thumbnail
Aoede
0:00
/15.050958
audio-thumbnail
Autonoe
0:00
/16.250958
audio-thumbnail
Callirrhoe
0:00
/15.050958
audio-thumbnail
Despina
0:00
/14.690958
audio-thumbnail
Erinome
0:00
/18.050958
audio-thumbnail
Gacrux
0:00
/266.010958
audio-thumbnail
Kore
0:00
/15.610958
audio-thumbnail
Laomedeia
0:00
/16.010958
audio-thumbnail
Leda
0:00
/15.890958
audio-thumbnail
Sulafat
0:00
/17.010958
audio-thumbnail
Vindemiatrix
0:00
/16.290958
audio-thumbnail
Zephyr
0:00
/15.090958

Voix neutre

audio-thumbnail
Pulcherrima
0:00
/15.530958

Voix masculines

audio-thumbnail
Achird
0:00
/15.130958
audio-thumbnail
Algenib
0:00
/18.250958
audio-thumbnail
Algieba
0:00
/15.890958
audio-thumbnail
Alnilam
0:00
/14.690958
audio-thumbnail
Charon
0:00
/16.570958
audio-thumbnail
Enceladus
0:00
/17.730958
audio-thumbnail
Fenrir
0:00
/15.970958
audio-thumbnail
Iapetus
0:00
/14.610958
audio-thumbnail
Orus
0:00
/15.530958
audio-thumbnail
Puck
0:00
/15.810958
audio-thumbnail
Rasalgethi
0:00
/13.810958
audio-thumbnail
Sadachbia
0:00
/20.370958
audio-thumbnail
Sadaltager
0:00
/14.690958
audio-thumbnail
Schedar
0:00
/15.090958
audio-thumbnail
Umbriel
0:00
/18.690958
audio-thumbnail
Zubenelgenubi
0:00
/14.530958

Observations

Hallucinations (long blanc à la fin de Gacrux) et style théatral… Ce sont les limites d'un modèle text-to-speech.

Mes premières expérimentations avec Gemini TTS
Astuces et exemples d’utilisation de Gemini TTS.

D'autres styles sont plus convaincants

Cliquer pour écouter des exemples :

Méthode de génération

Les fichiers audio ont été créés en suivant ces étapes :

  1. Plateforme : J'ai utilisé Generate speech dans Google AI Studio pour accéder au modèle Gemini 2.5 Flash Preview TTS
  2. Mode : Sélection du mode "Single-speaker audio" pour une voix cohérente
  3. Prompt : Utilisation du texte exact fourni dans le prompt
  4. Paramètres du modèle : Température réduite à 0.5 pour limiter les hallucinations avec ce texte prononcé en une quinzaine de secondes