Exemples de voix générées avec Gemini 2.5 TTS : air triste

Découvrez des exemples de voix tristes générées avec Gemini 2.5 TTS. Ce modèle de synthèse vocale produit des intonations naturelles et expressives. Écoutez des échantillons et explorez les possibilités offertes par cette technologie IA.

Démonstration de Gemini 2.5 Flash Preview TTS dans la restitution d'une tonalité triste. Ce modèle TTS génère des voix expressives et naturelles, adaptées aux projets nécessitant une dimension émotionnelle. Comparez les 30 profils vocaux disponibles pour des résultats variés.

Prompt original (température 0.5)

Prononce cette phrase d'un air triste.

Cette tristesse glaciale s'est enracinée en moi, siphonnant mon énergie et ma volonté. Je me sens comme une coquille vide, un corps qui marche sans but ni joie.

Échantillons vocaux

Voix féminines

audio-thumbnail

Achernar

0:00

/14.810958

audio-thumbnail

Aoede

0:00

/15.050958

audio-thumbnail

Autonoe

0:00

/16.250958

audio-thumbnail

Callirrhoe

0:00

/15.050958

audio-thumbnail

Despina

0:00

/14.690958

audio-thumbnail

Erinome

0:00

/18.050958

audio-thumbnail

Gacrux

0:00

/266.010958

audio-thumbnail

Kore

0:00

/15.610958

audio-thumbnail

Laomedeia

0:00

/16.010958

audio-thumbnail

Leda

0:00

/15.890958

audio-thumbnail

Sulafat

0:00

/17.010958

audio-thumbnail

Vindemiatrix

0:00

/16.290958

audio-thumbnail

Zephyr

0:00

/15.090958

Voix neutre

audio-thumbnail

Pulcherrima

0:00

/15.530958

Voix masculines

audio-thumbnail

Achird

0:00

/15.130958

audio-thumbnail

Algenib

0:00

/18.250958

audio-thumbnail

Algieba

0:00

/15.890958

audio-thumbnail

Alnilam

0:00

/14.690958

audio-thumbnail

Charon

0:00

/16.570958

audio-thumbnail

Enceladus

0:00

/17.730958

audio-thumbnail

Fenrir

0:00

/15.970958

audio-thumbnail

Iapetus

0:00

/14.610958

audio-thumbnail

Orus

0:00

/15.530958

audio-thumbnail

Puck

0:00

/15.810958

audio-thumbnail

Rasalgethi

0:00

/13.810958

audio-thumbnail

Sadachbia

0:00

/20.370958

audio-thumbnail

Sadaltager

0:00

/14.690958

audio-thumbnail

Schedar

0:00

/15.090958

audio-thumbnail

Umbriel

0:00

/18.690958

audio-thumbnail

Zubenelgenubi

0:00

/14.530958

Observations

Hallucinations (long blanc à la fin de Gacrux) et style théatral… Ce sont les limites d'un modèle text-to-speech.

D'autres styles sont plus convaincants

Cliquer pour écouter des exemples :

Méthode de génération

Les fichiers audio ont été créés en suivant ces étapes :

Plateforme : J'ai utilisé Generate speech dans Google AI Studio pour accéder au modèle Gemini 2.5 Flash Preview TTS
Mode : Sélection du mode "Single-speaker audio" pour une voix cohérente
Prompt : Utilisation du texte exact fourni dans le prompt
Paramètres du modèle : Température réduite à 0.5 pour limiter les hallucinations avec ce texte prononcé en une quinzaine de secondes