Exemples de voix générées avec Gemini 2.5 TTS : essoufflement

Découvrez des voix essoufflées générées par Gemini TTS pour des scènes dynamiques. Ce modèle IA propose 30 profils vocaux expressifs, idéaux pour jeux vidéo, livres audio, etc. Écoutez les démos et trouvez la voix parfaite pour vos projets.

Découvrez les possibilités offertes par le Gemini 2.5 Flash Preview TTS à travers ces extraits audio. Ce modèle de synthèse vocale avancé propose des voix naturelles et dynamiques, idéales pour des applications variées. Comparez les 30 voix disponibles et sélectionnez celle qui s'adapte le mieux à vos besoins.

Prompt original (température 1)

Prononce cette phrase en étant essoufflé, en plein effort.
Je ne peux pas abandonner maintenant, il y a trop en jeu.

Observations

Ces instructions donnent un style trop théâtral à mon goût. Faut-il jouer avec le prompt ? Ou attendre de nouveaux modèles plus réalistes ?


Échantillons vocaux

Voix féminines

audio-thumbnail
Achernar
0:00
/7.010958
audio-thumbnail
Aoede
0:00
/6.370958
audio-thumbnail
Autonoe
0:00
/5.010958
audio-thumbnail
Callirrhoe
0:00
/6.450958
audio-thumbnail
Despina
0:00
/6.210958
audio-thumbnail
Erinome
0:00
/7.570958
audio-thumbnail
Gacrux
0:00
/7.890958
audio-thumbnail
Kore
0:00
/7.370958
audio-thumbnail
Laomedeia
0:00
/4.970958
audio-thumbnail
Leda
0:00
/8.010958
audio-thumbnail
Sulafat
0:00
/7.250958
audio-thumbnail
Vindemiatrix
0:00
/6.090958
audio-thumbnail
Zephyr
0:00
/6.210958

Voix neutre

audio-thumbnail
Pulcherrima
0:00
/5.570958

Voix masculines

audio-thumbnail
Achird
0:00
/4.810958
audio-thumbnail
Algenib
0:00
/6.090958
audio-thumbnail
Algieba
0:00
/7.890958
audio-thumbnail
Alnilam
0:00
/6.690958
audio-thumbnail
Charon
0:00
/6.490958
audio-thumbnail
Enceladus
0:00
/7.850958
audio-thumbnail
Fenrir
0:00
/8.210958
audio-thumbnail
Iapetus
0:00
/4.850958
audio-thumbnail
Orus
0:00
/6.050958
audio-thumbnail
Puck
0:00
/5.010958
audio-thumbnail
Rasalgethi
0:00
/6.010958
audio-thumbnail
Sadachbia
0:00
/5.690958
audio-thumbnail
Sadaltager
0:00
/5.290958
audio-thumbnail
Schedar
0:00
/7.330958
audio-thumbnail
Umbriel
0:00
/5.050958
audio-thumbnail
Zubenelgenubi
0:00
/6.090958

Méthode de génération

Les fichiers audio ont été créés en suivant ces étapes :

  1. Plateforme : J'ai utilisé Generate speech dans Google AI Studio pour accéder au modèle Gemini 2.5 Flash Preview TTS
  2. Mode : Sélection du mode "Single-speaker audio" pour une voix cohérente
  3. Prompt : Utilisation du texte exact fourni dans le prompt
  4. Paramètres du modèle : Température laissée à la valeur par défaut de 1 (idéale pour une phrase courte)

Cliquer pour écouter d'autres styles

Mes premières expérimentations avec Gemini TTS
Astuces et exemples d’utilisation de Gemini TTS.