WATSON-STIMMEN · KURATOR

Voice

Clips anhören, taggen, die besten exportieren.

01 · Clip-Archiv

Clips

Alle extrahierten Clips. Tags setzen, filtern, die besten markieren.

Gut: Solo-Aufnahmen ohne Hintergrundgeräusche, klare Artikulation, vollständige Sätze. Die Länge allein sagt nichts — ein schlechter 10-Sekunden-Clip ist wertloser als ein guter 3-Sekunden-Clip.

Schlecht: Musik im Hintergrund, Raumhall, andere Stimmen, Räusperer, Artefakte. Alles davon mit "Musik/Lärm" oder "Weg" taggen.

Lade …
|
Clips werden geladen …
Archiv-Qualität:

02 · Erstbewertung

Gesamteindruck

Erster Eindruck nach dem Durchhören. Bauchgefühl vor Analyse.

Erste Frage: Klingt die Stimme wie jemand dem man zuhören will? Watson spricht viel — der Hörer muss die Stimme über Stunden ertragen können ohne ermüdet zu werden.

Zweite Frage: Gibt es einen unverwechselbaren Charakter, oder klingt es generisch?

Eindruck:

03 · Klangbild

Stimmcharakter

Timbre, Wärme, Autorität. Der unverwechselbare Klang dieser Stimme.

Watson braucht ein Timbre das Autorität und Zugänglichkeit zugleich vermittelt. Zu dunkel = zu schwer. Zu hell = zu wenig Gewicht. Der Süßpunkt liegt irgendwo in der Mitte.

Referenz: Christian Rode (blauer Akzent) als Maßstab. Wie weit ist diese Stimme davon entfernt?

Charakter:

04 · Artikulation

Deutlichkeit & Tempo

Artikulation, Aussprache, Sprechtempo. Wie klar ist die Stimme im direkten Hören?

Watson muss auch in schnellen Szenen verständlich bleiben. Undeutliche Artikulation ist beim Klonen schwer zu korrigieren — sie wird oft verstärkt statt verbessert.

Gut: klare Konsonanten, natürliches Tempo, keine verschliffenen Endsilben. Schlecht: zu schnell, genuschelt, Dialekt-Einschlag der stört.

Deutlichkeit:

05 · Ausdrucksstärke

Emotionsbreite

Kann die Stimme Ironie, Besorgnis, Kälte, Wärme? Watson braucht Nuancen.

ElevenLabs lernt aus Variation im Trainings-Material. Eine Stimme die nur in einem Ton spricht erzeugt einen Klon der nur in einem Ton spricht.

Gut taggen: Clips die verschiedene emotionale Zustände zeigen — ruhig, eindringlich, nachdenklich, bestimmt. Das sind die wertvollsten Training-Clips.

Breite:

06 · Rollenfit

Watson-Eignung

Kann man sich diese Stimme als Watson vorstellen? Analytisch, ruhig, mit trockenem Witz.

Watson ist der klügste Mann im Raum — aber er macht kein Aufheben davon. Seine Stimme trägt Wissen ohne Arroganz, Sorge ohne Dramatik, Humor ohne Lautstärke.

Gedankenexperiment: Diese Stimme sagt "Faszinierend" oder "Ich hatte es bereits vermutet". Klingt das richtig?

Rollenfit:

07 · Quellmaterial

Material-Qualität

Wie sauber ist das Quell-Audio? Musik, Hintergrundgeräusche, Raumhall — das limitiert die Klonqualität.

ElevenLabs versucht Hintergrundgeräusche herauszufiltern — aber was einmal im Training ist, kann die Stimmqualität des Klons dauerhaft beeinflussen.

Standard: nur Clips die auch ohne Kopfhörer komplett klar klingen in "Gut" taggen. Alles was man hören muss um Hintergrundrauschen zu erkennen → "Musik/Lärm".

Material:

08 · Aktion

Export & Nächste Schritte

Alle als „Gut" markierten Clips zu source_best.mp3 zusammenführen — das neue Trainings-Audio.

Ziel: 30–60 saubere Clips mit guter Variation. Zu wenige → flacher Klon. Zu viele schlechte → verschmutzter Klon. Qualität vor Quantität.

Status: