Voice
Clips anhören, taggen, die besten exportieren.
01 · Clip-Archiv
Clips
Alle extrahierten Clips. Tags setzen, filtern, die besten markieren.
Gut: Solo-Aufnahmen ohne Hintergrundgeräusche, klare Artikulation, vollständige Sätze. Die Länge allein sagt nichts — ein schlechter 10-Sekunden-Clip ist wertloser als ein guter 3-Sekunden-Clip.
Schlecht: Musik im Hintergrund, Raumhall, andere Stimmen, Räusperer, Artefakte. Alles davon mit "Musik/Lärm" oder "Weg" taggen.
02 · Erstbewertung
Gesamteindruck
Erster Eindruck nach dem Durchhören. Bauchgefühl vor Analyse.
Erste Frage: Klingt die Stimme wie jemand dem man zuhören will? Watson spricht viel — der Hörer muss die Stimme über Stunden ertragen können ohne ermüdet zu werden.
Zweite Frage: Gibt es einen unverwechselbaren Charakter, oder klingt es generisch?
03 · Klangbild
Stimmcharakter
Timbre, Wärme, Autorität. Der unverwechselbare Klang dieser Stimme.
Watson braucht ein Timbre das Autorität und Zugänglichkeit zugleich vermittelt. Zu dunkel = zu schwer. Zu hell = zu wenig Gewicht. Der Süßpunkt liegt irgendwo in der Mitte.
Referenz: Christian Rode (blauer Akzent) als Maßstab. Wie weit ist diese Stimme davon entfernt?
04 · Artikulation
Deutlichkeit & Tempo
Artikulation, Aussprache, Sprechtempo. Wie klar ist die Stimme im direkten Hören?
Watson muss auch in schnellen Szenen verständlich bleiben. Undeutliche Artikulation ist beim Klonen schwer zu korrigieren — sie wird oft verstärkt statt verbessert.
Gut: klare Konsonanten, natürliches Tempo, keine verschliffenen Endsilben. Schlecht: zu schnell, genuschelt, Dialekt-Einschlag der stört.
05 · Ausdrucksstärke
Emotionsbreite
Kann die Stimme Ironie, Besorgnis, Kälte, Wärme? Watson braucht Nuancen.
ElevenLabs lernt aus Variation im Trainings-Material. Eine Stimme die nur in einem Ton spricht erzeugt einen Klon der nur in einem Ton spricht.
Gut taggen: Clips die verschiedene emotionale Zustände zeigen — ruhig, eindringlich, nachdenklich, bestimmt. Das sind die wertvollsten Training-Clips.
06 · Rollenfit
Watson-Eignung
Kann man sich diese Stimme als Watson vorstellen? Analytisch, ruhig, mit trockenem Witz.
Watson ist der klügste Mann im Raum — aber er macht kein Aufheben davon. Seine Stimme trägt Wissen ohne Arroganz, Sorge ohne Dramatik, Humor ohne Lautstärke.
Gedankenexperiment: Diese Stimme sagt "Faszinierend" oder "Ich hatte es bereits vermutet". Klingt das richtig?
07 · Quellmaterial
Material-Qualität
Wie sauber ist das Quell-Audio? Musik, Hintergrundgeräusche, Raumhall — das limitiert die Klonqualität.
ElevenLabs versucht Hintergrundgeräusche herauszufiltern — aber was einmal im Training ist, kann die Stimmqualität des Klons dauerhaft beeinflussen.
Standard: nur Clips die auch ohne Kopfhörer komplett klar klingen in "Gut" taggen. Alles was man hören muss um Hintergrundrauschen zu erkennen → "Musik/Lärm".
08 · Aktion
Export & Nächste Schritte
Alle als „Gut" markierten Clips zu source_best.mp3 zusammenführen — das neue Trainings-Audio.
Ziel: 30–60 saubere Clips mit guter Variation. Zu wenige → flacher Klon. Zu viele schlechte → verschmutzter Klon. Qualität vor Quantität.