Eine Online-Serie von „Överblick klärt auf“
Es klingt wie aus einem Cyberthriller – doch inzwischen taucht es regelmäßig auf TikTok, in Telegram-Gruppen oder in Elternchats auf:
„Ich hab gehört, wenn man am Telefon ‚Hallo‘ sagt, können die deine Stimme klonen und dein Bankkonto leer räumen!“
Oder: „BBC hat getestet, dass KI deine Stimme nutzt, um eine Bank zu hacken!“

Mosterei Finkenburg
Die Verunsicherung ist verständlich. Und sie basiert nicht nur auf Fantasie: Die BBC hat tatsächlich einen Versuch gemacht – mit Erfolg. Auch aus den USA gibt es reale Fälle. Aber: Der Teufel steckt wie so oft im Detail.
Die Technik: Beeindruckend – aber noch nicht magisch
Voice-Cloning basiert auf Künstlicher Intelligenz, die aus Sprachaufnahmen ein digitales Modell erstellt. Damit lassen sich täuschend echte Sprachsynthesen erzeugen. Das funktioniert am besten, wenn hochwertiges Ausgangsmaterial vorhanden ist – idealerweise mehrere Minuten sauberer Audioaufnahmen, aufgenommen mit einem guten Mikrofon.
Auch wir beim Överblick nutzen diese Technik bereits ganz bewusst – zum Beispiel für unseren Info-Bot Övi, der mit einer natürlichen Stimme von ElevenLabs spricht. In diesem Fall ist Voice-Cloning kein Risiko, sondern ein praktisches Werkzeug: Övi gibt freundlich Auskunft, wenn man Fragen rund ums Magazin hat – von Auslagestellen bis zu Veranstaltungen. Ganz ohne Betrugsmasche.
Die BBC ließ im Selbstversuch eine Stimme klonen, um den Zugang zu einem gesicherten Bankkonto zu testen. Ergebnis:
Erst nach über zehn Minuten eingesprochenem Material konnte das Klon-Modell die Stimmerkennung umgehen.
Voice-Cloning-Plattformen im Überblick
🟢 ElevenLabs
- Sprache / UX: Sehr gut, auch Deutsch
- Qualität: ⭐⭐⭐⭐½
- Input nötig: ab 1 Minute
- Zielgruppe: Profis, Medien, Werbung
- Besonderheiten: Extrem natürlicher Ausdruck, sehr emotional
🟠 Resemble.ai
- Sprache / UX: Englisch++
- Qualität: ⭐⭐⭐⭐
- Input nötig: ab 2 Minuten
- Zielgruppe: Games, Werbung, Echtzeit-Apps
- Besonderheiten: API, Live-Cloning, viele Exportoptionen
🔵 iSpeech
- Sprache / UX: Englisch
- Qualität: ⭐⭐½
- Input nötig: ab 30 Sekunden
- Zielgruppe: Telefonie, Basic-User
- Besonderheiten: Sehr schnell, aber roboterhaft
🔧 OpenVoice (Open Source)
- Sprache / UX: Englisch, technisch
- Qualität: ⭐⭐⭐
- Input nötig: 15–60 Sekunden
- Zielgruppe: Entwickler:innen, Forschung
- Besonderheiten: Frei nutzbar, anpassbar
🕹 Voice.ai
- Sprache / UX: Fokus auf Gaming
- Qualität: ⭐⭐⭐½
- Input nötig: ab 30 Sekunden
- Zielgruppe: Streamer, Unterhaltung
- Besonderheiten: Echtzeit-Nutzung z. B. für Discord
🎙 Descript Overdub
- Sprache / UX: Englisch, integriert
- Qualität: ⭐⭐⭐⭐
- Input nötig: ab 10 Minuten
- Zielgruppe: Podcasts, Hörbücher
- Besonderheiten: In Descript-Editor eingebaut
USA: Der „Enkeltrick 2.0“ in KI-Form
In den USA kam es bereits zu mehreren dokumentierten Betrugsversuchen mit KI-generierten Stimmen. Täter nutzten öffentlich zugängliches Audiomaterial und ahmten Angehörige nach, um Geld zu erpressen.
Die größte Gefahr liegt nicht in technischen Bankhacks, sondern in emotionaler Manipulation – eine täuschend echte Stimme am Telefon genügt oft, um Vertrauen zu erzeugen.
Deutschland: Noch wenig Risiko – aber wachsam bleiben
- Sprach-ID ist bei deutschen Banken wenig verbreitet.
- Plattformen sind auf englischsprachige Klone optimiert.
- Gute Klone benötigen mehrere Minuten saubere Aufnahme – ein kurzes „Hallo“ reicht nicht.
- Viele Anbieter verbieten betrügerischen Einsatz explizit in ihren AGBs.
Fazit: Aufklären statt Angst
✅ Was du tun kannst:
- Keine privaten Sprachnachrichten veröffentlichen
- Mit Familie ein Codewort vereinbaren („Wie heißt unser Hund?“)
- Bei Panikanrufen nicht sofort handeln, sondern zurückrufen
- Sprach-ID bei Banken nur nutzen, wenn unbedingt nötig
Voice-Cloning ist im Kommen – aber noch lange nicht unaufhaltsam. Wer informiert ist, kann Risiken vermeiden und Chancen nutzen.
