Früher war die Transkription ein umständlicher, manueller Vorgang. Mediziner, Journalisten und zahlreiche andere Fachleute nahmen ihre Notizen und Gespräche auf rauen Tonbändern auf, nur um sie anschließend mühsam in ihre Computer einzutippen.
Doch im Jahr 2020 stehen uns eine Fülle von Diensten zur Verfügung, die Audioaufnahmen in Text auf einem Bildschirm umwandeln können. Eine Frage bleibt jedoch bestehen: Sind diese Dienste sicher? Immerhin laden wir möglicherweise sensible Gespräche und private Voicemails hoch.
Werfen wir einen Blick auf diese Dienste und erfahren wir, wie Sie Ihre Daten schützen können.
Wie funktionieren Audiotranskriptionsdienste?
Audiotranskriptionsdienste lassen sich im Wesentlichen in drei Kategorien einteilen. Die erste Kategorie ist vollständig computergesteuert und verwendet etablierte KI- und maschinelle Lernmodelle zur Verarbeitung der Konversation. Die zweite Kategorie ist die teuerste, da hier menschliche Arbeitskraft zum Einsatz kommt. Die dritte Kategorie ist eine Mischung aus Computerverarbeitung und menschlicher Arbeit.
Die erste Kategorie ist Ihnen wahrscheinlich am vertrautesten. Sprachtranskriptionsdienste – wie jene von Google, Apple und Otter.ai – wandeln die analogen Schallwellen Ihrer Stimme in eine digitale Darstellung um. Diese wird dann in winzige (manchmal Tausendstelsekunden) Segmente zerlegt und bekannten „Phonemen“ oder Sprachelementen zugeordnet.
Anschließend analysieren diese Algorithmen die Phoneme im Kontext anderer Phoneme und leiten sie durch statistische und KI-Modelle, die letztendlich Text generieren. Da diese Transkriptionsdienste vollständig computergesteuert sind, sind sie in der Regel die kostengünstigsten. Allerdings ist die Genauigkeit nicht immer optimal, insbesondere bei der Extraktion von Text aus lauten Umgebungen oder Umgebungen mit mehreren Sprechern.
Die menschliche Transkription wird über spezielle Plattformen wie Rev abgewickelt, die Kunden mit einem Pool von vorab qualifizierten Transkriptoren verbinden. Sie können auch Freiberufler auf Marktplätzen wie Upwork oder Fiverr mit der Transkription beauftragen.
Die dritte Variante ist eine Kombination aus beiden Ansätzen. Um den Transkriptionsprozess zu beschleunigen, lassen einige Anbieter die Vorarbeit von der KI erledigen und überlassen die Feinabstimmung und Fehlerkorrektur dann menschlichen Bearbeitern.
Schlechte Praktiken bei Transkriptionsdiensten
In den letzten Jahren wurden zahlreiche Transkriptionsdienste Opfer von Datenschutzverletzungen und Skandalen.
Der vielleicht älteste (und schockierendste) Fall war SpinVox. Das Unternehmen bot in den 2000er Jahren einen Dienst an, der Voicemails in SMS-Nachrichten umwandelte. Dies galt damals als technologischer Durchbruch und zog schnell positive Presse, viele Kunden und enorme Finanzmittel an.
Das Problem? Ohne das Wissen der Kunden wurden ihre Voicemails von Mitarbeitern in Büros in Ländern wie Pakistan, Mauritius und Südafrika verarbeitet. Dies wurde von einem Insider enthüllt. Er behauptete, dass nur etwa 2 Prozent der Voicemails maschinell verarbeitet wurden und der Rest von rund 10.000 ausgebeuteten Arbeitskräften.
Als die Mitarbeiter eines pakistanischen SpinVox-Büros nicht bezahlt wurden, protestierten sie und begannen, Nachrichten direkt an die Kunden zu senden. Schließlich kam die Wahrheit ans Licht und SpinVox verlor erheblich an Wert. Letztlich wurden die Überreste des Unternehmens an Nuance, einen der größten Anbieter von Spracherkennungstechnologie, verkauft.
Vor kurzem entdeckte der Cybersicherheitsjournalist Brian Krebs eine schwerwiegende Datenschutzverletzung bei MEDantex, einem in Kansas ansässigen Anbieter von Sprachtranskriptionsdiensten für medizinisches Fachpersonal. Sensible medizinische Daten (einige stammten aus dem Jahr 2007) wurden durch ein unsicheres Portal in Form von Microsoft Word-Dateien zum Download angeboten.
Auch digitale Transkriptionsdienste sind nicht immer sicher. Selbst wenn Sie einen vollständig computergesteuerten Dienst nutzen, ist es möglich, dass das Unternehmen zur Qualitätssicherung menschliche Dienstleister einsetzt.
Im Jahr 2019 deckte die belgische Nachrichtenseite VRT NWS auf, dass Google-Vertragspartner Gespräche von Einzelpersonen mit ihren Google Home-Assistenten belauschten. Ein Auftragnehmer gewährte VRT NWS sogar Zugang zu Gesprächen, von denen viele äußerst sensibel (und in einigen Fällen sexuell intim) waren.
Auch Amazon, Apple und Microsoft haben auf diese Weise menschliche Dienstleister eingesetzt. Mit anderen Worten: Es ist durchaus möglich, dass jemand Sprachaufnahmen Ihres virtuellen Assistenten mithört.
Sind Online-Transkriptionsdienste sicher?
Die entscheidende Frage ist, ob Online-Transkriptionsdienste sicher sind. Die Antwort ist leider nicht ganz einfach.
Der Bereich der Sprachtranskription hat sich mittlerweile weitgehend etabliert und die gröbsten schwarzen Schafe wurden weitestgehend aussortiert.
Wenn Sie Ihre Daten (in diesem Fall private Gespräche) jedoch einem Dritten anvertrauen, müssen Sie auf dessen Schutz vertrauen. Dies gilt sowohl für Online-Dienste als auch für menschliche Transkriptoren.
Letztendlich sollten Sie sich zwei Fragen stellen: Vertrauen Sie dem jeweiligen Dienst und wie sensibel sind Ihre Gespräche?
Wenn Sie einen Transkriptionsdienst in Betracht ziehen, lohnt es sich immer, etwas zu recherchieren. Hat das Unternehmen einen guten Ruf? Ist es etabliert? Gab es in der Vergangenheit Datenschutzverletzungen? Gibt es eine Datenschutzerklärung, die ausdrücklich regelt, wie mit Ihren Daten umgegangen wird und wie diese geschützt werden?
Wie bereits erwähnt, greifen KI-gesteuerte Dienste häufig auf Mitarbeiter und externe Dienstleister für die Qualitätssicherung zurück. Obwohl diese Überprüfungen nur einen kleinen Teil aller Transkriptionen umfassen, besteht immer die Möglichkeit, dass jemand Ihr Gespräch mithört.
In vielen Fällen ist dies jedoch kein Ausschlusskriterium. Wenn Ihre Gespräche jedoch höchst privat oder geschäftlich sensibel sind, sollten Sie vielleicht besser einen Texteditor öffnen und Ihre Aufnahmen auf altmodische Weise selbst transkribieren.