Key Takeaways
- Drei Wege führen zum Transkript: manuell tippen, einen KI-Cloud-Dienst nutzen oder ein lokales KI-Tool. Für Forschungsdaten ist die lokale Variante der sichere Standard.
- Lege die Transkriptionsregeln vor dem Tippen fest. Wörtlich oder geglättet entscheidet über Aufwand und Auswertbarkeit, nicht erst im Nachhinein.
- Interviewaufnahmen sind personenbezogene Daten. Wer Audio bei einem US-Cloud-Dienst hochlädt, gibt die Stimmen der Befragten aus der Hand.
- KI spart Zeit, ersetzt aber keine Korrektur. Plane für jedes Rohtranskript einen Durchgang zum Prüfen und Anonymisieren ein.
Ein Interview transkribieren heißt heute selten noch, alles selbst abzutippen. Die eigentliche Entscheidung ist nicht manuell gegen KI, sondern wo deine Aufnahme verarbeitet wird. Wer qualitative Interviews für eine Abschlussarbeit oder Studie transkribiert, trifft mit der Methode immer auch eine Datenschutz-Entscheidung.
Welche Methoden gibt es, um ein Interview zu transkribieren?
Es gibt vier gängige Methoden: manuell abtippen, die Diktierfunktion in Word, einen KI-Cloud-Dienst oder ein lokales KI-Tool. Sie unterscheiden sich vor allem in drei Punkten: wie viel Zeit sie kosten, was sie kosten und wo deine Audiodaten landen. Der letzte Punkt wird in der Forschung oft übersehen.
| Methode | Zeit pro Stunde Audio | Kosten | Datenschutz | Gut für |
|---|---|---|---|---|
Manuell abtippen | etwa 5 bis 8 Stunden | 0 € (nur Zeit) | hoch, bleibt offline | kleine Stichproben, volle Kontrolle |
MethodeManuell abtippen Zeit pro Stunde Audioetwa 5 bis 8 Stunden Kosten0 € (nur Zeit) Datenschutzhoch, bleibt offline Gut fürkleine Stichproben, volle Kontrolle | ||||
Word-Diktierfunktion | etwa 1 bis 2 Stunden mit Korrektur | 0 € mit Microsoft-Konto | mittel, Audio läuft über die Cloud | schnelle Rohfassung |
MethodeWord-Diktierfunktion Zeit pro Stunde Audioetwa 1 bis 2 Stunden mit Korrektur Kosten0 € mit Microsoft-Konto Datenschutzmittel, Audio läuft über die Cloud Gut fürschnelle Rohfassung | ||||
KI-Cloud-Dienst | nahe Echtzeit plus Korrektur | oft begrenzt gratis, sonst pro Minute | niedrig, Upload zu externen Servern | viel Material, wenig Zeit |
MethodeKI-Cloud-Dienst Zeit pro Stunde Audionahe Echtzeit plus Korrektur Kostenoft begrenzt gratis, sonst pro Minute Datenschutzniedrig, Upload zu externen Servern Gut fürviel Material, wenig Zeit | ||||
Lokales KI-Tool | nahe Echtzeit plus Korrektur | 0 € mit Open-Source-Modellen | hoch, läuft auf deinem Gerät | sensible Interviewdaten |
MethodeLokales KI-Tool Zeit pro Stunde Audionahe Echtzeit plus Korrektur Kosten0 € mit Open-Source-Modellen Datenschutzhoch, läuft auf deinem Gerät Gut fürsensible Interviewdaten | ||||
Die Methodenportale der Universitäten rechnen bei reiner Handarbeit mit etwa fünf bis acht Stunden Tipparbeit pro Stunde Audio. Wer mehrere Stunden Interview ausgewertet hat, weiß: KI verkürzt diesen Engpass drastisch, verlagert die Arbeit aber in die Korrektur. Welche Methode passt, hängt am Ende weniger an der Geschwindigkeit als an der Sensibilität deiner Daten.
Kurz gesagt: Bei nicht-sensiblen Inhalten ist ein KI-Dienst die schnellste Wahl. Sobald Befragte über Gesundheit, Arbeitgeber oder private Themen sprechen, gehört die Verarbeitung auf dein eigenes Gerät.
Wie transkribierst du ein Interview Schritt für Schritt?
Ein sauberes Transkript entsteht in fünf Schritten: gute Aufnahme, festgelegte Regeln, gewählte Methode, Korrektur mit Anonymisierung und die Aufbereitung für die Auswertung. Die ersten beiden Schritte entscheiden über den Aufwand der restlichen drei.
Sorge schon bei der Aufnahme für saubere Tonqualität
Jeder Fehler in der Aufnahme kostet später doppelt Zeit. Nimm in einem ruhigen Raum auf, lege das Mikrofon näher an die sprechende Person als an Lüftung oder Fenster, und mach vorab eine Testaufnahme von 30 Sekunden. Bei einem Online-Interview hilft es, alle Teilnehmenden zu bitten, nicht gleichzeitig zu sprechen, weil sich überlappende Stimmen sowohl Menschen als auch KI zuverlässig aus dem Tritt bringen.
Für Remote-Gespräche lohnt sich ein Tool, das den Ton direkt auf dem Rechner aufzeichnet. So vermeidest du den Qualitätsverlust, der entsteht, wenn du ein Gespräch über das Raummikrofon des Laptops mitschneidest. Speichere die Aufnahme in einem verlustarmen Format wie WAV oder einem hochwertigen MP3, denn stark komprimierte Dateien verschlucken genau die Konsonanten, an denen sich die Transkription später festbeißt.
Lege deine Transkriptionsregeln fest
Bevor du auch nur ein Wort tippst, entscheide, wie genau du transkribierst. Eine wörtliche Transkription hält Dialekt, Abbrüche und Füllwörter fest, eine geglättete Fassung bereinigt die Sprache zu lesbarem Hochdeutsch. Die Wahl hängt von deiner Auswertungsmethode ab: Eine qualitative Inhaltsanalyse kommt meist mit einer geglätteten Fassung aus, eine Gesprächs- oder Konversationsanalyse braucht jedes Detail.
Halte deine Regeln schriftlich fest, damit du im ganzen Material gleich vorgehst. Mehr dazu im Abschnitt zu den Transkriptionsregeln weiter unten.
Wähle deine Transkriptionsmethode
Jetzt greift die Tabelle von oben. Bei einer einzigen, unkritischen Aufnahme reicht oft die Diktierfunktion in Word. Bei mehreren sensiblen Interviews führt der ruhigste Weg über ein lokales KI-Tool, das die Aufnahme nicht ins Netz schickt. Wer komplett ohne Software arbeiten will, nutzt einen Mediaplayer mit verstellbarer Abspielgeschwindigkeit und tippt parallel mit.
Korrigiere und anonymisiere das Rohtranskript
Kein automatisches Transkript ist druckreif. KI verschreibt sich besonders bei Eigennamen, Fachbegriffen, Zahlen und undeutlich gesprochenen Stellen. Höre die Aufnahme einmal komplett mit und lies dabei mit, statt nur stichprobenartig zu prüfen.
Dieser Durchgang ist auch der Moment für die Anonymisierung. Ersetze Namen, Orte und Arbeitgeber durch Pseudonyme oder Platzhalter wie B1 oder [Stadt]. Wer das gleich beim ersten Korrekturlauf erledigt, spart sich eine zweite Runde durch das ganze Material.
Bereite das Transkript für die Auswertung vor
Damit du später sauber zitieren kannst, brauchst du Struktur. Nummeriere die Zeilen oder Absätze, kennzeichne die sprechenden Personen einheitlich und speichere eine unveränderte Sicherungskopie. Für die eigentliche Analyse importierst du die Datei dann in ein Auswertungsprogramm wie MAXQDA, atlas.ti oder f4analyse.
Achte beim Export auf ein offenes Format. Eine reine RTF- oder DOCX-Datei mit Zeitmarken und Absatznummern lässt sich in fast jede QDA-Software einlesen, während proprietäre Projektdateien dich an ein einzelnes Programm binden. Wer früh auf ein austauschbares Format setzt, kann das Analysetool später noch wechseln, ohne das ganze Transkript neu aufzubereiten.
Welche Transkriptionsregeln brauchst du für eine Abschlussarbeit?
Für eine Abschlussarbeit reicht in den meisten Fällen ein einfaches, einheitliches Regelsystem. Du musst nicht jede Pause in Zehntelsekunden messen. Wichtiger ist, dass du eine etablierte Konvention nennst und sie im ganzen Material gleich anwendest.
Im deutschsprachigen Raum sind drei Bezugspunkte verbreitet. Das einfache und das erweiterte System nach Dresing und Pehl decken die meisten qualitativen Arbeiten ab. Für die feinkörnige Gesprächsanalyse gibt es das detailliertere GAT-2-System. Universitäre Methodenseiten erklären diese Systeme ausführlich, etwa das Methodenportal der Universität Leipzig und das Methodenzentrum der Ruhr-Universität Bochum. Eine kompakte Übersicht für die Praxis bietet außerdem ein Regelwerk der Universität Graz.
Praxis-Tipp: Schreib die gewählten Regeln als kurzes Kapitel in den Methodenteil deiner Arbeit. Prüfende sehen so sofort, dass deine Transkription nachvollziehbar und konsistent ist, was im Methodenteil oft mehr zählt als die letzte Pausennotation.
Wie kannst du ein Interview kostenlos transkribieren?
Ein Interview kostenlos zu transkribieren, ist möglich, kostet dich aber entweder Zeit oder Datenschutz. Es gibt drei realistische Gratis-Wege, und jeder hat einen Haken.
- Manuell mit Mediaplayer: kostenlos und datensicher, aber mit fünf bis acht Stunden pro Audiostunde der langsamste Weg.
- Diktierfunktion in Microsoft Word: im Browser mit Microsoft-Konto enthalten, schnell für eine Rohfassung, aber das Audio wird zur Verarbeitung in die Cloud geladen.
- Lokale Open-Source-KI: Tools auf Basis von Whisper-Modellen transkribieren gratis und direkt auf deinem Gerät, brauchen aber einen Korrekturlauf wie jedes KI-Transkript.
Vorsicht bei Cloud-Diensten, die mit "kostenlos" werben: Oft ist nur ein Kontingent von wenigen Minuten gratis, und die Aufnahme wird auf externe Server hochgeladen. Manche Anbieter behalten sich in den Nutzungsbedingungen außerdem vor, hochgeladene Inhalte zum Training ihrer Modelle zu verwenden, was bei Interviewdaten heikel ist. Für eine kurze, unkritische Aufnahme ist ein solcher Dienst in Ordnung. Für ein Forschungsinterview mit echten Personen ist die kostenlose lokale Variante die bessere Wahl. Eine Übersicht dazu findest du im Beitrag zur kostenlosen KI-Transkription.
Was musst du beim Datenschutz von Interviewdaten beachten?
Interviewaufnahmen sind fast immer personenbezogene Daten. Eine Stimme ist identifizierend, und im Gespräch fallen Namen, Orte und Details, die Rückschlüsse auf die Befragten zulassen. Damit gilt für Aufnahme, Speicherung und Transkription die DSGVO, wie die DSGVO-Definition personenbezogener Daten festhält. Wenn es um Gesundheit, politische Meinung oder andere sensible Themen geht, kommen die strengeren Regeln für besondere Datenkategorien hinzu.
In der Praxis bedeutet das drei Dinge: eine informierte Einwilligung der Befragten einholen, die Daten so früh wie möglich pseudonymisieren und die Aufnahmen sicher speichern. Forschungsethik-Kommissionen prüfen genau diesen Umgang mit den Rohdaten.
Der heikelste Punkt ist der Transkriptionsschritt selbst. Lädst du die Aufnahme zu einem US-Cloud-Dienst hoch, verlässt sie deinen Einflussbereich, und es greift potenziell der US CLOUD Act, nach dem US-Anbieter Daten an Behörden herausgeben müssen. Genau deshalb setzt der Trend in Forschung und Verwaltung auf digitale Souveränität und DSGVO-konforme Software mit Serverstandort in der EU. Wenn die Transkription lokal auf deinem Gerät passiert, stellt sich die Frage nach dem Upload gar nicht erst.
Achtung: Eine unterschriebene Einwilligung deckt nicht automatisch ab, dass du die Aufnahme zur Transkription an Dritte weitergibst. Wer einen Dienstleister oder Cloud-Dienst nutzt, braucht dafür eine eigene Grundlage, oft einen Auftragsverarbeitungsvertrag.
Praxisbeispiel: Eine Masterandin führt acht Interviews zu Stress am Arbeitsplatz. Die Befragten nennen Vorgesetzte, Abteilungen und konkrete Vorfälle. Lädt sie diese Aufnahmen zu einem kostenlosen Cloud-Dienst hoch, liegen identifizierbare Aussagen über Dritte auf fremden Servern, oft außerhalb der EU. Transkribiert sie dieselben acht Interviews lokal, bleibt das Material auf ihrem Laptop, und der Methodenteil ihrer Arbeit lässt sich gegenüber der Ethikkommission sauber begründen. Der Mehraufwand dafür: ein einmaliger Download und etwas mehr Rechenzeit beim Transkribieren.
Welche Tools helfen beim Interview transkribieren?
Welches Tool passt, hängt davon ab, ob du nur ein Transkript brauchst oder direkt analysieren willst. Für die reine Verschriftlichung reicht ein Transkriptionstool, für die Auswertung kommt eine QDA-Software dazu.
- MAXQDA, atlas.ti und f4analyse kombinieren Transkription und Auswertung in einem Programm. Sie sind der Standard für qualitative Forschung, wenn du danach kodieren und Kategorien bilden willst. Diese Tiefe hat ihren Preis: Lizenzen sind kostenpflichtig, und für eine einzelne Abschlussarbeit ist der Funktionsumfang oft größer als nötig.
- Word-Diktierfunktion liefert schnell eine kostenlose Rohfassung, verarbeitet das Audio aber über die Microsoft-Cloud.
- KI-Cloud-Dienste transkribieren sehr schnell, laden die Aufnahme dafür auf externe Server, was bei sensiblen Daten zum Problem wird.
meetergo Log: lokal transkribieren ohne Cloud
meetergo Log ist eine kostenlose Desktop-App für Mac und Windows, die Gespräche direkt auf deinem Gerät transkribiert. Die App ist rund 50 MB groß, installiert in Sekunden und nutzt lokale Open-Source-Modelle, sodass das Audio bei der lokalen Verarbeitung den Rechner nicht verlässt. Optional lässt sich auch eine Cloud-API anbinden, doch für Forschungsdaten ist gerade der lokale Modus der Punkt.

Aufnahme, Transkription, Zusammenfassung und Volltextsuche sind kostenlos. Praktisch für Interviews: meetergo Log transkribiert auch bereits aufgezeichnete Dateien, du spielst also ein vorab aufgenommenes Vor-Ort-Interview einfach am Rechner ab.
Bei Interviews verschluckt sich jede automatische Transkription erfahrungsgemäß an denselben Stellen: an wiederkehrenden Eigennamen, am Arbeitgeber der befragten Person, an Fachbegriffen aus dem Feld. meetergo Log baut auf Whisper auf und lässt dich genau diese Begriffe einmal in einem eigenen Vokabular hinterlegen, danach schreibt die Erkennung sie korrekt. Das verkürzt den Korrekturlauf spürbar, weil du nicht in jeder zweiten Zeile denselben Namen geradeziehen musst. Für Remote-Interviews greift die App auf Google Meet, Zoom und Teams zu, ohne dass ein Bot dem Meeting beitritt. Die Datenschutz-Logik dahinter beschreibt meetergo auf der Seite zur Sicherheit, die Aufnahme von Remote-Gesprächen läuft über meetergo connect.
Ehrliche Einschränkung: meetergo Log erstellt Transkripte, aber keine wissenschaftliche Kodierung. Für die qualitative Inhaltsanalyse exportierst du den Text weiterhin nach MAXQDA, atlas.ti oder f4analyse. Und wie jedes KI-Transkript braucht auch das Ergebnis einen Korrekturlauf, bevor es deinen Transkriptionsregeln entspricht. Für die Schritte danach helfen die Beiträge zu Meeting-Notizen und zum Besprechungsprotokoll; Aufnahmen aus Videocalls behandeln die Anleitungen zur Transkription von Zoom-Aufnahmen und zur Teams-Transkription.
Welche Fehler solltest du beim Transkribieren vermeiden?
Die meisten verlorenen Stunden gehen auf wenige, immer gleiche Fehler zurück. Diese vier kosten am meisten Zeit oder Nerven.
- Regeln erst nach dem Tippen festlegen. Wer auf halber Strecke merkt, dass die wörtliche Fassung doch nötig gewesen wäre, fängt von vorn an. Entscheide vorab.
- Das KI-Rohtranskript ungeprüft übernehmen. Gerade Eigennamen, Fachbegriffe und Zahlen sind fehleranfällig. Ohne Mithörlauf schleichen sich Fehler in die Zitate, die du später in der Arbeit verwendest.
- Sensible Aufnahmen ungeprüft in eine Cloud laden. Bevor du eine Aufnahme hochlädst, kläre, wo der Anbieter speichert und ob du das gegenüber den Befragten verantworten kannst.
- Die Anonymisierung aufschieben. Je länger Klarnamen im Material stehen, desto höher das Risiko und desto mehr Stellen musst du am Ende nachträglich finden.
Dass die Tool-Wahl ein wiederkehrendes Thema in der Forschung ist, zeigt eine Diskussion unter Promovierenden, die ausführlich darüber debattieren, welche Transkriptionssoftware sich für qualitative Interviews eignet.
Transkribiere dein nächstes Interview lokal und kostenlos mit meetergo Log. Keine Anmeldung, kein Cloud-Upload, keine Gebühren.
Welche Transkriptionsmethode passt zu deinem Projekt?
Die richtige Methode ergibt sich aus drei Fragen. Beantworte sie der Reihe nach, dann steht die Entscheidung. Die erste Frage schlägt dabei die beiden anderen: Datenschutz ist eine Bedingung, Zeit und Genauigkeit sind nur Abwägungen.
Wie sensibel sind deine Daten?
Das ist die wichtigste Frage. Sobald Befragte über Gesundheit, Arbeitsverhältnisse oder private Erfahrungen sprechen, gehört die Verarbeitung auf dein Gerät. Verdict: Bei sensiblen Inhalten lokal transkribieren, bei unkritischen Inhalten ist ein Cloud-Dienst vertretbar.
Wie viel Material musst du transkribieren?
Bei einem einzigen 30-Minuten-Interview ist Handarbeit machbar. Ab mehreren Stunden Material wird der Zeitaufwand zum Engpass. Verdict: Unter einer Stunde Audio reicht oft manuelle Arbeit, darüber spart KI mit Korrekturlauf den meisten Aufwand.
Wie genau müssen deine Regeln sein?
Eine Gesprächsanalyse mit GAT 2 verlangt Handarbeit an den feinen Stellen, die keine KI zuverlässig liefert. Eine geglättete Fassung für die Inhaltsanalyse lässt sich dagegen gut automatisiert vorbereiten. Verdict: Je feiner die Notation, desto mehr manuelle Nacharbeit musst du einplanen.
Schluss mit US-Datenzugriff — buche EU-konform.
Schluss mit US-Datenzugriff — buche EU-konform.
Häufige Fragen zum Interview transkribieren
Wie lange dauert es, ein Interview zu transkribieren?
Manuell rechnest du mit etwa fünf bis acht Stunden pro Stunde Audio. Mit einem KI-Tool sinkt die reine Transkriptionszeit auf nahe Echtzeit, hinzu kommt aber ein Korrekturlauf, der je nach Tonqualität ein bis zwei Stunden pro Audiostunde dauern kann.
Welche Software nutzen Forschende zum Transkribieren?
Verbreitet sind MAXQDA, atlas.ti und f4analyse, weil sie Transkription und Auswertung verbinden. Wer nur ein Transkript braucht und auf Datenschutz achtet, nutzt zunehmend lokale KI-Tools, die das Audio nicht hochladen. Viele Forschende kombinieren beides: Sie erzeugen das Transkript mit einem schnellen lokalen Tool und kodieren es anschließend in der QDA-Software ihrer Wahl.
Ist es erlaubt, Interviews transkribieren zu lassen?
Ja, aber du brauchst eine Rechtsgrundlage für die Weitergabe. Wer einen externen Schreib- oder Cloud-Dienst beauftragt, sollte einen Auftragsverarbeitungsvertrag abschließen und die Befragten darüber informieren, dass Dritte die Aufnahme verarbeiten.
Soll ich wörtlich oder geglättet transkribieren?
Das hängt von der Auswertung ab. Eine qualitative Inhaltsanalyse kommt meist mit einer geglätteten Fassung aus, eine Gesprächs- oder Konversationsanalyse braucht die wörtliche Variante mit Pausen und Betonungen.
Kann ich Interviews offline transkribieren?
Ja. Lokale KI-Tools wie meetergo Log laufen direkt auf dem Gerät und brauchen für die Transkription keine Internetverbindung. Das ist für Forschungsdaten der datensicherste Weg, weil nichts hochgeladen wird.
Wie zitiere ich aus einem Interviewtranskript?
Du verweist auf die Person über ihr Pseudonym und auf die Stelle über Zeilen- oder Absatznummern, etwa (B3, Z. 45 bis 48). Voraussetzung ist, dass dein Transkript durchgehend nummeriert und anonymisiert ist.


