So nimmst du deinen Bildschirm mit Ton auf (Systemton + Mikrofon)
Du drückst auf Aufnahme, gehst den Fehler durch, erzählst die Lösung – und dann schaust du es dir an, und das Video ist still, wo die App sprechen sollte. Der Klick machte ein Geräusch. Das Video, auf das du reagiert hast, hatte Musik. Nichts davon ist in der Datei. Nur deine Stimme, schwebend über einem stummen Bildschirm.
Das ist das mit Abstand häufigste Problem bei Bildschirmaufnahmen, und es hat eine konkrete Ursache: Die meisten kostenlosen Recorder öffnen nur dein Mikrofon. Sie erfassen nie den Ton, den dein Computer tatsächlich abspielt. Dieser Leitfaden erklärt den Unterschied zwischen Systemton und Mikrofonton, warum das Erfassen des Systemtons unter Windows tatsächlich schwieriger ist, als es sein sollte, und wie du beides auf einmal aufnimmst – sauber, in einer Datei, ohne einen einzigen zusätzlichen Treiber.
Systemton vs. Mikrofon: zwei völlig verschiedene Quellen
Wenn Leute „Bildschirm mit Ton aufnehmen“ sagen, meinen sie meist zwei verschiedene Dinge auf einmal, und ein Recorder muss jedes einzeln handhaben:
- Mikrofon (Eingang): deine Stimme. Das ist das Einfache. Jeder Recorder kann einen Mikrofoneingang öffnen. Es ist derselbe Stream, den ein Sprachanruf nutzt.
- System-/Desktop-Ton (Ausgang): alles, was der Computer abspielt aus – die App, die du vorführst, das YouTube-Video, auf das du reagierst, ein Zoom-Anruf, ein Spiel, ein Benachrichtigungston. Das ist der Stream, der zu deinen Lautsprechern oder Kopfhörern geht.
Ein Mikrofon ist ein Eingangsgerät , und Recorder sind darauf gebaut, Eingänge zu lesen. Systemton ist ein Ausgang – Ton, der den Computer verlässt – und einen Ausgangsstream zu lesen, ist ein grundlegend anderer Vorgang. Diese Asymmetrie ist der Grund, warum „Computerton und Bildschirm aufnehmen“ so viele Tools ins Stolpern bringt: Sie wurden rund um den Eingang entworfen und behandeln den Ausgang als nachträglichen Einfall oder überspringen ihn ganz.
Warum das Erfassen von internem Ton unter Windows schwierig ist
Um aufzunehmen, was dein Computer abspielt, muss Software etwas tun, das Loopbackheißt: Statt einem Mikrofon zuzuhören, zapft sie den Ausgang des Audiogeräts an rendern Stream – das fertig abgemischte Signal auf dem Weg zu den Lautsprechern – und kopiert ihn. Historisch hat Windows das umständlich gemacht.
Jahrelang war die einzige eingebaute Option Stereo Mix, ein virtuelles Aufnahmegerät, das manche Soundkarten bereitstellten. Es funktionierte – manchmal – aber viele moderne Laptops und USB-Headsets bieten es schlicht nicht. Wenn Stereo Mix fehlt, greifen die Leute zu einem virtuellen Audiokabel – Software wie VB-Cable, die ein gefälschtes Ausgabegerät erzeugt, sodass man seinen Systemton dorthin leitet und dann dasaufnimmt. Das funktioniert, aber es ist eine zusätzliche Installation, fügt eine Verkabelung hinzu, die man korrekt einrichten muss, und lässt sich leicht zerschießen: Ändert man das Ausgabegerät, ist die Aufnahme wieder stumm.
Die moderne, richtige Antwort ist WASAPI-Loopback. WASAPI (Windows Audio Session API) ermöglicht es einer Anwendung, das vorhandene Ausgabegerät im Loopback-Modus zu öffnen und genau das Audio mitzulesen, das gerade abgespielt wird – kein virtuelles Gerät, kein Umleiten, nichts, das der Nutzer konfigurieren muss. Die Technik steckt schon lange in Windows; der Haken ist, dass der Rekorder sie auch tatsächlich nutzen muss. Viele tun das nicht.
Wie Maxisnap beides aufnimmt – ganz ohne Treiber
Maxisnap erfasst den Systemton über WASAPI-Loopback und gleichzeitig dein Mikrofon und mischt sie standardmäßig in eine einzige Spur , sodass du alles hörst – die App, das Video und deine Erzählung – zusammen, so wie ein Zuschauer es erwartet. Kein Stereo Mix, das aktiviert werden muss, kein virtuelles Kabel zum Installieren, kein Treiber, dem man hinterherjagen muss. Du startest die Aufnahme und der Ton ist einfach da.
Die Aufnahme selbst ist unkompliziert. Zwei Hotkeys, beide frei belegbar:
Ctrl+Alt+4– nimmt den Vollbildschirm (der Monitor unter deinem Cursor).Ctrl+Alt+3– nimmt einen ausgewählter Bereich wenn du nur einen Teil des Bildschirms haben möchtest.
Ein kleines Aufnahme-Badge erscheint, damit du immer weißt, dass es läuft – und es ist bewusst von seiner eigenen Aufnahme ausgeschlossen, sodass es nie im Video auftaucht. Zum Stoppen drückst du den Hotkey erneut, klickst Stopp auf dem Badge oder nutzt die Taskleiste.
Wenn du stoppst, öffnet sich ein Ergebnisfenster mit einem integrierten Player, dazu Speichern, Kopieren, Upload, und Herausziehen -Schaltflächen. Du kannst Anfang und Ende beschneiden und exportieren nach MP4, KI-optimierte MP4, GIF, oder WebM mit Qualitätsvoreinstellungen. Das Encoding kann Hardwarebeschleunigung nutzen (NVENC, Intel QuickSync oder AMD AMF), wenn deine Maschine das unterstützt, andernfalls greift ein Software-Fallback – und ffmpeg ist im Installer enthalten, sodass es nichts weiter herunterzuladen gibt.
Wenn du Stimme und Systemton lieber getrennt bearbeiten möchtest, kannst du sie auf separaten Spuren halten, statt zu mischen. Das ist die sauberste Lösung gegen Echo und für Fälle, in denen du den App-Ton später unter deiner Erzählung absenken willst.
Eine Spur oder zwei: So entscheidest du
Die Standardeinstellung – Systemton und Mikrofon in einer Spur gemischt – ist für die meisten Leute richtig. Sie wird überall korrekt abgespielt, ganz ohne Bearbeitung, und genau das willst du für eine schnelle Demo, ein Tutorial oder einen Fehlerbericht.
Wähle separaten Spuren , wenn du die Aufnahme in einen Editor übernehmen und unabhängig steuern möchtest: die Lautstärke der App absenken, während du sprichst, einen Benachrichtigungston entfernen oder ein Synchronisationsproblem beheben. Separate Spuren kosten dich einen zusätzlichen Schritt (du mischst sie später zusammen) – im Tausch gegen volle Kontrolle.
Häufige Fehlerquellen – und wie du sie behebst
| Symptom | Wahrscheinliche Ursache | Lösung |
|---|---|---|
| Nur meine Stimme wurde aufgenommen | Der Rekorder hat das Mikrofon erfasst, aber nicht den System-Loopback | Verwende einen Rekorder mit WASAPI-Loopback (Maxisnap erfasst ihn standardmäßig – ohne Einrichtung) |
| Überhaupt kein Ton | Mikrofon stummgeschaltet/falsches Gerät, oder das Ausgabegerät wurde während der Aufnahme gewechselt | Stelle das richtige Mikrofon sicher und nimm das live abspielende Ausgabegerät direkt per Loopback auf, statt über ein virtuelles Kabel |
| Systemton, aber keine Stimme | Falsches Mikrofon ausgewählt, oder Mikrofonberechtigung verweigert | Wähle das richtige Eingabegerät und erteile in den Windows-Datenschutzeinstellungen Zugriff auf das Mikrofon |
| Echo / doppelter Ton | Die Lautsprecher geben den Ton wieder und das Mikrofon nimmt ihn erneut auf | Trage Kopfhörer oder nimm Systemton und Mikrofon auf separaten Spuren auf |
| Audio läuft aus dem Takt | Bildrate oder A/V-Timing-Abweichung während der Aufnahme | Nimm mit konstanter Bildrate auf; beschneide und exportiere bei Bedarf erneut aus dem Ergebnisfenster |
| Roboterhafter / knackender Ton | Abtastraten-Abweichung oder eine überlastete Virtuelles-Kabel-Kette | Verzichte auf das virtuelle Kabel; die Loopback-Aufnahme liest den nativen Stream des Geräts sauber aus |
Der rote Faden, der sich durch fast alle diese Fälle zieht: Virtuelle Kabel und Stereo Mix fügen fragile bewegliche Teile hinzu. Liest man das Ausgabegerät direkt per Loopback aus, fällt der Großteil der Wege weg, auf denen „Bildschirm mit internem Audio und Mikrofon aufnehmen“ schiefgehen kann.
Eine kurze Anmerkung zum Mac
Beim Systemton ist macOS die umgekehrte Geschichte. Die eingebauten Werkzeuge – Cmd+Shift+5 und QuickTime Player – nehmen Bildschirm und Mikrofon problemlos auf, aber sie können internes Audio nicht von sich aus erfassen. Um aufzunehmen, was der Mac abspielt, brauchst du nach wie vor einen Treiber wie BlackHole oder Soundflower, geroutet über ein aggregiertes oder Mehrfach-Ausgabegerät. Wenn du auf einem Mac bist, führt dich der kostenlose Leitfaden zur Mac-Bildschirmaufnahme genau durch die Einrichtung. Der Rekorder von Maxisnap ist heute für Windows verfügbar; ein nativer macOS-Build befindet sich in aktiver Entwicklung, und du kannst dich benachrichtigen lassen über die Kontaktseite.
Der schnellste Weg zu einer Aufnahme, die wirklich Ton hat
Wenn du einfach nur einen Clip mit App-Ton und deiner Stimme willst, hier der ganze Ablauf unter Windows:
- Drücken Sie
Ctrl+Alt+4(Vollbildschirm) oderCtrl+Alt+3(Bereich). - Sprich über das, was du zeigst – Systemton und dein Mikrofon werden beide erfasst und standardmäßig gemischt.
- Drücke den Hotkey erneut zum Stoppen. Schneide die toten Sekunden am Anfang und Ende weg.
- Exportiere nach MP4 – oder wähle KI-optimierte MP4 (~1280px, 24fps, mono), um eine winzige Datei zu erhalten, die du direkt in ChatGPT, Claude oder Gemini ziehen kannst.
Kein Wasserzeichen, kein Zeitlimit, und die Aufnahme ist kostenlos. Das ist der Unterschied zwischen einem stummen Video, das du neu aufnehmen musst, und einem Clip, der beim ersten Mal alles sagt.
Häufig gestellte Fragen
Wie nehme ich meinen Bildschirm mit Systemton und Mikrofon gleichzeitig auf?
Verwende einen Rekorder, der den System-Loopback ebenso wie das Mikrofon erfasst. In Maxisnap drückst du Ctrl+Alt+4 (Vollbildschirm) oder Ctrl+Alt+3 (Bereich); Desktop-Audio über WASAPI-Loopback und dein Mikrofon werden beide erfasst und standardmäßig in eine Spur gemischt – kein virtuelles Kabel, kein zusätzlicher Treiber nötig.
Warum nimmt meine Aufnahme nur das Mikrofon auf und nicht den Computerton?
Weil der Rekorder nur den Mikrofoneingang geöffnet hat. Um aufzunehmen, was der Computer abspielt, ist eine Loopback-Aufnahme des Ausgabestreams des Audiogeräts nötig. Maxisnap macht das über WASAPI, sodass der Desktop-Ton treiberfrei zusammen mit dem Mikrofon erfasst wird.
Brauche ich Stereo Mix oder ein virtuelles Audiokabel unter Windows?
Nein. Stereo Mix ist unzuverlässig und auf vielen modernen Geräten gar nicht vorhanden, und virtuelle Kabel sind eine zusätzliche Installation mit einer Verkabelung, die gepflegt werden muss. Maxisnap liest den Desktop-Loopback nativ über WASAPI aus, sodass keines von beiden erforderlich ist.
Warum ist in meiner Aufnahme ein Echo?
Derselbe Ton wird zweimal erfasst – deine Lautsprecher geben ihn wieder und dein Mikrofon nimmt ihn erneut auf. Trage Kopfhörer oder nimm Systemton und Mikrofon auf separaten Spuren auf, damit du einen davon beim Bearbeiten stummschalten oder ausrichten kannst.
Ist die Aufnahme mit Ton kostenlos, und gibt es ein Wasserzeichen oder Zeitlimit?
Ja – die Aufnahme mit Systemton und Mikrofon ist unter Windows kostenlos, ohne Wasserzeichen und ohne Zeitlimit. Kostenpflichtige Stufen kommen erst ins Spiel, wenn du Aufnahmen über Maxisnap Cloud über das kostenlose Kontingent hinaus teilst; lokal speichern oder selbst hosten kannst du immer.
Möchtest du die vollständige Anleitung zur Aufnahme jenseits der Audio-Feinheiten? Siehe So nimmst du deinen Bildschirm unter Windows kostenlos auf, oder erfahre, wie das kombinierte Tool aus Bildschirmrekorder und Screenshot in eine einzige schlanke App passt.