Bildschirm mit System- und Mikrofonton aufnehmen

Sie starten die Aufnahme, führen den Fehler vor, erklären die Lösung — und beim Ansehen ist das Video genau dort stumm, wo die App sprechen sollte. Der Klick auf die Schaltfläche machte ein Geräusch. Das Video, auf das Sie reagiert haben, hatte Musik. Nichts davon ist in der Datei. Nur Ihre Stimme, schwebend über einem stummen Bildschirm.

Das ist das mit Abstand häufigste Problem bei Bildschirmaufnahmen, und es hat eine konkrete Ursache: Die meisten kostenlosen Rekorder öffnen nur Ihr Mikrofon. Sie erfassen nie den Ton, den Ihr Computer tatsächlich abspielt. Dieser Leitfaden erklärt den Unterschied zwischen Systemton und Mikrofonton, warum das Aufnehmen des Systemklangs unter Windows tatsächlich schwieriger ist, als es sein müsste, und wie Sie beide gleichzeitig aufnehmen — sauber, in einer Datei, ohne einen einzigen zusätzlichen Treiber.

Systemton vs. Mikrofon: zwei völlig verschiedene Quellen

Wenn Leute „Bildschirm mit Ton aufnehmen" sagen, meinen sie meist zwei verschiedene Dinge zugleich, und ein Rekorder muss jedes davon getrennt handhaben:

Mikrofon (Eingang): Ihre Stimme. Das ist der einfache Teil. Jeder Rekorder kann einen Mikrofoneingang öffnen. Es ist derselbe Stream, den ein Sprachanruf verwendet.
System-/Desktop-Ton (Ausgang): alles, was der Computer ausgibt — die App, die Sie vorführen, das YouTube-Video, auf das Sie reagieren, ein Zoom-Anruf, ein Spiel, ein Benachrichtigungston. Das ist der Stream, der an Ihre Lautsprecher oder Kopfhörer geht.

Ein Mikrofon ist ein Eingabegerät , und Rekorder sind darauf ausgelegt, Eingänge zu lesen. Systemton ist ein Ausgang — Ton, der den Computer verlässt — und das Lesen eines Ausgabestreams ist ein grundlegend anderer Vorgang. Diese Asymmetrie ist der Grund, warum „Computerton und Bildschirm aufnehmen" so viele Tools ins Stolpern bringt: Sie wurden rund um den Eingang entworfen und behandeln den Ausgang als Nebensache oder überspringen ihn ganz.

Warum die Aufnahme des internen Tons unter Windows schwierig ist

Um aufzunehmen, was Ihr Computer abspielt, muss Software etwas tun, das Loopbackheißt: Statt auf ein Mikrofon zu hören, greift sie den Render -Stream des Audiogeräts ab — das abgemischte Signal auf seinem Weg zu den Lautsprechern — und kopiert es. In der Vergangenheit machte Windows das umständlich.

Jahrelang war die einzige eingebaute Option Stereo Mix, ein virtuelles Aufnahmegerät, das manche Soundkarten bereitstellten. Es funktionierte manchmal, aber viele moderne Laptops und USB-Headsets bieten es schlicht nicht an. Wenn Stereo Mix fehlt, greifen Leute zu einem virtuellen Audiokabel — Software wie VB-Cable, die ein fiktives Ausgabegerät erstellt, sodass Sie Ihren Systemton dort hineinleiten und dann diesesaufnehmen. Es funktioniert, aber es ist eine zusätzliche Installation, bringt eine Verkabelung mit sich, die Sie korrekt einrichten müssen, und geht leicht kaputt: Wechseln Sie Ihr Ausgabegerät, und die Aufnahme ist wieder stumm.

Die moderne, korrekte Antwort lautet WASAPI-Loopback. WASAPI (Windows Audio Session API) erlaubt es einer Anwendung, das vorhandene Ausgabegerät im Loopback-Modus zu öffnen und genau den bereits abgespielten Ton zu lesen — kein virtuelles Gerät, keine Umleitung, nichts, was der Nutzer konfigurieren muss. Die technische Grundlage steckt seit Langem in Windows; der Haken ist, dass der Rekorder sie auch tatsächlich nutzen muss. Viele tun das nicht.

Wie Maxisnap beides aufnimmt – ganz ohne Treiber

Maxisnap erfasst Systemton per WASAPI-Loopback und Ihr Mikrofon gleichzeitig und mischt sie standardmäßig zu einer einzigen Spur , sodass Sie alles — die App, das Video und Ihre Erzählung — zusammen hören, so wie es ein Zuschauer erwartet. Es gibt kein Stereo Mix zu aktivieren, kein virtuelles Kabel zu installieren, keinen Treiber aufzuspüren. Sie starten die Aufnahme, und der Ton ist einfach da.

Die Aufnahme selbst ist unkompliziert. Zwei Tastenkombinationen, beide umbelegbar:

Ctrl+Alt+4 — nimmt den gesamten Bildschirm (den Monitor unter Ihrem Cursor).
Ctrl+Alt+3 — nimmt einen ausgewählten Bereich auf, wenn Sie nur einen Teil des Bildschirms möchten.

Eine kleine Aufnahmeanzeige erscheint, sodass Sie stets wissen, dass die Aufnahme läuft — und sie ist bewusst von der eigenen Aufnahme ausgeschlossen, sodass sie nie im Video auftaucht. Zum Beenden drücken Sie die Tastenkombination erneut, klicken auf Stopp in der Anzeige oder nutzen die Taskleiste.

Wenn Sie stoppen, öffnet sich ein Ergebnisfenster mit integriertem Player sowie den Schaltflächen Speichern, direkt in eine andere App Kopieren, direkt in eine andere App Hochladenund Herausziehen . Sie können Anfang und Ende zuschneiden und mit Qualitätsvoreinstellungen als MP4, direkt in eine andere App KI-optimiertes MP4, direkt in eine andere App GIFoder WebM exportieren. Die Kodierung kann Hardwarebeschleunigung nutzen (NVENC, Intel QuickSync oder AMD AMF), wenn Ihr Gerät sie unterstützt, andernfalls mit Software-Fallback — und ffmpeg ist im Installer enthalten, sodass Sie nichts weiter herunterladen müssen.

Wenn Sie Stimme und Systemton lieber getrennt bearbeiten möchten, können Sie sie auf separate Spuren belassen, statt zu mischen. Das ist die sauberste Lösung gegen Echo und für Fälle, in denen Sie den App-Ton später unter Ihrer Erzählung absenken möchten.

Eine Spur oder zwei: die richtige Wahl

Die Standardeinstellung — Systemton und Mikrofon zu einer Spur gemischt — ist für die meisten Menschen die richtige. Sie spielt überall ohne Nachbearbeitung korrekt ab und ist genau das, was Sie für eine schnelle Demo, ein Tutorial oder einen Fehlerbericht wollen.

Wählen Sie separate Spuren , wenn Sie die Aufnahme in einen Editor übernehmen und unabhängige Kontrolle möchten: die App-Lautstärke absenken, während Sie sprechen, einen Benachrichtigungston entfernen oder ein Synchronisationsproblem beheben. Separate Spuren kosten Sie einen zusätzlichen Schritt (Sie mischen sie später zusammen) im Tausch gegen volle Kontrolle.

Häufige Fehlerbilder — und wie Sie sie beheben

Symptom	Wahrscheinliche Ursache	Lösung
Nur meine Stimme wurde aufgenommen	Der Rekorder erfasste das Mikrofon, aber nicht den System-Loopback	Verwenden Sie einen Rekorder mit WASAPI-Loopback (Maxisnap erfasst ihn standardmäßig — ohne Einrichtung)
Gar kein Ton	Mikrofon stummgeschaltet/falsches Gerät oder Ausgabegerät während der Aufnahme gewechselt	Bestätigen Sie das richtige Mikrofon und nehmen Sie das aktive Ausgabegerät direkt per Loopback statt über ein virtuelles Kabel auf
Systemton, aber keine Stimme	Falsches Mikrofon ausgewählt oder Mikrofonberechtigung verweigert	Wählen Sie das richtige Eingabegerät und erteilen Sie den Mikrofonzugriff in den Windows-Datenschutzeinstellungen
Echo / doppelter Ton	Die Lautsprecher spielen den Ton ab, und das Mikrofon nimmt ihn erneut auf	Tragen Sie Kopfhörer oder nehmen Sie Systemton und Mikrofon auf separaten Spuren auf
Der Ton läuft aus dem Takt	Nicht übereinstimmende Bildrate oder A/V-Timing während der Aufnahme	Nehmen Sie mit gleichmäßiger Bildrate auf; schneiden Sie zu und exportieren Sie bei Bedarf erneut aus dem Ergebnisfenster
Roboterhafter / knisternder Ton	Nicht übereinstimmende Abtastrate oder eine überlastete virtuelle Kabelkette	Lassen Sie das virtuelle Kabel weg; die Loopback-Aufnahme liest den nativen Stream des Geräts sauber

Der rote Faden bei fast allen: Virtuelle Kabel und Stereo Mix fügen fragile bewegliche Teile hinzu. Das direkte Lesen des Ausgabegeräts per Loopback beseitigt die meisten Wege, auf denen „Bildschirm mit internem Ton und Mikrofon aufnehmen" schiefgehen kann.

Ein kurzer Hinweis zum Mac

Beim Systemton ist macOS die umgekehrte Geschichte. Die eingebauten Werkzeuge — Cmd+Umschalt+5 und QuickTime Player — nehmen den Bildschirm und Ihr Mikrofon problemlos auf, können aber den internen Ton nicht von allein erfassen. Um aufzunehmen, was der Mac abspielt, benötigen Sie weiterhin einen Treiber wie BlackHole oder Soundflower, geleitet über ein Aggregat- oder Mehrfachausgabegerät. Wenn Sie einen Mac nutzen, führt Sie der kostenlose Leitfaden zur Mac-Bildschirmaufnahme genau durch die Einrichtung. Der Rekorder von Maxisnap ist heute für Windows verfügbar; eine native macOS-Version ist in aktiver Entwicklung, und Sie können sich auf der Kontaktseitein Claude Code.

Der schnellste Weg zu einer Aufnahme, die wirklich Ton hat

Wenn Sie einfach einen Clip mit App-Ton und Ihrer Stimme möchten, hier der gesamte Ablauf unter Windows:

Drücken Sie Ctrl+Alt+4 (Vollbild) oder Ctrl+Alt+3 (Bereich).
Sprechen Sie zu dem, was Sie vorführen — Systemton und Ihr Mikrofon werden beide erfasst und standardmäßig gemischt.
Drücken Sie die Tastenkombination erneut zum Stoppen. Schneiden Sie die Stille am Anfang und Ende weg.
Exportieren Sie als MP4 — oder wählen Sie KI-optimiertes MP4 (~1280px, 24fps, Mono) für eine winzige Datei, die Sie direkt in ChatGPT, Claude oder Gemini ablegen können.

Kein Wasserzeichen, kein Zeitlimit, und die Aufnahme ist kostenlos. Das ist der Unterschied zwischen einem stummen Video, das Sie neu aufnehmen müssen, und einem Clip, der beim ersten Mal alles sagt.

Häufig gestellte Fragen

Wie nehme ich meinen Bildschirm gleichzeitig mit Systemton und Mikrofon auf?
Verwenden Sie einen Rekorder, der neben dem Mikrofon auch den System-Loopback erfasst. Drücken Sie in Maxisnap Ctrl+Alt+4 (Vollbild) oder Ctrl+Alt+3 (Bereich); Desktop-Ton per WASAPI-Loopback und Ihr Mikrofon werden beide erfasst und standardmäßig zu einer Spur gemischt — ohne virtuelles Kabel oder zusätzlichen Treiber.

Warum erfasst meine Aufnahme nur das Mikrofon und nicht den Computerton?
Weil der Rekorder nur den Mikrofoneingang geöffnet hat. Um aufzunehmen, was der Computer abspielt, ist eine Loopback-Aufnahme des Ausgabestreams des Audiogeräts nötig. Maxisnap tut dies über WASAPI, sodass der Desktop-Ton treiberfrei zusammen mit dem Mikrofon erfasst wird.

Brauche ich unter Windows Stereo Mix oder ein virtuelles Audiokabel?
Nein. Stereo Mix ist unzuverlässig und auf vielen modernen Geräten nicht vorhanden, und virtuelle Kabel sind eine zusätzliche Installation mit zu pflegender Verkabelung. Maxisnap liest den Desktop-Loopback nativ über WASAPI, sodass keines von beiden erforderlich ist.

Warum ist in meiner Aufnahme ein Echo?
Derselbe Ton wird zweimal erfasst — Ihre Lautsprecher spielen ihn ab, und Ihr Mikrofon nimmt ihn erneut auf. Tragen Sie Kopfhörer oder nehmen Sie Systemton und Mikrofon auf separaten Spuren auf, damit Sie eine beim Bearbeiten stummschalten oder ausrichten können.

Ist die Aufnahme mit Ton kostenlos, und gibt es ein Wasserzeichen oder Zeitlimit?
Ja — die Aufnahme mit Systemton und Mikrofon ist unter Windows kostenlos, ohne Wasserzeichen und ohne Zeitlimit. Bezahltarife kommen erst ins Spiel, wenn Sie Aufnahmen über Maxisnap Cloud über das kostenlose Kontingent hinaus teilen; Sie können jederzeit lokal speichern oder selbst hosten.

Möchten Sie die vollständige Anleitung zum Aufnehmen ohne die Ton-Feinheiten? Sehen Sie sich wie Sie Ihren Bildschirm unter Windows kostenlos aufnehmenan oder erfahren Sie, wie das kombinierte Bildschirmrekorder- und Screenshot-Tool in eine schlanke App passt.