How do I record my screen with system audio and microphone at the same time?

On Windows, you need a recorder that captures the system audio loopback in addition to your microphone. Maxisnap does both by default and mixes them into one track: press Ctrl+Alt+4 to record the full screen (or Ctrl+Alt+3 for a region), and the recording includes desktop/app sound via WASAPI loopback plus your mic — no virtual audio cable or extra driver required. You can also keep the two on separate tracks if you prefer to edit them apart later.

Why does my screen recording only capture the microphone and not the computer sound?

Most basic recorders only open the microphone input, so the app, video, or call audio playing through your speakers never reaches the file. Capturing what the computer plays requires 'loopback' recording — tapping the audio device's output stream. Windows exposes this through WASAPI, which Maxisnap uses directly, so desktop sound is captured driver-free alongside the mic.

Do I need Stereo Mix or a virtual audio cable to record system audio on Windows?

No. Stereo Mix is an old, inconsistent driver feature that many modern sound cards no longer expose, and virtual audio cables (like VB-Cable) are an extra install with routing to configure. Maxisnap records the desktop audio loopback through WASAPI natively, so you do not need Stereo Mix, a virtual cable, or any additional driver to capture computer sound.

Why is there an echo in my screen recording with audio?

Echo usually means the same sound is captured twice — for example your speakers play the system audio, your microphone picks it up again, and both get mixed in slightly out of sync. The fix is to wear headphones so the microphone never hears the speaker output, or to record system audio and the microphone on separate tracks so you can mute or align one in editing.

Is recording screen with audio free in Maxisnap, and is there a watermark or time limit?

Yes, screen recording with system audio and microphone is completely free in Maxisnap on Windows. There is no watermark and no time limit on the recording itself. You only touch the paid tiers if you choose to share recordings through Maxisnap Cloud beyond the free upload allowance; you can always save the file locally or send it to your own server instead.

Så spelar du in din skärm med ljud (systemljud + mikrofon)

Du trycker på spela in, går igenom buggen, berättar om lösningen – och sedan tittar du på det igen och videon är tyst där appen borde tala. Knappklicket gav ett ljud. Videon du reagerade på hade musik. Inget av det finns i filen. Bara din röst, svävande över en ljudlös skärm.

Detta är det absolut vanligaste problemet med skärminspelning, och det har en specifik orsak: de flesta gratisinspelare öppnar bara din mikrofon. De fångar aldrig ljudet som din dator faktiskt spelar upp. Den här guiden förklarar skillnaden mellan systemljud och mikrofonljud, varför det är genuint svårare än det borde vara att fånga systemljud på Windows, och hur du spelar in båda samtidigt – rent, i en fil, utan en enda extra drivrutin.

Systemljud kontra mikrofon: två helt olika källor

När folk säger "spela in skärmen med ljud" menar de oftast två olika saker samtidigt, och en inspelare måste hantera var och en för sig:

Mikrofon (ingång): din röst. Det här är den enkla. Varje inspelare kan öppna en mikrofoningång. Det är samma ström som ett röstsamtal använder.
System-/skrivbordsljud (utgång): allt som datorn spelar upp ut – appen du visar, YouTube-videon du reagerar på, ett Zoom-samtal, ett spel, en aviseringssignal. Detta är strömmen som går till dina högtalare eller hörlurar.

En mikrofon är en ingångs- enhet, och inspelare är byggda för att läsa ingångar. Systemljud är en ut – ljud som lämnar datorn – och att läsa en utgångsström är en fundamentalt annorlunda operation. Den asymmetrin är varför "spela in datorljud och skärm" sätter krokben för så många verktyg: de utformades kring ingången och behandlar utgången som en eftertanke, eller hoppar över den helt.

Varför det är svårt att fånga internt ljud på Windows

För att spela in det din dator spelar upp måste programvaran göra något som kallas loopback: i stället för att lyssna på en mikrofon tappar den av ljudenhetens rendera ström — den färdigmixade signalen på väg till högtalarna — och kopierar den. Historiskt sett gjorde Windows detta krångligt.

I åratal var det enda inbyggda alternativet Stereo Mix, en virtuell inspelningsenhet som vissa ljudkort exponerade. Den fungerade ibland, men en hel del moderna bärbara datorer och USB-headset erbjuder den helt enkelt inte. När Stereo Mix saknas tar folk till en virtuell ljudkabel — programvara som VB-Cable som skapar en låtsasutgångsenhet, så att du dirigerar systemljudet in i den och sedan spelar in den. Det fungerar, men det är en extra installation, det lägger till dirigering som du måste ställa in korrekt, och det är lätt att förstöra: byter du utgångsenhet blir inspelningen tyst igen.

Det moderna, rätta svaret är WASAPI-loopback. WASAPI (Windows Audio Session API) låter ett program öppna den befintliga utgångsenheten i loopback-läge och läsa exakt det ljud som redan spelas upp — ingen virtuell enhet, ingen omdirigering, inget som användaren behöver konfigurera. Den underliggande tekniken har funnits i Windows länge; haken är att inspelaren faktiskt måste använda den. Många gör inte det.

Så här spelar Maxisnap in båda, helt utan drivrutiner

Maxisnap fångar systemljudet via WASAPI-loopback och din mikrofon samtidigt, och som standard mixar dem till ett enda spår så att du hör allt — appen, videon och din berättarröst — tillsammans, precis som en tittare förväntar sig. Det finns ingen Stereo Mix att aktivera, ingen virtuell kabel att installera, ingen drivrutin att jaga reda på. Du startar inspelningen och ljudet finns helt enkelt där.

Själva inspelningen är okomplicerad. Två snabbtangenter, båda omkopplingsbara:

Ctrl+Alt+4 – spela in hela skärmen (skärmen under markören).
Ctrl+Alt+3 – spela in ett markerat område när du bara vill ha en del av skärmen.

En liten inspelningsbricka visas så att du alltid vet att inspelningen pågår — och den är medvetet utesluten från sin egen inspelning, så den syns aldrig i videon. För att stoppa, tryck på snabbtangenten igen, klicka på Stopp på brickan, eller använd aktivitetsfältet.

När du stoppar öppnas ett resultatfönster med en inbäddad spelare, plus Spara, Kopiera, Uppladdning, och Dra ut -knappar. Du kan trimma början och slutet och exportera till MP4, AI-optimerad MP4, GIF, eller WebM med kvalitetsförinställningar. Kodningen kan använda hårdvaruacceleration (NVENC, Intel QuickSync eller AMD AMF) när din dator stöder det, med en mjukvarufallback annars — och ffmpeg följer med inuti installationsprogrammet, så det finns inget annat att ladda ner.

Om du hellre vill redigera rösten och systemljudet var för sig kan du behålla dem på separata spår istället för att mixa. Det är den renaste lösningen mot eko och för fall där du senare vill sänka appljudet under din berättarröst.

Ett spår eller två: så väljer du

Standardvalet — systemljud och mikrofon mixade till ett spår — passar de flesta. Det spelas upp korrekt överallt utan någon redigering, och det är vad du vill ha för en snabb demo, en handledning eller en buggrapport.

Välj separata spår när du planerar att ta inspelningen vidare till ett redigeringsprogram och vill ha oberoende kontroll: sänka appens volym medan du pratar, ta bort ett aviseringsljud eller fixa ett synkproblem. Separata spår kostar dig ett extra steg (du mixar ner dem senare) i utbyte mot full kontroll.

Vanliga felfall — och hur du fixar dem

Symptom	Trolig orsak	Lösning
Bara min röst spelades in	Inspelaren fångade mikrofonen men inte systemets loopback	Använd en inspelare med WASAPI-loopback (Maxisnap fångar det som standard — ingen konfiguration)
Inget ljud alls	Mikrofonen avstängd/fel enhet, eller utgångsenheten ändrades mitt under inspelningen	Bekräfta rätt mikrofon, och spela in den aktiva utgångsenheten direkt via loopback istället för en virtuell kabel
Systemljud men ingen röst	Fel mikrofon vald, eller mikrofonbehörighet nekad	Välj rätt inenhet och bevilja mikrofonåtkomst i Windows sekretessinställningar
Eko / dubblerat ljud	Högtalarna spelar upp ljudet och mikrofonen spelar in det igen	Använd hörlurar, eller spela in systemljud och mikrofon på separata spår
Ljudet glider ur synk	Bildfrekvens eller A/V-tidsglapp under inspelningen	Spela in med en jämn bildfrekvens; trimma och exportera om från resultatfönstret vid behov
Robotaktigt / sprakande ljud	Samplingsfrekvensglapp eller en överbelastad virtuell-kabel-kedja	Släpp den virtuella kabeln; loopback-inspelning läser enhetens nativa ström rent

Den röda tråden genom nästan alla dessa: virtuella kablar och Stereo Mix lägger till bräckliga rörliga delar. Att läsa utgångsenheten direkt via loopback eliminerar de flesta sätt som "spela in skärm med internt ljud och mikrofon" kan gå fel på.

En kort anmärkning om Mac

macOS är den motsatta historien när det gäller systemljud. De inbyggda verktygen — Cmd+Shift+5 och QuickTime Player — spelar in skärmen och din mikrofon utan problem, men de kan inte fånga internt ljud på egen hand. För att spela in det Macen spelar upp behöver du fortfarande en drivrutin som BlackHole eller Soundflower dirigerad genom en aggregerad enhet eller flerutgångsenhet. Om du sitter på en Mac går den kostnadsfria guiden för skärminspelning på Mac igenom exakt hur du ställer in det. Maxisnaps inspelare finns tillgänglig på Windows idag; en nativ macOS-version är under aktiv utveckling, och du kan be att bli aviserad på kontaktsidan.

Den snabbaste vägen till en inspelning som faktiskt har ljud

Om du bara vill ha ett klipp med både appljudet och din röst i, så här ser hela flödet ut på Windows:

Tryck på Ctrl+Alt+4 (hela skärmen) eller Ctrl+Alt+3 (område).
Prata över det du visar — både systemljudet och din mikrofon fångas, mixade som standard.
Tryck på snabbtangenten igen för att stoppa. Trimma bort den döda luften i början och slutet.
Exportera till MP4 — eller välj AI-optimerad MP4 (~1280px, 24fps, mono) för att få en pytteliten fil som du kan släppa rakt in i ChatGPT, Claude eller Gemini.

Ingen vattenstämpel, ingen tidsgräns, och inspelningen är gratis. Det är skillnaden mellan en tyst video du måste spela in på nytt och ett klipp som säger allt redan första gången.

Vanliga frågor och svar

Hur spelar jag in min skärm med systemljud och mikrofon samtidigt?
Använd en inspelare som fångar systemets loopback liksom mikrofonen. I Maxisnap, tryck Ctrl+Alt+4 (hela skärmen) eller Ctrl+Alt+3 (område); skrivbordsljud via WASAPI-loopback och din mikrofon fångas båda och mixas till ett spår som standard — ingen virtuell kabel eller extra drivrutin behövs.

Varför fångar min inspelning bara mikrofonen och inte datorljudet?
För att inspelaren bara öppnade mikrofoningången. Att fånga det datorn spelar upp kräver loopback-inspelning av ljudenhetens utgångsström. Maxisnap gör detta via WASAPI, så skrivbordsljudet fångas helt utan drivrutiner vid sidan av mikrofonen.

Behöver jag Stereo Mix eller en virtuell ljudkabel på Windows?
Nej. Stereo Mix är inkonsekvent och saknas på många moderna enheter, och virtuella kablar är en extra installation med dirigering att underhålla. Maxisnap läser skrivbordets loopback via WASAPI nativt, så ingetdera krävs.

Varför är det eko i min inspelning?
Samma ljud fångas två gånger — dina högtalare spelar upp det och din mikrofon plockar upp det igen. Använd hörlurar, eller spela in systemljud och mikrofon på separata spår så att du kan tysta eller justera in ett av dem i redigeringen.

Är inspelning med ljud gratis, och finns det någon vattenstämpel eller tidsgräns?
Ja — inspelning med systemljud och mikrofon är gratis på Windows, utan vattenstämpel och utan tidsgräns. Betalnivåer kommer bara in i bilden om du delar inspelningar via Maxisnap Cloud utöver det kostnadsfria utrymmet; du kan alltid spara lokalt eller hosta själv.

Vill du ha hela genomgången av inspelning utan ljudfinesser? Se hur du spelar in din skärm på Windows gratis, eller lär dig hur den kombinerade skärminspelaren och skärmdumpverktyget passar in i en enda lättviktig app.