Så spelar du in din skärm med ljud (systemljud + mikrofon)
Du trycker på spela in, går igenom buggen, berättar om lösningen – och sedan tittar du på det igen och videon är tyst där appen borde tala. Knappklicket gav ett ljud. Videon du reagerade på hade musik. Inget av det finns i filen. Bara din röst, svävande över en ljudlös skärm.
Detta är det absolut vanligaste problemet med skärminspelning, och det har en specifik orsak: de flesta gratisinspelare öppnar bara din mikrofon. De fångar aldrig ljudet som din dator faktiskt spelar upp. Den här guiden förklarar skillnaden mellan systemljud och mikrofonljud, varför det är genuint svårare än det borde vara att fånga systemljud på Windows, och hur du spelar in båda samtidigt – rent, i en fil, utan en enda extra drivrutin.
Systemljud kontra mikrofon: två helt olika källor
När folk säger "spela in skärmen med ljud" menar de oftast två olika saker samtidigt, och en inspelare måste hantera var och en för sig:
- Mikrofon (ingång): din röst. Det här är den enkla. Varje inspelare kan öppna en mikrofoningång. Det är samma ström som ett röstsamtal använder.
- System-/skrivbordsljud (utgång): allt som datorn spelar upp ut – appen du visar, YouTube-videon du reagerar på, ett Zoom-samtal, ett spel, en aviseringssignal. Detta är strömmen som går till dina högtalare eller hörlurar.
En mikrofon är en ingångs- enhet, och inspelare är byggda för att läsa ingångar. Systemljud är en ut – ljud som lämnar datorn – och att läsa en utgångsström är en fundamentalt annorlunda operation. Den asymmetrin är varför "spela in datorljud och skärm" sätter krokben för så många verktyg: de utformades kring ingången och behandlar utgången som en eftertanke, eller hoppar över den helt.
Varför det är svårt att fånga internt ljud på Windows
För att spela in det din dator spelar upp måste programvaran göra något som kallas loopback: i stället för att lyssna på en mikrofon tappar den av ljudenhetens rendera ström — den färdigmixade signalen på väg till högtalarna — och kopierar den. Historiskt sett gjorde Windows detta krångligt.
I åratal var det enda inbyggda alternativet Stereo Mix, en virtuell inspelningsenhet som vissa ljudkort exponerade. Den fungerade ibland, men en hel del moderna bärbara datorer och USB-headset erbjuder den helt enkelt inte. När Stereo Mix saknas tar folk till en virtuell ljudkabel — programvara som VB-Cable som skapar en låtsasutgångsenhet, så att du dirigerar systemljudet in i den och sedan spelar in den. Det fungerar, men det är en extra installation, det lägger till dirigering som du måste ställa in korrekt, och det är lätt att förstöra: byter du utgångsenhet blir inspelningen tyst igen.
Det moderna, rätta svaret är WASAPI-loopback. WASAPI (Windows Audio Session API) låter ett program öppna den befintliga utgångsenheten i loopback-läge och läsa exakt det ljud som redan spelas upp — ingen virtuell enhet, ingen omdirigering, inget som användaren behöver konfigurera. Den underliggande tekniken har funnits i Windows länge; haken är att inspelaren faktiskt måste använda den. Många gör inte det.
Så här spelar Maxisnap in båda, helt utan drivrutiner
Maxisnap fångar systemljudet via WASAPI-loopback och din mikrofon samtidigt, och som standard mixar dem till ett enda spår så att du hör allt — appen, videon och din berättarröst — tillsammans, precis som en tittare förväntar sig. Det finns ingen Stereo Mix att aktivera, ingen virtuell kabel att installera, ingen drivrutin att jaga reda på. Du startar inspelningen och ljudet finns helt enkelt där.
Själva inspelningen är okomplicerad. Två snabbtangenter, båda omkopplingsbara:
Ctrl+Alt+4– spela in hela skärmen (skärmen under markören).Ctrl+Alt+3– spela in ett markerat område när du bara vill ha en del av skärmen.
En liten inspelningsbricka visas så att du alltid vet att inspelningen pågår — och den är medvetet utesluten från sin egen inspelning, så den syns aldrig i videon. För att stoppa, tryck på snabbtangenten igen, klicka på Stopp på brickan, eller använd aktivitetsfältet.
När du stoppar öppnas ett resultatfönster med en inbäddad spelare, plus Spara, Kopiera, Uppladdning, och Dra ut -knappar. Du kan trimma början och slutet och exportera till MP4, AI-optimerad MP4, GIF, eller WebM med kvalitetsförinställningar. Kodningen kan använda hårdvaruacceleration (NVENC, Intel QuickSync eller AMD AMF) när din dator stöder det, med en mjukvarufallback annars — och ffmpeg följer med inuti installationsprogrammet, så det finns inget annat att ladda ner.
Om du hellre vill redigera rösten och systemljudet var för sig kan du behålla dem på separata spår istället för att mixa. Det är den renaste lösningen mot eko och för fall där du senare vill sänka appljudet under din berättarröst.
Ett spår eller två: så väljer du
Standardvalet — systemljud och mikrofon mixade till ett spår — passar de flesta. Det spelas upp korrekt överallt utan någon redigering, och det är vad du vill ha för en snabb demo, en handledning eller en buggrapport.
Välj separata spår när du planerar att ta inspelningen vidare till ett redigeringsprogram och vill ha oberoende kontroll: sänka appens volym medan du pratar, ta bort ett aviseringsljud eller fixa ett synkproblem. Separata spår kostar dig ett extra steg (du mixar ner dem senare) i utbyte mot full kontroll.
Vanliga felfall — och hur du fixar dem
| Symptom | Trolig orsak | Lösning |
|---|---|---|
| Bara min röst spelades in | Inspelaren fångade mikrofonen men inte systemets loopback | Använd en inspelare med WASAPI-loopback (Maxisnap fångar det som standard — ingen konfiguration) |
| Inget ljud alls | Mikrofonen avstängd/fel enhet, eller utgångsenheten ändrades mitt under inspelningen | Bekräfta rätt mikrofon, och spela in den aktiva utgångsenheten direkt via loopback istället för en virtuell kabel |
| Systemljud men ingen röst | Fel mikrofon vald, eller mikrofonbehörighet nekad | Välj rätt inenhet och bevilja mikrofonåtkomst i Windows sekretessinställningar |
| Eko / dubblerat ljud | Högtalarna spelar upp ljudet och mikrofonen spelar in det igen | Använd hörlurar, eller spela in systemljud och mikrofon på separata spår |
| Ljudet glider ur synk | Bildfrekvens eller A/V-tidsglapp under inspelningen | Spela in med en jämn bildfrekvens; trimma och exportera om från resultatfönstret vid behov |
| Robotaktigt / sprakande ljud | Samplingsfrekvensglapp eller en överbelastad virtuell-kabel-kedja | Släpp den virtuella kabeln; loopback-inspelning läser enhetens nativa ström rent |
Den röda tråden genom nästan alla dessa: virtuella kablar och Stereo Mix lägger till bräckliga rörliga delar. Att läsa utgångsenheten direkt via loopback eliminerar de flesta sätt som "spela in skärm med internt ljud och mikrofon" kan gå fel på.
En kort anmärkning om Mac
macOS är den motsatta historien när det gäller systemljud. De inbyggda verktygen — Cmd+Shift+5 och QuickTime Player — spelar in skärmen och din mikrofon utan problem, men de kan inte fånga internt ljud på egen hand. För att spela in det Macen spelar upp behöver du fortfarande en drivrutin som BlackHole eller Soundflower dirigerad genom en aggregerad enhet eller flerutgångsenhet. Om du sitter på en Mac går den kostnadsfria guiden för skärminspelning på Mac igenom exakt hur du ställer in det. Maxisnaps inspelare finns tillgänglig på Windows idag; en nativ macOS-version är under aktiv utveckling, och du kan be att bli aviserad på kontaktsidan.
Den snabbaste vägen till en inspelning som faktiskt har ljud
Om du bara vill ha ett klipp med både appljudet och din röst i, så här ser hela flödet ut på Windows:
- Tryck på
Ctrl+Alt+4(hela skärmen) ellerCtrl+Alt+3(område). - Prata över det du visar — både systemljudet och din mikrofon fångas, mixade som standard.
- Tryck på snabbtangenten igen för att stoppa. Trimma bort den döda luften i början och slutet.
- Exportera till MP4 — eller välj AI-optimerad MP4 (~1280px, 24fps, mono) för att få en pytteliten fil som du kan släppa rakt in i ChatGPT, Claude eller Gemini.
Ingen vattenstämpel, ingen tidsgräns, och inspelningen är gratis. Det är skillnaden mellan en tyst video du måste spela in på nytt och ett klipp som säger allt redan första gången.
Vanliga frågor och svar
Hur spelar jag in min skärm med systemljud och mikrofon samtidigt?
Använd en inspelare som fångar systemets loopback liksom mikrofonen. I Maxisnap, tryck Ctrl+Alt+4 (hela skärmen) eller Ctrl+Alt+3 (område); skrivbordsljud via WASAPI-loopback och din mikrofon fångas båda och mixas till ett spår som standard — ingen virtuell kabel eller extra drivrutin behövs.
Varför fångar min inspelning bara mikrofonen och inte datorljudet?
För att inspelaren bara öppnade mikrofoningången. Att fånga det datorn spelar upp kräver loopback-inspelning av ljudenhetens utgångsström. Maxisnap gör detta via WASAPI, så skrivbordsljudet fångas helt utan drivrutiner vid sidan av mikrofonen.
Behöver jag Stereo Mix eller en virtuell ljudkabel på Windows?
Nej. Stereo Mix är inkonsekvent och saknas på många moderna enheter, och virtuella kablar är en extra installation med dirigering att underhålla. Maxisnap läser skrivbordets loopback via WASAPI nativt, så ingetdera krävs.
Varför är det eko i min inspelning?
Samma ljud fångas två gånger — dina högtalare spelar upp det och din mikrofon plockar upp det igen. Använd hörlurar, eller spela in systemljud och mikrofon på separata spår så att du kan tysta eller justera in ett av dem i redigeringen.
Är inspelning med ljud gratis, och finns det någon vattenstämpel eller tidsgräns?
Ja — inspelning med systemljud och mikrofon är gratis på Windows, utan vattenstämpel och utan tidsgräns. Betalnivåer kommer bara in i bilden om du delar inspelningar via Maxisnap Cloud utöver det kostnadsfria utrymmet; du kan alltid spara lokalt eller hosta själv.
Vill du ha hela genomgången av inspelning utan ljudfinesser? Se hur du spelar in din skärm på Windows gratis, eller lär dig hur den kombinerade skärminspelaren och skärmdumpverktyget passar in i en enda lättviktig app.