跳到主要内容
2026-06-05 · 教程 · 8 分钟阅读

如何带声音录制屏幕(系统声音 + 麦克风)

你点击录制,演示一遍这个 bug,一边讲解修复过程——然后回放时却发现,本该有应用声音的地方一片寂静。点击按钮发出了声音。你正在反应的视频里有音乐。这些统统不在文件里。只有你的语音,飘在一片静音的画面之上。

这是最常见的录屏问题,它有一个具体的原因:大多数免费录制工具只打开了你的 麦克风。它们从不捕获你电脑实际正在播放的声音。本指南将解释系统声音和麦克风声音的区别、为什么在 Windows 上捕获系统声音实际上比它应有的难度更高,以及如何把两者同时录下来——干净利落地录进一个文件,无需任何额外驱动。

系统声音 vs. 麦克风:两个完全不同的声源

当人们说“带声音录屏”时,他们通常同时指两件不同的事,而录制工具必须分别处理每一件:

  • 麦克风(输入): 你的语音。这是简单的那个。每款录制工具都能打开麦克风输入。它和语音通话用的是同一条音频流。
  • 系统 / 桌面声音(输出): 电脑播放的一切声音 输出的 ——你正在演示的应用、你正在反应的 YouTube 视频、一通 Zoom 通话、一款游戏、一声通知提示。这是流向你扬声器或耳机的那条音频流。

麦克风是一个 输入 设备,而录制工具天生就是为读取输入而设计的。系统声音是一个 输出 ——离开电脑的声音——而读取一条输出流是一种根本不同的操作。正是这种不对称,使得“录制电脑声音和屏幕”绊倒了如此多的工具:它们是围绕输入设计的,把输出当作事后才考虑的事项,甚至干脆跳过它。

为什么在 Windows 上捕获内部音频很难

要录制你电脑正在播放的内容,软件必须做一件叫做 环回的事:它不去监听麦克风,而是去拦截音频设备的 渲染 流——即混音后送往扬声器的信号——并将其复制下来。一直以来,Windows 在这件事上都很别扭。

多年来,唯一内置的选项就是 立体声混音(Stereo Mix),这是某些声卡提供的一个虚拟录音设备。它有时能用,但很多现代笔记本和 USB 耳机干脆就不提供它。当没有立体声混音时,人们就会转向 虚拟音频线 ——像 VB-Cable 这样的软件会创建一个虚拟输出设备,于是你把系统声音路由进去,再录制 那一路信号。这能用,但它需要额外安装,要求你正确设置路由,而且很容易出问题:一旦更换输出设备,录音又会变成静音。

现代且正确的答案是 WASAPI 环回。WASAPI(Windows 音频会话 API)让应用程序以环回(loopback)模式打开现有的输出设备,直接读取当前正在播放的确切音频——无需虚拟设备,无需重新路由,用户什么都不用配置。这套机制早已存在于 Windows 中;问题在于录制工具是否真的去用它。很多工具并没有。

Maxisnap 如何免驱动地同时录制两路声音

Maxisnap 通过 WASAPI 环回捕捉系统声音,同时录制你的麦克风,并默认 将它们混合为单一音轨 ,让你能把一切——应用、视频和你的旁白——一起听到,正如观众所期望的那样。无需启用立体声混音,无需安装虚拟音频线,无需四处找驱动。你按下录制,声音就在那里。

录制本身很简单。两个热键,都可重新映射:

  • Ctrl+Alt+4 ——录制 全屏 (光标所在的那块显示器)。
  • Ctrl+Alt+3 ——录制一个 选定区域 ,当你只想录屏幕的一部分时。

一个小小的录制标记会出现,让你随时知道正在录制——而且它被刻意排除在自身的录制画面之外,所以永远不会出现在视频里。要停止录制,再次按下热键、点击标记上的 停止 ,或使用系统托盘。

停止后,会弹出一个结果窗口,内含内嵌播放器,外加 保存, 复制, 上传拖出 等按钮。你可以裁剪开头和结尾,并导出为 MP4, AI 优化版 MP4, GIF,或 WebM ,附带画质预设。当你的设备支持时,编码可以使用硬件加速(NVENC、Intel QuickSync 或 AMD AMF),否则会有软件后备方案——而且 ffmpeg 随安装包一同附带,所以无需另外下载任何东西。

如果你更愿意把人声和系统声音分开编辑,也可以把它们保留在 独立音轨 上而不混合。这是消除回声最干净的方法,也适用于你之后想把应用音量压低在旁白之下的情况。

一条音轨还是两条:如何选择

默认方式——系统声音和麦克风混合成一条音轨——适合大多数人。它在任何地方都能正确播放,零编辑,正是录制快速演示、教程或缺陷报告时所需要的。

选择 独立音轨 ,当你打算把录制内容导入编辑器,并希望独立控制时:在说话时降低应用音量、去掉某个通知提示音,或修正同步问题。独立音轨会让你多花一步(之后自行混音),以换取完全的掌控。

常见故障表现——以及如何解决

症状 可能原因 修复
只录到了我的声音录制工具捕捉了麦克风,但没有捕捉系统环回使用支持 WASAPI 环回的录制工具(Maxisnap 默认就会捕捉它——无需设置)
完全没有声音麦克风被静音/选错设备,或录制中途更换了输出设备确认麦克风正确,并通过环回直接录制实时输出设备,而不是用虚拟音频线
有系统声音但没有人声选错了麦克风,或麦克风权限被拒选择正确的输入设备,并在 Windows 隐私设置中授予麦克风访问权限
回声/声音重叠扬声器播放声音,麦克风又把它重新录了一遍戴上耳机,或将系统声音和麦克风录制在独立音轨上
音频逐渐失去同步捕捉过程中帧率或音视频时序不匹配以稳定的帧率进行捕捉;必要时在结果窗口中裁剪并重新导出
声音发尖/有杂音采样率不匹配,或虚拟音频线链路过载弃用虚拟音频线;环回捕捉会干净地读取设备的原生音频流

贯穿这几乎所有问题的一条主线是:虚拟音频线和立体声混音增加了脆弱的中间环节。通过环回直接读取输出设备,能消除大多数会让“录屏并带内部音频和麦克风”出错的隐患。

关于 Mac 的一点说明

在系统声音方面,macOS 的情况恰恰相反。内置工具—— Cmd+Shift+5 和 QuickTime Player——录制屏幕和你的麦克风都没问题,但它们 无法自行捕捉内部音频。要录制 Mac 正在播放的声音,你仍然需要像 BlackHole 或 Soundflower 这样的驱动,通过聚合设备或多输出设备进行路由。如果你用的是 Mac,那份 免费的 Mac 录屏指南 会带你一步步完成具体设置。Maxisnap 的录制功能目前已在 Windows 上可用;原生 macOS 版本正在积极开发中,你可以在以下渠道申请上线通知: 联系页面.

录出真正有声音的视频的最快路径

如果你只是想要一段同时包含应用音频和你声音的片段,下面就是 Windows 上的完整流程:

  • 按下 Ctrl+Alt+4 (全屏)或 Ctrl+Alt+3 (区域)。
  • 一边演示一边解说——系统声音和你的麦克风都会被捕捉,并默认混合。
  • 再次按下热键停止。裁掉开头和结尾的空白片段。
  • 导出为 MP4——或选择 AI 优化版 MP4 (约 1280px、24fps、单声道)以获得一个超小文件,可直接拖入 ChatGPT、Claude 或 Gemini。

无水印、无时长限制,而且录制是免费的。这正是“拍出来没声音、只能重拍的视频”与“一次就把一切讲清楚的片段”之间的差别。

常见问题

如何同时录制带系统声音和麦克风的屏幕?
使用一款既能捕捉系统环回又能捕捉麦克风的录制工具。在 Maxisnap 中,按下 Ctrl+Alt+4 (全屏)或 Ctrl+Alt+3 (区域);通过 WASAPI 环回捕捉的桌面音频和你的麦克风都会被录制,并默认混合为一条音轨——无需虚拟音频线或额外驱动。

为什么我的录制只录到麦克风,却没有电脑的声音?
因为录制工具只打开了麦克风输入。要捕捉电脑播放的声音,需要对音频设备的输出流进行环回录制。Maxisnap 通过 WASAPI 实现这一点,因此桌面声音能与麦克风一起被免驱动地捕捉。

在 Windows 上我需要立体声混音或虚拟音频线吗?
不需要。立体声混音表现不稳定,且在许多现代设备上缺失,而虚拟音频线则需要额外安装并维护路由。Maxisnap 通过 WASAPI 原生读取桌面环回,因此两者都不需要。

为什么我的录制里有回声?
同一段声音被捕捉了两次——你的扬声器播放它,你的麦克风又把它录了进去。戴上耳机,或将系统声音和麦克风录制在独立音轨上,这样你就能在编辑时把其中一路静音或对齐。

带音频录制是免费的吗?会有水印或时长限制吗?
是的——在 Windows 上录制系统声音和麦克风是免费的,没有水印,也没有时长限制。只有当你通过 Maxisnap Cloud 分享录制内容、超出免费额度时,付费档位才会发挥作用;你随时都可以本地保存或自行托管。

想了解不涉及音频细节的完整教程?请参阅 如何在 Windows 上免费录屏,或了解这款 集录屏与截图于一体的工具 如何浓缩在一款轻量级应用中。

录下带声音的屏幕——这次是真的

系统声音和麦克风一起录下,无需安装驱动。在 Windows 上免费。

免费下载 Maxisnap Windows 免费录屏工具

相关: 免费录屏工具 · 在 Windows 上录制 · 在 Mac 上录制 · 录屏 + 截图工具