录制带系统声音和麦克风的屏幕

你按下录制，把缺陷从头走一遍，边讲边说明修复方法 —— 然后回放一看，本该有应用发声的地方，视频却是一片寂静。点击按钮时明明响过一声。你正在回应的视频里明明有音乐。这些全都不在文件里。只剩你的声音，飘在一块静音的屏幕上方。

这是最常见的录屏问题，而它有一个明确的成因：大多数免费录制器只打开你的 麦克风。它们从不捕获你电脑实际正在播放的声音。本指南会讲清楚系统声音和麦克风声音的区别、为什么在 Windows 上捕获系统声音确实比理应的更难，以及如何把两者一次性录下 —— 干净利落、装在一个文件里，且无需任何一个额外驱动。

系统声音 vs. 麦克风：两个截然不同的声源

当人们说"带声音录屏"时，他们通常一口气指的是两件不同的事，而录制器必须分别处理各自：

麦克风（输入）： 你的声音。这一个是简单的。每一款录制器都能打开麦克风输入。它和语音通话所用的是同一路信号。
系统/桌面声音（输出）： 电脑向外播放的一切 —— 你正在演示的应用、你正在回应的 YouTube 视频、一通 Zoom 通话、一款游戏、一声通知提示音。这是通往你扬声器或耳机的那一路信号。

麦克风是一个输入设备，而录制器天生就是用来读取输入的。系统声音是一个输出 —— 离开电脑的声音 —— 读取一路输出信号是一种根本不同的操作。正是这种不对称，让"录电脑声音加屏幕"难倒了许多工具：它们是围绕输入设计的，把输出当作事后的补充，或者干脆跳过。

为什么在 Windows 上捕获内部声音很难

要录下你电脑正在播放的内容，软件必须做一件叫做回环的事：它不去听麦克风，而是从音频设备的渲染流上取一份 —— 也就是正送往扬声器的那路已混合信号 —— 并复制它。历史上，Windows 把这件事弄得很别扭。

多年来，唯一的内置选择是 立体声混音（Stereo Mix），一种部分声卡会提供的虚拟录音设备。它有时能用，但许多现代笔记本和 USB 耳机压根就不提供它。当没有立体声混音时，人们便转而求助 虚拟音频线 —— 像 VB-Cable 这样的软件会创建一个假的输出设备，你把系统声音导入它，然后录制那个。它能用，但它是一次额外安装，添加了你必须正确配置的路由，而且很容易出问题：一换输出设备，录制又归于寂静。

现代而正确的答案是 WASAPI 环回。WASAPI（Windows 音频会话 API）允许一个应用以回环模式打开现有的输出设备，读取正在播放的那份原样音频 —— 无需虚拟设备、无需重新布线、用户什么都不用配置。这套管路早就存在于 Windows 中；症结在于录制器得真的去用它。而很多都没有。

Maxisnap 如何免驱动地同时录下两者

Maxisnap 通过 WASAPI 回环捕获系统声音，并同时录下你的麦克风，默认 把它们混合到一条音轨 ，让你听到全部 —— 应用、视频，以及你的旁白 —— 一并呈现，正如观众所期待的那样。无需启用立体声混音、无需安装虚拟音频线、无需四处寻找驱动。你一开始录制，声音就在那里了。

录制本身很简单。两个快捷键，都可重新映射：

Ctrl+Alt+4 —— 录制 整个屏幕 （光标所在的那台显示器）。
Ctrl+Alt+3 —— 只想要屏幕一部分时，录制 所选区域 。

屏幕上会出现一个小小的录制标记，让你随时知道它正在录 —— 而且它被有意排除在自身的捕获之外，因此绝不会出现在视频里。要停止，再次按下快捷键、点击标记上的停止，或使用系统托盘。

当你停止时，会打开一个带内嵌播放器的结果窗口，还有保存，复制，上传、以及拖出按钮。你可以修剪首尾，并按质量预设导出为 MP4， 面向 AI 优化的 MP4， GIF，或 WebM 。当你的机器支持时，编码可使用硬件加速（NVENC、Intel QuickSync 或 AMD AMF），否则回退到软件编码 —— 而且 ffmpeg 已随安装程序内置，因此无需再下载任何东西。

如果你更愿意把人声和系统声音分开来编辑，可以把它们保留在 独立音轨 上而不混合。对于回声，以及那些你想在之后让应用声音在旁白之下自动压低的情形，这是最干净的解决办法。

一条音轨还是两条：如何选择

默认设置 —— 系统声音和麦克风混合到一条音轨 —— 适合大多数人。它无需任何编辑就能在任何地方正确播放，也正是你做快速演示、教程或缺陷报告时想要的。

选择 独立音轨 ：在你讲话时压低应用的音量、去掉一声通知音，或修正一个同步问题。独立音轨让你多付出一个步骤（你稍后再把它们合并混音），换来的是完全的掌控。

常见的失败情形 —— 以及如何修复

症状	可能的原因	修复方法
只录到了我的声音	录制器捕获了麦克风，但没捕获系统回环	使用带 WASAPI 回环的录制器（Maxisnap 默认就会捕获它 —— 无需任何配置）
完全没有声音	麦克风被静音/选错了设备，或录制中途换了输出设备	确认选对了麦克风，并通过回环直接录制当前正在使用的输出设备，而不是虚拟音频线
有系统声音但没有人声	选错了麦克风，或麦克风权限被拒	选对输入设备，并在 Windows 隐私设置中授予麦克风访问权限
回声/声音重叠	扬声器播放声音，麦克风又把它重新录了进去	戴上耳机，或把系统声音和麦克风录在各自独立的音轨上
音画逐渐不同步	捕获过程中帧率或音画时序不匹配	以稳定的帧率捕获；必要时在结果窗口中修剪并重新导出
机械音/爆音	采样率不匹配，或虚拟音频线链路过载	弃用虚拟音频线；回环捕获会干净地读取设备的原生信号流

贯穿几乎所有这些情形的一条主线：虚拟音频线和立体声混音增添了脆弱的活动部件。通过回环直接读取输出设备，能消除"带内部声音和麦克风录屏"出错的大多数途径。

关于 Mac 的简短说明

在系统声音这件事上，macOS 的情况恰好相反。内置工具 —— Cmd+Shift+5 和 QuickTime Player —— 录制屏幕和你的麦克风都没问题，但它们 单靠自身无法捕获内部声音。要录下 Mac 正在播放的内容，你仍需要一个像 BlackHole 或 Soundflower 这样的驱动，通过聚合设备或多输出设备来路由。如果你用的是 Mac，免费 Mac 录屏指南会带你走一遍具体的设置步骤。Maxisnap 的录制功能目前在 Windows 上可用；原生 macOS 版本正在积极开发中，你可以在联系页面。

录出真正有声音的视频，最快的路径

如果你只想要一段既有应用声音、又有你自己声音的短片，下面就是 Windows 上的完整流程：

按 Ctrl+Alt+4 （全屏）或 Ctrl+Alt+3 （区域）。
边讲边演示你要演示的内容 —— 系统声音和你的麦克风都会被捕获，并默认混合。
再次按下快捷键停止。把开头和结尾的冷场修剪掉。
导出为 MP4 —— 或选择 面向 AI 优化的 MP4 （约 1280px、24fps、单声道），得到一个可直接丢进 ChatGPT、Claude 或 Gemini 的小巧文件。

无水印、无时长限制，而且录制免费。这就是一段你不得不重录的无声视频，与一段第一次就把话说全的短片之间的区别。

常见问题

我该如何同时录制系统声音和麦克风？
使用一款既能捕获系统回环、又能捕获麦克风的录制器。在 Maxisnap 中，按 Ctrl+Alt+4 （全屏）或 Ctrl+Alt+3 （区域）；通过 WASAPI 回环获取的桌面声音和你的麦克风都会被捕获，并默认混合到一条音轨 —— 无需虚拟音频线或额外驱动。

为什么我的录制只录到了麦克风，没录到电脑声音？
因为录制器只打开了麦克风输入。要捕获电脑正在播放的内容，需要对音频设备的输出流进行回环录制。Maxisnap 通过 WASAPI 做到这一点，因此桌面声音能免驱动地与麦克风一并被捕获。

在 Windows 上我需要立体声混音或虚拟音频线吗？
不需要。立体声混音表现不稳定，且在许多现代设备上缺失，而虚拟音频线是一次额外安装、还要维护路由。Maxisnap 原生地通过 WASAPI 读取桌面回环，因此两者都不需要。

为什么我的录制里有回声？
同一段声音被捕获了两次 —— 你的扬声器播放它，你的麦克风又把它收了进去。戴上耳机，或把系统声音和麦克风录在各自独立的音轨上，这样你就能在编辑时把其中一个静音或对齐。

带声音录制免费吗？有没有水印或时长限制？
是的 —— 在 Windows 上带系统声音和麦克风录制是免费的，无水印、无时长限制。只有当你通过 Maxisnap 云端分享录制、超出免费额度时，付费套餐才会派上用场；你随时都可以保存到本地或自行托管。

想要不涉及音频细节的完整录制流程？请看如何在 Windows 上免费录屏，或了解这款录屏与截图二合一工具如何融入一个轻量应用。