Bỏ qua nội dung chính
2026-06-05 · Hướng dẫn sử dụng · 8 phút đọc

Cách ghi màn hình kèm âm thanh (âm thanh hệ thống + micrô)

Bạn nhấn ghi, đi qua từng bước của lỗi, thuyết minh cách khắc phục — rồi bạn xem lại và video lặng thinh ở chỗ lẽ ra ứng dụng phải phát tiếng. Cú nhấp chuột phát ra âm thanh. Video bạn đang phản ứng có nhạc. Chẳng có gì trong số đó nằm trong file. Chỉ có giọng bạn, trôi nổi trên một màn hình câm lặng.

Đây là vấn đề ghi màn hình phổ biến nhất, và nó có một nguyên nhân cụ thể: hầu hết các trình ghi miễn phí chỉ mở micrôcủa bạn. Chúng không bao giờ thu âm thanh mà máy tính của bạn thực sự đang phát. Hướng dẫn này giải thích sự khác biệt giữa âm thanh hệ thống và âm thanh micrô, vì sao thu âm thanh hệ thống thực sự khó hơn lẽ ra phải có trên Windows, và cách ghi cả hai cùng lúc — sạch sẽ, trong một file, mà không cần một driver bổ sung nào.

Âm thanh hệ thống và micrô: hai nguồn hoàn toàn khác nhau

Khi mọi người nói "ghi màn hình kèm âm thanh", họ thường ngụ ý hai thứ khác nhau cùng lúc, và một trình ghi phải xử lý từng thứ riêng biệt:

  • Micrô (đầu vào): giọng nói của bạn. Đây là phần dễ. Mọi trình ghi đều mở được đầu vào micrô. Đó là cùng luồng âm thanh mà một cuộc gọi thoại sử dụng.
  • Âm thanh hệ thống / nền (đầu ra): mọi thứ máy tính phát ra ra — ứng dụng bạn đang trình diễn, video YouTube bạn đang phản ứng, một cuộc gọi Zoom, một trò chơi, một tiếng chuông thông báo. Đây là luồng âm thanh đi đến loa hoặc tai nghe của bạn.

Micrô là một thiết bị đầu vào , và các trình ghi được xây dựng để đọc đầu vào. Âm thanh hệ thống là một đầu ra — âm thanh rời khỏi máy tính — và đọc một luồng đầu ra là một thao tác về cơ bản khác hẳn. Sự bất đối xứng đó là lý do vì sao "ghi âm thanh máy tính và màn hình" làm nhiều công cụ vấp ngã: chúng được thiết kế xoay quanh đầu vào và coi đầu ra như một thứ tính sau, hoặc bỏ qua hoàn toàn.

Vì sao thu âm thanh nội bộ lại khó trên Windows

Để ghi những gì máy tính của bạn đang phát, phần mềm phải làm một việc gọi là loopback: thay vì lắng nghe một micrô, nó tiếp cận kết xuất luồng tín hiệu — tức là tín hiệu đã được trộn sẵn đang trên đường tới loa — và sao chép nó. Trước đây, Windows khiến việc này khá phiền phức.

Trong nhiều năm, lựa chọn tích hợp duy nhất là Stereo Mix, một thiết bị ghi âm ảo mà một số card âm thanh cung cấp. Đôi khi nó hoạt động, nhưng vô số laptop hiện đại và tai nghe USB đơn giản là không hỗ trợ. Khi không có Stereo Mix, người ta thường tìm đến một cáp âm thanh ảo — phần mềm như VB-Cable tạo ra một thiết bị đầu ra giả, để bạn định tuyến âm thanh hệ thống vào đó rồi ghi lại luồng đó. Cách này hoạt động được, nhưng phải cài thêm phần mềm, phải thiết lập định tuyến cho đúng, và rất dễ hỏng: chỉ cần đổi thiết bị đầu ra là bản ghi lại im bặt.

Câu trả lời hiện đại và đúng đắn là WASAPI loopback không cần driver. WASAPI (Windows Audio Session API) cho phép một ứng dụng mở thiết bị đầu ra hiện có ở chế độ loopback và đọc chính xác âm thanh đang được phát — không cần thiết bị ảo, không cần định tuyến lại, không có gì để người dùng phải cấu hình. Đường ống kỹ thuật đã có trong Windows từ lâu; vấn đề là phần mềm ghi hình phải thực sự sử dụng nó. Nhiều phần mềm thì không.

Cách Maxisnap ghi cả hai, không cần driver

Maxisnap thu âm thanh hệ thống qua WASAPI loopback và microphone của bạn cùng lúc, và theo mặc định trộn chúng vào một track duy nhất để bạn nghe được mọi thứ — ứng dụng, video và lời thuyết minh của bạn — cùng nhau, đúng như người xem mong đợi. Không có Stereo Mix nào phải bật, không có cáp ảo nào phải cài, không có driver nào phải truy tìm. Bạn bắt đầu ghi và âm thanh đã ở đó.

Bản thân việc ghi hình rất đơn giản. Hai phím tắt, cả hai đều có thể đổi:

  • Ctrl+Alt+4 — ghi toàn màn hình (màn hình dưới con trỏ chuột của bạn).
  • Ctrl+Alt+3 — ghi một vùng được chọn khi bạn chỉ muốn một phần của màn hình.

Một biểu tượng ghi hình nhỏ hiện lên để bạn luôn biết quá trình đang chạy — và nó được cố ý loại trừ khỏi chính bản ghi của nó, nên không bao giờ xuất hiện trong video. Để dừng, nhấn lại phím tắt, bấm Dừng trên biểu tượng, hoặc dùng khay hệ thống.

Khi bạn dừng, một cửa sổ kết quả mở ra với trình phát nhúng, cùng các nút Lưu, Sao chép, Tải lên, và Kéo ra Bạn có thể cắt phần đầu và phần cuối, rồi xuất sang MP4, MP4 tối ưu cho AI, GIF, hoặc WebM với các thiết lập sẵn về chất lượng. Việc mã hóa có thể dùng tăng tốc phần cứng (NVENC, Intel QuickSync, hoặc AMD AMF) khi máy bạn hỗ trợ, nếu không thì có phương án dự phòng bằng phần mềm — và ffmpeg đi kèm sẵn trong bộ cài, nên không phải tải thêm gì khác.

Nếu bạn muốn chỉnh sửa giọng nói và âm thanh hệ thống riêng biệt, bạn có thể giữ chúng trên các track riêng thay vì trộn. Đó là cách xử lý gọn gàng nhất cho tình trạng vọng âm và cho những trường hợp bạn muốn hạ âm lượng ứng dụng xuống dưới lời thuyết minh sau này.

Một track hay hai: cách chọn

Mặc định — âm thanh hệ thống và microphone trộn vào một track — là phù hợp với phần lớn mọi người. Nó phát đúng ở mọi nơi mà không cần chỉnh sửa, và đó là điều bạn cần cho một bản demo nhanh, một hướng dẫn, hay một báo cáo lỗi.

Chọn các track riêng khi bạn định đưa bản ghi vào trình chỉnh sửa và muốn kiểm soát độc lập: giảm âm lượng ứng dụng trong lúc bạn nói, gỡ bỏ một âm thông báo, hoặc khắc phục lỗi lệch tiếng. Các track riêng khiến bạn tốn thêm một bước (bạn trộn chúng lại sau) để đổi lấy toàn quyền kiểm soát.

Các kiểu lỗi thường gặp — và cách khắc phục

Triệu chứng Nguyên nhân có thể Sửa lỗi
Chỉ ghi được giọng của tôiPhần mềm ghi thu được mic nhưng không thu được loopback hệ thốngDùng phần mềm ghi có WASAPI loopback (Maxisnap thu mặc định — không cần thiết lập)
Hoàn toàn không có âm thanhMic bị tắt tiếng/sai thiết bị, hoặc thiết bị đầu ra thay đổi giữa lúc ghiXác nhận đúng mic, và ghi trực tiếp thiết bị đầu ra đang dùng qua loopback thay vì dùng cáp ảo
Có âm thanh hệ thống nhưng không có giọng nóiChọn sai microphone, hoặc quyền truy cập mic bị từ chốiChọn đúng thiết bị đầu vào và cấp quyền microphone trong cài đặt quyền riêng tư của Windows
Vọng âm / âm thanh bị nhân đôiLoa phát âm thanh và mic ghi lại chính âm thanh đóĐeo tai nghe, hoặc ghi âm thanh hệ thống và mic trên các track riêng
Âm thanh bị lệch khỏi hìnhTốc độ khung hình hoặc thời gian A/V không khớp trong lúc ghiGhi ở tốc độ khung hình ổn định; cắt và xuất lại từ cửa sổ kết quả nếu cần
Âm thanh rè rè / lạo xạo như robotSai tần số lấy mẫu hoặc chuỗi cáp ảo bị quá tảiBỏ cáp ảo đi; ghi loopback đọc luồng gốc của thiết bị một cách sạch sẽ

Điểm chung xuyên suốt gần như tất cả các lỗi này: cáp ảo và Stereo Mix thêm vào những bộ phận hoạt động dễ hỏng. Đọc trực tiếp thiết bị đầu ra qua loopback loại bỏ phần lớn những cách mà việc "ghi màn hình kèm âm thanh nội bộ và mic" có thể trục trặc.

Một lưu ý nhanh về Mac

macOS lại là câu chuyện ngược lại đối với âm thanh hệ thống. Các công cụ tích hợp — Cmd+Shift+5 và QuickTime Player — ghi màn hình và microphone của bạn rất tốt, nhưng chúng không thể tự thu âm thanh nội bộ. Để ghi lại những gì máy Mac đang phát, bạn vẫn cần một driver như BlackHole hoặc Soundflower được định tuyến qua một thiết bị tổng hợp hoặc thiết bị đa đầu ra. Nếu bạn dùng Mac, bài hướng dẫn ghi màn hình Mac miễn phí sẽ chỉ cho bạn từng bước cách thiết lập việc đó. Trình ghi hình của Maxisnap hiện đã có trên Windows; bản macOS gốc đang được phát triển tích cực, và bạn có thể đăng ký để được thông báo tại trang liên hệ.

Con đường nhanh nhất để có một bản ghi thực sự có tiếng

Nếu bạn chỉ muốn một đoạn clip có cả âm thanh ứng dụng lẫn giọng của bạn trong đó, đây là toàn bộ quy trình trên Windows:

  • Nhấn Ctrl+Alt+4 (toàn màn hình) hoặc Ctrl+Alt+3 (vùng).
  • Thuyết minh về những gì bạn đang demo — cả âm thanh hệ thống và mic của bạn đều được thu, trộn theo mặc định.
  • Nhấn lại phím tắt để dừng. Cắt bỏ khoảng lặng ở đầu và cuối.
  • Xuất sang MP4 — hoặc chọn MP4 tối ưu cho AI (~1280px, 24fps, mono) để có một tệp nhỏ gọn mà bạn có thể thả thẳng vào ChatGPT, Claude, hoặc Gemini.

Không có hình mờ, không giới hạn thời gian, và việc ghi là miễn phí. Đó là sự khác biệt giữa một video câm phải quay lại từ đầu và một đoạn clip nói lên trọn vẹn mọi thứ ngay từ lần đầu.

Các câu hỏi thường gặp

Làm thế nào để tôi ghi màn hình kèm âm thanh hệ thống và microphone cùng lúc?
Dùng phần mềm ghi vừa thu loopback hệ thống vừa thu mic. Trong Maxisnap, nhấn Ctrl+Alt+4 (toàn màn hình) hoặc Ctrl+Alt+3 (vùng); âm thanh máy tính qua WASAPI loopback và microphone của bạn đều được thu và trộn vào một track theo mặc định — không cần cáp ảo hay driver bổ sung.

Tại sao bản ghi của tôi chỉ thu được microphone mà không có âm thanh máy tính?
Vì phần mềm ghi chỉ mở đầu vào mic. Việc thu lại những gì máy tính phát cần ghi loopback luồng đầu ra của thiết bị âm thanh. Maxisnap làm điều này qua WASAPI, nên âm thanh máy tính được thu mà không cần driver, song song cùng mic.

Tôi có cần Stereo Mix hay cáp âm thanh ảo trên Windows không?
Không. Stereo Mix thiếu ổn định và không có trên nhiều thiết bị hiện đại, còn cáp ảo là phần mềm phải cài thêm với định tuyến phải duy trì. Maxisnap đọc loopback của máy tính qua WASAPI một cách nguyên bản, nên không cần cái nào cả.

Tại sao bản ghi của tôi bị vọng âm?
Cùng một âm thanh bị thu hai lần — loa phát ra và mic thu lại nó lần nữa. Đeo tai nghe, hoặc ghi âm thanh hệ thống và mic trên các track riêng để bạn có thể tắt tiếng hoặc căn chỉnh một track khi chỉnh sửa.

Ghi kèm âm thanh có miễn phí không, và có hình mờ hay giới hạn thời gian không?
Có — ghi kèm âm thanh hệ thống và mic là miễn phí trên Windows, không có hình mờ và không giới hạn thời gian. Các gói trả phí chỉ có vai trò nếu bạn chia sẻ bản ghi qua Maxisnap Cloud vượt quá hạn mức miễn phí; bạn luôn có thể lưu cục bộ hoặc tự lưu trữ.

Muốn xem hướng dẫn đầy đủ về ghi hình mà không bận tâm chuyện âm thanh? Xem cách ghi màn hình trên Windows miễn phí, hoặc tìm hiểu cách công cụ kết hợp ghi màn hình và chụp ảnh màn hình gói gọn trong một ứng dụng nhẹ.

Ghi màn hình kèm âm thanh — lần này là thật sự

Âm thanh hệ thống và microphone, thu cùng nhau, không phải cài driver. Miễn phí trên Windows.

Tải Maxisnap Miễn phí Phần mềm ghi màn hình miễn phí cho Windows

Liên quan: trình ghi màn hình miễn phí · ghi trên Windows · ghi trên Mac · công cụ ghi hình + chụp màn hình