Saltar al contenido principal
2026-06-05 · Tutoriales · 8 min de lectura

Cómo grabar tu pantalla con audio (sonido del sistema + micrófono)

Pulsas grabar, recorres el error, narras la solución, y luego lo reproduces y el vídeo está en silencio justo donde la app debería estar hablando. El clic del botón hizo un sonido. El vídeo al que reaccionabas tenía música. Nada de eso está en el archivo. Solo tu voz, flotando sobre una pantalla muda.

Este es el problema de grabación de pantalla más común de todos, y tiene una causa específica: la mayoría de los grabadores gratuitos solo abren tu micrófono. Nunca capturan el sonido que tu ordenador está reproduciendo de verdad. Esta guía explica la diferencia entre el audio del sistema y el audio del micrófono, por qué capturar el sonido del sistema es genuinamente más difícil de lo que debería en Windows, y cómo grabar ambos a la vez, con limpieza, en un solo archivo, sin un solo controlador extra.

Audio del sistema vs. micrófono: dos fuentes completamente diferentes

Cuando la gente dice «grabar la pantalla con audio», normalmente se refiere a dos cosas distintas a la vez, y un grabador tiene que gestionar cada una por separado:

  • Micrófono (entrada): tu voz. Esta es la fácil. Todo grabador puede abrir una entrada de micro. Es el mismo flujo que usa una llamada de voz.
  • Audio del sistema / escritorio (salida): todo lo que el ordenador reproduce de —la app que estás mostrando, el vídeo de YouTube al que reaccionas, una llamada de Zoom, un juego, un tono de notificación—. Este es el flujo que va a tus altavoces o auriculares.

Un micrófono es un dispositivo de entrada , y los grabadores están hechos para leer entradas. El audio del sistema es una salida —sonido que sale del ordenador—, y leer un flujo de salida es una operación fundamentalmente distinta. Esa asimetría es por la que «grabar el sonido del ordenador y la pantalla» hace tropezar a tantas herramientas: se diseñaron en torno a la entrada y tratan la salida como algo secundario, o la omiten por completo.

Por qué capturar el audio interno es difícil en Windows

Para grabar lo que tu ordenador está reproduciendo, el software tiene que hacer algo llamado loopback: en lugar de escuchar un micrófono, accede al renderizar stream — la señal mezclada de camino a los altavoces — y la copia. Históricamente, Windows lo ponía complicado.

Durante años, la única opción integrada era Stereo Mix, un dispositivo de grabación virtual que algunas tarjetas de sonido ofrecían. Funcionaba, a veces, pero muchos portátiles modernos y auriculares USB simplemente no lo incluyen. Cuando Stereo Mix no está, la gente recurre a un cable de audio virtual — software como VB-Cable que crea un dispositivo de salida falso, así que rediriges el sonido del sistema hacia él y luego grabas eso. Funciona, pero es una instalación extra, añade un enrutamiento que tienes que configurar correctamente y se rompe con facilidad: cambia tu dispositivo de salida y la grabación vuelve a quedarse muda.

La respuesta moderna y correcta es loopback WASAPI sin controladores. WASAPI (Windows Audio Session API) permite que una aplicación abra el dispositivo de salida existente en modo loopback y lea exactamente el audio que ya se está reproduciendo — sin dispositivo virtual, sin redireccionamientos, sin nada que el usuario tenga que configurar. La fontanería lleva mucho tiempo en Windows; el truco es que el grabador realmente la use. Muchos no lo hacen.

Cómo Maxisnap graba ambos, sin controladores

Maxisnap captura el audio del sistema mediante loopback WASAPI y tu micrófono al mismo tiempo, y de forma predeterminada los mezcla en una sola pista para que oigas todo — la aplicación, el vídeo y tu narración — junto, tal como un espectador lo espera. No hay ningún Stereo Mix que activar, ningún cable virtual que instalar, ningún controlador que buscar. Empiezas a grabar y el sonido simplemente está ahí.

La grabación en sí es sencilla. Dos atajos de teclado, ambos reasignables:

  • Ctrl+Alt+4 — graba la pantalla completa (el monitor bajo el cursor).
  • Ctrl+Alt+3 — graba una región seleccionada cuando solo quieres una parte de la pantalla.

Aparece una pequeña insignia de grabación para que siempre sepas que está en marcha — y está deliberadamente excluida de su propia captura, así que nunca aparece en el vídeo. Para detener, pulsa el atajo de nuevo, haz clic en Detener en la insignia, o usa la bandeja del sistema.

Al detener, se abre una ventana de resultado con un reproductor integrado, además de botones de Guardar, Copiar, Subida, y Arrastrar . Puedes recortar el inicio y el final, y exportar a MP4, MP4 optimizado para IA, GIF, o WebM con ajustes de calidad. La codificación puede usar aceleración por hardware (NVENC, Intel QuickSync o AMD AMF) cuando tu equipo lo admite, con una alternativa por software en caso contrario — y ffmpeg viene incluido dentro del instalador, así que no hay nada más que descargar.

Si prefieres editar la voz y el sonido del sistema por separado, puedes mantenerlos en pistas separadas en lugar de mezclarlos. Esa es la solución más limpia para el eco y para casos en los que más adelante quieras atenuar el audio de la aplicación bajo tu narración.

Una pista o dos: cómo elegir

La opción predeterminada — audio del sistema y micrófono mezclados en una sola pista — es la adecuada para la mayoría de la gente. Se reproduce correctamente en todas partes sin necesidad de edición, y es lo que quieres para una demostración rápida, un tutorial o un informe de errores.

Elige pistas separadas cuando planeas llevar la grabación a un editor y quieres control independiente: bajar el volumen de la aplicación mientras hablas, eliminar un sonido de notificación o corregir un problema de sincronización. Las pistas separadas te cuestan un paso extra (las mezclas más tarde) a cambio de control total.

Fallos comunes — y cómo solucionarlos

Síntoma Causa probable Solución
Solo se grabó mi vozEl grabador captó el micrófono pero no el loopback del sistemaUsa un grabador con loopback WASAPI (Maxisnap lo captura de forma predeterminada — sin configuración)
Nada de sonidoMicrófono silenciado o dispositivo incorrecto, o el dispositivo de salida cambió a mitad de la grabaciónConfirma el micrófono correcto y graba el dispositivo de salida en vivo directamente por loopback en lugar de un cable virtual
Sonido del sistema pero sin vozMicrófono incorrecto seleccionado, o permiso de micrófono denegadoElige el dispositivo de entrada correcto y concede acceso al micrófono en la configuración de privacidad de Windows
Eco / audio duplicadoLos altavoces reproducen el sonido y el micrófono lo vuelve a grabarUsa auriculares, o graba el audio del sistema y el micrófono en pistas separadas
El audio se desincronizaFrecuencia de fotogramas o desfase de sincronización A/V durante la capturaCaptura a una frecuencia de fotogramas estable; recorta y vuelve a exportar desde la ventana de resultado si es necesario
Sonido robótico / con chasquidosDesajuste de frecuencia de muestreo o una cadena de cable virtual sobrecargadaPrescinde del cable virtual; la captura por loopback lee el stream nativo del dispositivo de forma limpia

El hilo común a casi todos estos casos: los cables virtuales y Stereo Mix añaden piezas móviles frágiles. Leer el dispositivo de salida directamente mediante loopback elimina la mayoría de las formas en que «grabar pantalla con audio interno y micrófono» puede salir mal.

Una nota rápida sobre Mac

macOS es la historia opuesta en cuanto al sonido del sistema. Las herramientas integradas — Cmd+Shift+5 y QuickTime Player — graban la pantalla y tu micrófono sin problemas, pero no pueden capturar el audio interno por sí solas. Para grabar lo que el Mac está reproduciendo, sigues necesitando un controlador como BlackHole o Soundflower enrutado a través de un dispositivo agregado o de salida múltiple. Si estás en un Mac, la guía gratuita de grabación de pantalla en Mac explica paso a paso exactamente cómo configurarlo. El grabador de Maxisnap está disponible en Windows hoy; una versión nativa para macOS está en desarrollo activo, y puedes pedir que te avisen en la página de contacto.

La vía más rápida para una grabación que de verdad tenga sonido

Si solo quieres un clip con el audio de la aplicación y tu voz dentro, este es todo el proceso en Windows:

  • Presione Ctrl+Alt+4 (pantalla completa) o Ctrl+Alt+3 (región).
  • Habla sobre lo que estás demostrando — el sonido del sistema y tu micrófono se capturan ambos, mezclados de forma predeterminada.
  • Pulsa el atajo de nuevo para detener. Recorta los silencios del inicio y el final.
  • Exporta a MP4 — o elige MP4 optimizado para IA (~1280px, 24fps, mono) para obtener un archivo diminuto que puedes soltar directamente en ChatGPT, Claude o Gemini.

Sin marca de agua, sin límite de tiempo, y la grabación es gratuita. Esa es la diferencia entre un vídeo mudo que tienes que volver a grabar y un clip que lo dice todo a la primera.

Preguntas frecuentes

¿Cómo grabo mi pantalla con el audio del sistema y el micrófono al mismo tiempo?
Usa un grabador que capture el loopback del sistema además del micrófono. En Maxisnap, pulsa Ctrl+Alt+4 (pantalla completa) o Ctrl+Alt+3 (región); el audio de escritorio mediante loopback WASAPI y tu micrófono se capturan ambos y se mezclan en una sola pista de forma predeterminada — sin necesidad de cable virtual ni controlador extra.

¿Por qué mi grabación solo capta el micrófono y no el sonido del ordenador?
Porque el grabador solo abrió la entrada del micrófono. Capturar lo que el ordenador reproduce requiere grabación por loopback del stream de salida del dispositivo de audio. Maxisnap lo hace mediante WASAPI, así que el sonido de escritorio se captura sin controladores junto con el micrófono.

¿Necesito Stereo Mix o un cable de audio virtual en Windows?
No. Stereo Mix es inconsistente y falta en muchos dispositivos modernos, y los cables virtuales son una instalación extra con enrutamiento que mantener. Maxisnap lee el loopback de escritorio mediante WASAPI de forma nativa, así que no se necesita ninguno de los dos.

¿Por qué hay eco en mi grabación?
El mismo sonido se está capturando dos veces — tus altavoces lo reproducen y tu micrófono lo vuelve a captar. Usa auriculares, o graba el audio del sistema y el micrófono en pistas separadas para poder silenciar o alinear una de ellas en la edición.

¿Grabar con audio es gratis, y hay marca de agua o límite de tiempo?
Sí — grabar con el audio del sistema y el micrófono es gratis en Windows, sin marca de agua y sin límite de tiempo. Los planes de pago solo entran en juego si compartes grabaciones a través de Maxisnap Cloud más allá de la franquicia gratuita; siempre puedes guardar localmente o autoalojar.

¿Quieres el recorrido completo de la grabación sin los matices del audio? Consulta cómo grabar tu pantalla en Windows gratis, o descubre cómo la herramienta combinada de grabación de pantalla y capturas encaja en una sola aplicación ligera.

Graba tu pantalla con sonido — esta vez de verdad

Audio del sistema y micrófono, capturados juntos, sin controlador que instalar. Gratis en Windows.

Descargar Maxisnap Gratis Grabador de pantalla gratuito para Windows

Cambio en 2 minutos grabador de pantalla gratuito · grabar en Windows · grabar en Mac · grabador + herramienta de captura de pantalla