Graba la pantalla con audio del sistema y del micrófono

Pulsas grabar, muestras el error paso a paso, narras la solución... y luego lo vuelves a ver y el video está en silencio justo donde la aplicación debería estar sonando. El clic en el botón hizo un sonido. El video al que estabas reaccionando tenía música. Nada de eso está en el archivo. Solo tu voz, flotando sobre una pantalla muda.

Este es el problema de grabación de pantalla más común de todos, y tiene una causa concreta: la mayoría de los grabadores gratuitos solo abren tu micrófono. Nunca capturan el sonido que tu computadora realmente está reproduciendo. Esta guía explica la diferencia entre el audio del sistema y el audio del micrófono, por qué capturar el sonido del sistema es realmente más difícil de lo que debería en Windows, y cómo grabar ambos a la vez, con limpieza, en un solo archivo, sin un solo controlador adicional.

Audio del sistema frente a micrófono: dos fuentes completamente distintas

Cuando la gente dice «grabar la pantalla con audio», normalmente se refiere a dos cosas distintas a la vez, y un grabador tiene que manejar cada una por separado:

Micrófono (entrada): tu voz. Esta es la fácil. Todos los grabadores pueden abrir una entrada de micrófono. Es el mismo flujo que usa una llamada de voz.
Audio del sistema o del escritorio (salida): todo lo que la computadora reproduce hacia fuera : la aplicación que estás mostrando, el video de YouTube al que estás reaccionando, una llamada de Zoom, un juego, un aviso de notificación. Es el flujo que va hacia tus altavoces o auriculares.

Un micrófono es un dispositivo de entrada , y los grabadores están construidos para leer entradas. El audio del sistema es una salida , sonido que sale de la computadora, y leer un flujo de salida es una operación fundamentalmente distinta. Esa asimetría es la razón por la que «grabar el sonido de la computadora y la pantalla» hace tropezar a tantas herramientas: se diseñaron pensando en la entrada y tratan la salida como algo secundario, o directamente la omiten.

Por qué capturar el audio interno es difícil en Windows

Para grabar lo que tu computadora está reproduciendo, el software tiene que hacer algo llamado loopback(bucle de retorno): en lugar de escuchar un micrófono, intercepta el flujo de renderizado del dispositivo de audio (la señal ya mezclada de camino a los altavoces) y la copia. Históricamente, Windows hacía esto incómodo.

Durante años, la única opción integrada fue Mezcla estéreo, un dispositivo de grabación virtual que exponían algunas tarjetas de sonido. Funcionaba, a veces, pero muchos portátiles modernos y auriculares USB simplemente no lo ofrecen. Cuando Mezcla estéreo no está disponible, la gente recurre a un cable de audio virtual : software como VB-Cable que crea un dispositivo de salida falso, de modo que enrutas tu sonido del sistema hacia él y luego grabas eso. Funciona, pero es una instalación adicional, añade un enrutamiento que hay que configurar correctamente, y es fácil de romper: cambias tu dispositivo de salida y la grabación vuelve a quedarse en silencio.

La respuesta moderna y correcta es el loopback de WASAPI. WASAPI (Windows Audio Session API) permite que una aplicación abra el dispositivo de salida existente en modo loopback y lea exactamente el audio que ya se está reproduciendo, sin dispositivo virtual, sin reenrutamiento, sin nada que el usuario tenga que configurar. Esta funcionalidad lleva mucho tiempo en Windows; el problema es que el grabador tiene que usarla de verdad. Muchos no lo hacen.

Cómo graba Maxisnap ambos audios, sin controladores

Maxisnap captura el audio del sistema mediante loopback de WASAPI y tu micrófono al mismo tiempo, y por defecto los mezcla en una sola pista para que lo escuches todo junto (la aplicación, el video y tu narración) tal como lo espera un espectador. No hay que activar Mezcla estéreo, no hay que instalar ningún cable virtual, no hay que perseguir ningún controlador. Empiezas a grabar y el sonido simplemente está ahí.

La grabación en sí es sencilla. Dos teclas de acceso rápido, ambas reasignables:

Ctrl+Alt+4 : graba la pantalla completa (el monitor bajo tu cursor).
Ctrl+Alt+3 : graba una región seleccionada cuando solo quieres una parte de la pantalla.

Aparece una pequeña insignia de grabación para que siempre sepas que está grabando, y está excluida deliberadamente de su propia captura, así que nunca aparece en el video. Para detenerla, pulsa de nuevo la tecla de acceso rápido, haz clic en Detener en la insignia, o usa la bandeja del sistema.

Cuando paras, se abre una ventana de resultado con un reproductor integrado, además de los botones Guardar, Copiar, Subiry Arrastrar . Puedes recortar el inicio y el final, y exportar a MP4, MP4 optimizado para IA, GIFo WebM con ajustes preestablecidos de calidad. La codificación puede usar aceleración por hardware (NVENC, Intel QuickSync o AMD AMF) cuando tu equipo lo permite, con respaldo por software en caso contrario, y ffmpeg viene incluido en el instalador, así que no hay nada más que descargar.

Si prefieres editar la voz y el sonido del sistema por separado, puedes mantenerlos en pistas separadas en lugar de mezclarlos. Es la solución más limpia para el eco y para los casos en los que quieras bajar el audio de la aplicación por debajo de tu narración más adelante.

Una pista o dos: cómo elegir

La opción predeterminada (audio del sistema y micrófono mezclados en una pista) es la adecuada para la mayoría de la gente. Se reproduce correctamente en todas partes sin ninguna edición, y es lo que necesitas para una demostración rápida, un tutorial o un informe de errores.

Elige pistas separadas cuando planees llevar la grabación a un editor y quieras un control independiente: bajar el volumen de la aplicación mientras hablas, eliminar un sonido de notificación o corregir un problema de sincronización. Las pistas separadas te cuestan un paso adicional (las mezclas después) a cambio de un control total.

Fallos habituales y cómo solucionarlos

Síntoma	Causa probable	Solución
Solo se grabó mi voz	El grabador capturó el micrófono pero no el loopback del sistema	Usa un grabador con loopback de WASAPI (Maxisnap lo captura por defecto, sin configuración)
No hay sonido en absoluto	Micrófono silenciado o dispositivo incorrecto, o el dispositivo de salida cambió durante la grabación	Confirma el micrófono correcto y graba el dispositivo de salida activo directamente mediante loopback en lugar de un cable virtual
Sonido del sistema pero sin voz	Micrófono incorrecto seleccionado, o permiso de micrófono denegado	Elige el dispositivo de entrada correcto y concede acceso al micrófono en la configuración de privacidad de Windows
Eco / audio duplicado	Los altavoces reproducen el sonido y el micrófono lo vuelve a grabar	Usa auriculares, o graba el audio del sistema y el micrófono en pistas separadas
El audio se desincroniza	Desajuste de la velocidad de fotogramas o del tiempo de audio/video durante la captura	Captura a una velocidad de fotogramas estable; recorta y vuelve a exportar desde la ventana de resultado si hace falta
Sonido robótico o con crujidos	Desajuste de la frecuencia de muestreo o una cadena de cable virtual sobrecargada	Descarta el cable virtual; la captura por loopback lee la señal nativa del dispositivo con limpieza

El hilo común en casi todos estos casos: los cables virtuales y Mezcla estéreo añaden piezas móviles frágiles. Leer el dispositivo de salida directamente mediante loopback elimina la mayoría de las formas en que «grabar la pantalla con audio interno y micrófono» puede fallar.

Una nota rápida sobre Mac

macOS es la historia contraria en cuanto al sonido del sistema. Las herramientas integradas, Cmd+Shift+5 y QuickTime Player, graban bien la pantalla y tu micrófono, pero no pueden capturar el audio interno por sí solas. Para grabar lo que el Mac está reproduciendo, sigues necesitando un controlador como BlackHole o Soundflower enrutado a través de un dispositivo agregado o de salida múltiple. Si usas un Mac, la guía gratuita de grabación de pantalla en Mac explica exactamente cómo configurarlo. El grabador de Maxisnap está disponible hoy en Windows; una versión nativa para macOS está en desarrollo activo, y puedes pedir que te avisemos en la página de contactode Claude Code.

El camino más rápido a una grabación que realmente tiene sonido

Si solo quieres un clip con el audio de la aplicación y tu voz juntos, aquí tienes todo el proceso en Windows:

Pulsa Ctrl+Alt+4 (pantalla completa) o Ctrl+Alt+3 (región).
Habla mientras muestras lo que sea: el sonido del sistema y tu micrófono se capturan y se mezclan por defecto.
Pulsa de nuevo la tecla de acceso rápido para detener. Recorta los tiempos muertos al principio y al final.
Exporta a MP4, o elige MP4 optimizado para IA (~1280px, 24fps, mono) para obtener un archivo diminuto que puedas pegar directamente en ChatGPT, Claude o Gemini.

Sin marca de agua, sin límite de tiempo, y grabar es gratis. Esa es la diferencia entre un video silencioso que tienes que volver a grabar y un clip que lo dice todo a la primera.

Preguntas frecuentes

¿Cómo grabo mi pantalla con audio del sistema y micrófono al mismo tiempo?
Usa un grabador que capture el loopback del sistema además del micrófono. En Maxisnap, pulsa Ctrl+Alt+4 (pantalla completa) o Ctrl+Alt+3 (región); el audio de escritorio mediante loopback de WASAPI y tu micrófono se capturan y se mezclan en una sola pista por defecto, sin necesidad de un cable virtual ni controladores adicionales.

¿Por qué mi grabación solo captura el micrófono y no el sonido de la computadora?
Porque el grabador solo abrió la entrada del micrófono. Capturar lo que reproduce la computadora requiere grabar por loopback el flujo de salida del dispositivo de audio. Maxisnap lo hace mediante WASAPI, así que el sonido de escritorio se captura sin controladores junto con el micrófono.

¿Necesito Mezcla estéreo o un cable de audio virtual en Windows?
No. Mezcla estéreo es inconsistente y no está disponible en muchos dispositivos modernos, y los cables virtuales son una instalación adicional con un enrutamiento que mantener. Maxisnap lee el loopback de escritorio mediante WASAPI de forma nativa, así que no hace falta ninguno de los dos.

¿Por qué hay eco en mi grabación?
El mismo sonido se está capturando dos veces: tus altavoces lo reproducen y tu micrófono lo vuelve a captar. Usa auriculares, o graba el audio del sistema y el micrófono en pistas separadas para poder silenciar o alinear una de ellas al editar.

¿Grabar con audio es gratis, y hay marca de agua o límite de tiempo?
Sí: grabar con audio del sistema y micrófono es gratis en Windows, sin marca de agua y sin límite de tiempo. Los planes de pago solo entran en juego si compartes grabaciones a través de Maxisnap Cloud más allá del límite gratuito; siempre puedes guardar localmente o alojarlo tú mismo.

¿Quieres el recorrido completo de grabación sin entrar en los matices del audio? Consulta cómo grabar la pantalla en Windows gratis, o descubre cómo el grabador de pantalla y herramienta de capturas combinados encajan en una sola aplicación ligera.