Cutting audio
¿Por qué cortar audio provoca clics o pops?
Los clics tras un corte aparecen cuando la forma de onda salta fuera de cero. Aprende por qué ocurre y cómo fades y crossfades cortos lo arreglan.

TL;DR
- Los clics aparecen cuando un corte cae a mitad de forma de onda, no en un zero crossing.
- Corrígelo con fades de 5–20 ms en los bordes del clip y crossfades de 10–30 ms donde los clips se unen.
- Corta en respiraciones y pausas cuando puedas; las líneas de tiempo de vídeo por fotogramas lo complican.
- audioeditor.pro te permite corregir cortes por transcripción y transiciones en un solo flujo en el navegador.
Eliminas una frase de una toma de podcast y oyes un clic agudo en el corte. En la línea de tiempo parecía limpio. La reproducción dice lo contrario.
Ese sonido suele no ser un problema de grabación. Es una discontinuidad en el punto de corte: el hablante estaba a mitad de forma de onda cuando el archivo terminó y la siguiente muestra empieza en otro sitio. El oído interpreta ese salto como un clic o pop.
Qué estás escuchando realmente
Un clic por edición es una ráfaga muy corta de energía. Dura solo unos milisegundos, pero destaca porque el habla suele ser suave y predecible.
Dos tipos de edición producen la mayoría de clics que notan quienes empiezan:
- Punto de salida duro — paras el clip mientras la forma de onda sigue por encima o debajo de la línea central (no en silencio).
- Punto de entrada duro — el siguiente clip empieza a mitad de forma de onda en lugar de desde una muestra silenciosa.
El altavoz intenta reproducir ese cambio instantáneo de nivel. El resultado es la misma familia de sonido que un micro fallo digital: un clic al entrar, un pop al salir, o ambos si ambos lados del corte son bruscos.
Esto es distinto de un clic de boca captado por el micrófono, una oclusiva en «p» o «b», o crepitación de un cable malo. Esos vienen de la grabación. Los clics de edición vienen de cómo se cortó el archivo.
Zero crossings y por qué importan
Las formas de onda de audio oscilan entre positivo y negativo alrededor de una línea central en amplitud cero. Esa línea central es el zero crossing: un momento en que la señal es efectivamente silenciosa.
Si cortas exactamente en un zero crossing en ambos lados, la transición puede quedar sin clic sin procesamiento.
El problema es que los zero crossings son diminutos. A 48 kHz de frecuencia de muestreo hay 48 000 muestras por segundo. Las líneas de tiempo de vídeo suelen ajustarse a fotogramas (24 o 30 por segundo), no a muestras de audio individuales. Así que un corte que se ve bien visualmente suele caer a mitad de onda.
Esa es la razón principal por la que cortar audio provoca clics: el punto de edición casi nunca es un zero crossing perfecto salvo que lo fuerces.

Por qué los cortes agresivos lo empeoran
Cuanto más brusco el salto, más fuerte suele sentirse el clic. Situaciones habituales que hacen que las ediciones hagan pop:
Cortar a mitad de palabra — quitar «eh» cortando entre consonantes sin ruido de sala o respiración en el borde.
Clips seguidos sin solapamiento — dos regiones pegadas sin fade entre ellas.
Silencio reducido a cero — eliminar una pausa para que la cola de una palabra encuentre el ataque de la siguiente sin margen.
Líneas frankenbite — unir palabras de tomas distintas con tono, ruido de sala o patrón de respiración que no coinciden. Incluso con zero crossings limpios, el oído percibe brusquedad como un jump cut de audio; sin fades, también hay clics.
Si recortas una entrevista larga, los cortes estructurales quitan bloques grandes primero. Los cortes de detalle en muletillas son donde suelen aparecer estos pops. Un flujo rápido solo ayuda si arreglas los bordes después.
Cómo los fades eliminan clics en los puntos de corte
Un fade-out baja el final de un clip hasta el silencio. Un fade-in sube el inicio desde el silencio. Juntos garantizan que la forma de onda se acerque a cero en el límite aunque el corte no cayera en un zero crossing.
Puntos de partida prácticos para audio hablado:
| Situación | Arreglo inicial |
|---|---|
| Inicio o fin de un solo clip | Fade lineal de 5–20 ms |
| Dos clips unidos | Crossfade de 10–30 ms |
| Línea de tiempo de vídeo (por fotogramas) | Fade de 1–2 fotogramas si es todo el espacio que tienes |
Fades más cortos arreglan clics. Fades más largos (50 ms y más) empiezan a sonar como un bajón deliberado de nivel, útil en música pero a menudo incorrecto en diálogo ajustado.
Regla: si aún oyes un clic tras un fade, alargarlo un poco (añade 5–10 ms) antes de recurrir a herramientas de reducción de ruido.

Crossfades cuando dos clips se encuentran
Un crossfade solapa la cola del clip A con la cabeza del clip B. A hace fade out mientras B hace fade in. El oyente nunca oye un cambio brusco.
Usa crossfade cuando:
- Eliminaste una sección central y las partes restantes deben tocarse
- Uniste dos tomas de la misma frase
- Acortaste una pausa pero conservaste habla en ambos lados
Para voz, crossfades equal-power o equal-gain cortos de unos 10–20 ms son un buen valor por defecto. Si el crossfade suena a bajón de volumen, acórtalo. Si aún oyes un clic, alárgalo un poco o mueve el corte a una respiración.
Muchos editores permiten aplicar crossfades a cada corte de una selección. Vale la pena en líneas de tiempo con mucho diálogo donde decenas de recortes pequeños significarían decenas de pops diminutos.
Dónde colocar cortes para que los clics se oculten solos
La mejor corrección de clic es cortar donde un clic no importaría.
Prefiere puntos de edición en:
- Respiraciones entre frases
- Pausas naturales tras un pensamiento completado
- Ruido de sala en lugar de a mitad de sílaba
- Ruido de consonante que enmascara un fade de 5 ms (úsalo con moderación; no destroces palabras)
Evita cortar en:
- El pico más fuerte de una vocal
- El ataque de una oclusiva
- Los primeros 10 ms de una palabra que conservas
Cuando buscas errores en una grabación larga primero, marcas bloques a eliminar. Cuando acortas una entrevista larga, eliminas secciones grandes antes que micro-recortes. Ambos flujos funcionan mejor cuando los cortes pequeños caen en pausas, no dentro del habla activa.
Cortes por transcripción y suavizado automático de bordes
Los editores basados en transcripción eliminan el audio que coincide con el texto seleccionado. Por debajo, sigue siendo un corte a nivel de muestra. Las buenas herramientas aplican fades cortos o eligen límites cerca de pausas para que no quede una fila de clics a lo largo del párrafo.
Si editas por transcripción:
- Elimina en límites de frase cuando puedas, no a mitad de palabra.
- Escucha de nuevo a nivel de párrafo tras cada lote de cortes.
- Si oyes clics, acorta la selección una sílaba o añade un fade manual en el borde del clip.
En audioeditor.pro, los cortes por transcripción y los fades en la línea de tiempo están en la misma vista, así puedes corregir clics mientras recortas en lugar de saltar entre herramientas.

Clics que no vienen de tu edición
Antes de aplicar fade a todo, confirma que el pop está en el corte:
- Mismo sitio en cada reproducción — suele ser el corte o un fallo digital fijo
- Pops aleatorios solo al reproducir — problema de buffer o driver, no grabado en el archivo
- Tic rítmico — desajuste de reloj o frecuencia de muestreo
- Crepitación amplia — cable, interfaz o ruido de masa de la captura
Abre la forma de onda con mucho zoom. Los clics de edición parecen un borde vertical brusco en una muestra. Si el pop no está en tu empalme, los fades no arreglarán la causa raíz.
Lista de verificación para cortes limpios
Usa esto antes de exportar:
- Corta secciones grandes primero; trata micro-ediciones con clic al final.
- Coloca ediciones en respiraciones o pausas cuando puedas.
- Añade fades de 5–20 ms en cualquier borde de clip que no esté en silencio.
- Aplica crossfade de 10–20 ms donde dos clips de voz se tocan.
- Tras un lote de recortes, reproduce cada minuto a 1x y busca clics.
- Si una línea unida suena entrecortada, alarga el crossfade o vuelve a cortar en ruido de sala.
Los clics tras cortar son física normal, no señal de que rompiste el archivo. Significan que la forma de onda no tenía dónde aterrizar suavemente. Unos milisegundos de fade suelen bastar.
FAQ
¿Qué es un zero crossing?
El punto donde la forma de onda cruza amplitud cero (silencio efectivo). Los cortes en zero crossings tienen menos probabilidad de hacer clic que los cortes en audio activo.
¿Cuánto debe durar un fade para diálogo hablado?
Empieza con 5–20 ms en el borde de un solo clip y crossfades de 10–30 ms donde dos clips de voz se tocan. Alarga un poco si aún oyes un clic.
¿Por qué los editores de vídeo provocan más clics que los de audio?
Las líneas de tiempo de vídeo se ajustan a fotogramas (24–30 por segundo), no a las 48 000 muestras de audio por segundo donde viven los zero crossings.
¿Los clics de edición son lo mismo que clics de boca o ruido de cable?
No. Los clics de edición se repiten en el mismo empalme en cada reproducción. Los problemas de grabación pueden ser aleatorios o ligados a la interpretación, no a tu punto de corte.
¿Los cortes por transcripción siguen necesitando fades?
Sí. Eliminar texto sigue siendo un corte a nivel de muestra. Las buenas herramientas hacen auto-fade o eligen límites en pausas; escucha siempre de nuevo a nivel de párrafo.
