Cutting audio
Warum verursacht Audio-Schneiden Clicks oder Pops?
Clicks nach einem Audio-Schnitt entstehen, wenn die Waveform an einem Nicht-Null-Punkt springt. Erfahre warum — und wie kurze Fades und Crossfades helfen.

TL;DR
- Clicks entstehen, wenn ein Schnitt mitten in der Waveform landet, nicht an einem Zero Crossing.
- Fix mit 5–20 ms Fades an Clip-Kanten und 10–30 ms Crossfades, wo Clips aufeinandertreffen.
- Wenn möglich auf Atem und Pausen schneiden; frame-basierte Video-Timelines erschweren das.
- audioeditor.pro lässt Transkript-Schnitte und Übergänge in einem Browser-Workflow fixen.
Du löschst einen Satz aus einem Podcast-Take und hörst einen scharfen Tick am Edit. Der Schnitt sah auf der Timeline sauber aus. Playback sagt etwas anderes.
Dieser Klang ist meist kein Aufnahme-Problem. Es ist eine Diskontinuität am Schnittpunkt: Der Sprecher war mitten in der Waveform, als die Datei endete, und das nächste Sample startet woanders. Deine Ohren lesen diesen Sprung als Click oder Pop.
Was du wirklich hörst
Ein Click vom Edit ist ein sehr kurzer Energie-Burst. Er dauert nur wenige Millisekunden, fällt aber auf, weil Sprache meist glatt und vorhersehbar ist.
Zwei Edits erzeugen die meisten Clicks, die Anfänger bemerken:
- Harter Out-Point — du stoppst den Clip, während die Waveform noch über oder unter der Mittellinie ist (nicht bei Stille).
- Harter In-Point — der nächste Clip startet mitten in der Waveform statt von einem leisen Sample.
Der Sprecher versucht nicht, diesen instantanen Pegelwechsel zu reproduzieren. Das Ergebnis ist dieselbe Klangfamilie wie ein winziger digitaler Glitch: ein Click beim Reinkommen, ein Pop beim Rausgehen — oder beides, wenn beide Schnittseiten rau sind.
Das unterscheidet sich von einem Mund-Click am Mikro, einem Plosiv auf „p“ oder „b“ oder Knistern von einem schlechten Kabel. Die kommen von der Aufnahme. Edit-Clicks kommen davon, wie die Datei geschnitten wurde.
Zero Crossings und warum sie zählen
Audio-Wellenformen schwingen positiv und negativ um eine Mittellinie bei null Amplitude. Diese Mittellinie ist das Zero Crossing: ein Moment, in dem das Signal effektiv still ist.
Schneidest du exakt an einem Zero Crossing auf beiden Seiten, kann der Übergang ohne Bearbeitung click-frei sein.
Der Haken: Zero Crossings sind winzig. Bei 48 kHz Sample Rate gibt es 48.000 Samples pro Sekunde. Video-Timelines snappen oft auf Frames (24 oder 30 pro Sekunde), nicht auf einzelne Audio-Samples. Ein Schnitt, der visuell okay aussieht, landet oft mitten in der Welle.
Das ist der Hauptgrund, warum Audio-Schneiden Clicks verursacht: Der Edit-Punkt ist fast nie ein perfektes Zero Crossing — es sei denn, du erzwingst es.

Warum aggressive Schnitte es schlimmer machen
Je schärfer der Sprung, desto lauter fühlt sich der Click oft an. Situationen, die Edits poppen lassen:
Mitten im Wort schneiden — „äh“ entfernen, indem man zwischen Konsonanten schneidet, ohne Raumton oder Atem an der Kante.
Clip an Clip ohne Überlappung — zwei Regionen stoßen ohne Fade aneinander.
Stille auf null gestrippt — Pause löschen, sodass das Ende eines Wortes ohne Puffer auf den Angriff des nächsten trifft.
Frankenbite-Zeilen — Wörter aus verschiedenen Takes zusammensetzen, sodass Tonhöhe, Raumton oder Atem-Muster nicht passen. Selbst mit sauberen Zero Crossings hört das Ohr Abgehacktheit wie einen Audio-Jump-Cut; ohne Fades kommen auch Clicks dazu.
Beim Kürzen eines langen Interviews entfernen Strukturschnitte zuerst große Blöcke. Detail-Schnitte an Füllwörtern sind, wo diese Pops meist auftauchen. Ein Speed-Workflow hilft nur, wenn du die Kanten danach fixierst.
Wie Fades Clicks an Schnittpunkten entfernen
Ein Fade-out fährt das Ende eines Clips auf Stille herunter. Ein Fade-in fährt den Start von Stille hoch. Zusammen garantieren sie, dass die Waveform an der Grenze null erreicht — auch wenn dein Schnitt nicht an einem Zero Crossing landete.
Praktische Startpunkte für gesprochenes Audio:
| Situation | Start-Fix |
|---|---|
| Einzelnes Clip-Ende oder -Start | 5–20 ms linearer Fade |
| Zwei verbundene Clips | 10–30 ms Crossfade |
| Video-Timeline (frame-basiert) | 1–2 Frame Fade, wenn das alles ist, was Platz lässt |
Kürzere Fades fixen Clicks. Längere Fades (50 ms und mehr) klingen wie bewusster Pegelabfall — nützlich für Musik, oft falsch für straffen Dialog.
Regel: Hörst du nach einem Fade noch einen Tick, ihn leicht verlängern (5–10 ms dazu), bevor du zu Noise-Reduction greifst.

Crossfades, wenn zwei Clips aufeinandertreffen
Ein Crossfade überlappt das Ende von Clip A mit dem Anfang von Clip B. A faded aus, während B einfaded. Der Zuhörer hört keinen harten Wechsel.
Crossfade nutzen, wenn:
- Du einen Mittelabschnitt entfernt hast und die Restteile sich berühren müssen
- Du zwei Takes derselben Zeile verbindest
- Du eine Pause gekürzt hast, aber Sprache auf beiden Seiten behalten ist
Für Stimme sind Equal-Power- oder kurze Equal-Gain-Crossfades um 10–20 ms ein solider Default. Klingt der Crossfade wie ein Pegel-Loch, kürzen. Hörst du noch einen Click, leicht verlängern oder den Schnitt auf Atem legen.
Viele Editoren lassen Crossfades auf jeden Schnitt in einer Selektion anwenden. Das lohnt sich auf dialog-lastigen Timelines, wo sonst Dutzende kleiner Trims Dutzende winziger Pops bedeuten.
Wo Schnitte platzieren, damit Clicks sich verstecken
Der beste Click-Fix ist schneiden, wo ein Click egal wäre.
Bevorzugte Edit-Punkte:
- Atem zwischen Phrasen
- Natürliche Pausen nach einem abgeschlossenen Gedanken
- Raumton statt mitten in der Silbe
- Konsonanten-Rauschen, das einen 5 ms Fade maskiert (sparsam nutzen; Wörter nicht zerstören)
Vermeiden beim Schneiden:
- Den lautesten Peak eines Vokals
- Den Angriff eines Plosivs
- Die ersten 10 ms eines Wortes, das du behältst
Wenn du Fehler in einer langen Aufnahme zuerst findest, markierst du Blöcke zum Entfernen. Wenn du ein langes Interview kürzt, löschst du große Abschnitte vor Mikro-Trims. Beide Workflows funktionieren besser, wenn kleine Schnitte auf Pausen landen, nicht mitten in aktiver Sprache.
Transkript-Schnitte und automatische Kanten-Glättung
Transkript-basierte Editoren löschen das Audio, das zum markierten Text passt. Unter der Haube ist das immer noch ein Sample-Level-Schnitt. Gute Tools wenden kurze Fades an oder wählen Grenzen nahe Pausen, damit du keine Reihe Clicks entlang des Absatzes bekommst.
Wenn du per Transkript editierst:
- Wenn möglich an Phrasengrenzen löschen, nicht mitten im Wort.
- Nach jedem Batch von Schnitten auf Absatzebene zurückhören.
- Bei Ticks die Selektion um eine Silbe kürzen oder manuellen Fade an der Clip-Kante setzen.
Auf audioeditor.pro sitzen Transkript-Schnitte und Timeline-Fades in derselben Ansicht — Ticks fixen beim Trimmen, ohne zwischen Tools zu springen.

Clicks, die nicht von deinem Edit kommen
Bevor du alles fadest, bestätigen, dass der Pop am Edit sitzt:
- Gleiche Stelle bei jedem Play — meist der Schnitt oder ein fixer digitaler Glitch
- Zufällige Pops nur beim Playback — Buffer- oder Treiber-Problem, nicht in der Datei eingebrannt
- Rhythmisches Ticken — Clock- oder Sample-Rate-Mismatch
- Breitband-Knistern — Kabel, Interface oder Ground-Noise von der Aufnahme
Waveform stark zoomen öffnen. Edit-Clicks sehen aus wie eine plötzliche vertikale Kante an einem Sample. Sitzt der Pop nicht an deinem Splice, fixen Fades nicht die Ursache.
Präventions-Checkliste für saubere Schnitte
Vor dem Export:
- Große Abschnitte zuerst schneiden; klickige Mikro-Edits zuletzt.
- Edits auf Atem oder Pausen legen, wenn möglich.
- 5–20 ms Fades an jeder Clip-Kante, die nicht bei Stille sitzt.
- 10–20 ms Crossfade, wo zwei Sprach-Clips sich berühren.
- Nach einem Batch von Trims jede Minute bei 1x abspielen und nach Ticks jagen.
- Klingt eine zusammengesetzte Zeile abgehackt, Crossfade verlängern oder auf Raumton neu schneiden.
Clicks nach dem Schneiden sind normale Physik, kein Zeichen, dass du die Datei kaputt gemacht hast. Sie bedeuten, die Waveform hatte keine glatte Landung. Ein paar Millisekunden Fade fixen es meist.
FAQ
Was ist ein Zero Crossing?
Der Punkt, an dem die Waveform null Amplitude kreuzt (effektive Stille). Schnitte an Zero Crossings klicken seltener als Schnitte auf aktivem Audio.
Wie lang sollte ein Fade für gesprochenen Dialog sein?
Start mit 5–20 ms an einer einzelnen Clip-Kante und 10–30 ms Crossfades, wo zwei Sprach-Clips sich berühren. Leicht verlängern, wenn du noch einen Tick hörst.
Warum verursachen Video-Editoren mehr Clicks als Audio-Editoren?
Video-Timelines snappen auf Frames (24–30 pro Sekunde), nicht auf die 48.000 Audio-Samples pro Sekunde, wo Zero Crossings wirklich leben.
Sind Edit-Clicks dasselbe wie Mund-Clicks oder Kabel-Rauschen?
Nein. Edit-Clicks wiederholen sich bei jedem Play an derselben Stelle. Aufnahme-Probleme können zufällig sein oder an Performance gebunden, nicht an deinen Schnittpunkt.
Brauchen Transkript-basierte Schnitte trotzdem Fades?
Ja. Text löschen ist immer noch ein Sample-Level-Schnitt. Gute Tools auto-faden oder wählen Pausen-Grenzen; immer auf Absatzebene zurückhören.
