Cutting audio
オーディオを切るとクリックやポップが出るのはなぜ?
オーディオカット後のクリックは、ゼロ交差以外で波形が跳ぶときに起きます。原因と、短いフェード・クロスフェードでの直し方を解説。

TL;DR
- クリックはカットが波形の途中、ゼロ交差以外に当たると起きる。
- クリップ端に 5〜20 ms のフェード、接する箇所に 10〜30 ms のクロスフェードで修正。
- 可能なら息と間で切る。フレームベースの動画タイムラインはこれを難しくする。
- audioeditor.pro でブラウザ一つにトランスクリプトカットと遷移修正。
ポッドキャストのテイクから文を削除すると、編集箇所で鋭いチックが聞こえる。タイムラインではきれいに見えた。再生は別の話。
その音はたいてい録 音の問題ではない。カットポイントの不連続:話者が波形の途中にいたときにファイルが終わり、次のサンプルが別の場所から始まる。耳はその跳びをクリックやポップとして読む。
実際に聞いているもの
編集からのクリックは非常に短いエネルギーのバースト。数ミリ秒しか続かないが、話し方はほぼ滑らかで予測可能なので目立つ。
初心者が気づくクリックの多くを生む2つの編集:
- ハードアウトポイント — 波形がまだ中心線の上下(無音でない)にいるときにクリップを止める。
- ハードインポイント — 次のクリップが静かなサンプルではなく波形の途中から始まる。
スピーカーはその瞬間のレベル変化を再現しようとする。結果は小さなデジタルグリッチと同じ系統:入りでクリック、出でポップ、両側が荒ければ両方。
これはマイクが拾った口のクリック、子音の破裂音、不良ケーブルのクラックルとは違う。それらは録音由来。編集クリックはファイルの切り方由来。
ゼロ交差とその重要性
オーディオ波形は中心線のゼロ振幅の周りで正負に振れる。その中心線がゼロ交差:実質的に無音の瞬間。
両側で正確にゼロ交差で切れば、処理なしでクリックフリーになり得る。
ただしゼロ交差は極小。48 kHz サンプルレートでは1秒に48,000サンプル。動画タイムラインはしばしばフレーム(秒24または30)にスナップし、個々のオーディオサンプルではない。だから見た目は問題ないカットが、しばしば波の途中に当たる。
それがオーディオカットでクリ ックが起きる主な理由。強制しない限り、編集ポイントはほぼ完璧なゼロ交差にならない。

攻撃的なカットが悪化させる理由
跳びが急であるほど、クリックは大きく感じやすい。編集をポップさせるよくある状況:
語の途中でカット — 端にルームトーンや息なしで子音の間で「um」をスライス。
オーバーラップなしのバックツーバッククリップ — フェードなしで2領域が接する。
ゼロまで剥がした無音 — 一語の尾が次の語の立ち上がりにバッファなしで出会う一語の間を削除。
フランケンバイト行 — 異なるテイクの語をつなぎ、ピッチ、ルームトーン、息のパターンが合わない。ゼロ交差がきれいでも耳は オーディオジャンプカット のようなぎこちなさを聞く。フェードがなければクリックも。
長いインタビューをトリムするなら、構造カットが大きなブロックを先に削除。フィラー語の細部カットでこれらのポップが通常出る。スピードワークフローは、後から端を直すなら役に立つ。
フェードがカットポイントのクリックを除去する仕組み
フェードアウトはクリップの終わりを無音まで下げる。フェードインは始まりを無音から上げる。一緒に、カットがゼロ交差に当たらなくても波形が境界でゼロに近づくことを保証。
話し音声の実用的な出発点:
| 状況 | 最初の修正 |
|---|---|
| 単一クリップの端 | 5〜20 ms リニアフェード |
| 2クリップ接合 | 10〜30 ms クロスフェード |
| 動画タイムライン(フレームベース) | 余裕がそれだけなら1〜2フレームフェード |
短いフェードはクリックを直す。長いフェード(50 ms以上)は意図的なレベルディップのように聞こえ始め、音楽には有用だがタイトな対話にはしばしば不適切。
ルール: 1回のフェード後もチックが聞こえたら、ノイズリダクションツールに手を伸ばす前にわずかに延長(5〜10 ms 追加)。

2クリップが接するときのクロスフェード
クロスフェードはクリップ A の尾とクリップ B の頭を重ねる。A がフェードアウトし B がフェードイン。リスナーは硬い切り替えを聞かない。
クロスフェードを使うとき:
- 中間セクションを削除し、残りが接する必要がある
- 同じ文の2テイクを結合した
- 間を短縮したが両側に話しがある
音声には、10〜20 ms 前後のイコールパワーまたは短いイコールゲインクロスフェードが堅実なデフォルト。クロスフェードがボリュームディップのように聞こえたら短く。まだクリックが聞こえたらわずかに延長するか、カットを息に移す。
多くのエディタは選択内のすべてのカットにクロスフェードを適用できる。そうでなければ数十の小さなトリムが数十 の小さなポップを意味する対話重視のタイムラインでは価値がある。
クリックが自分で隠れるカット位置
最良のクリック修正は、クリックが問題にならない場所で切ること。
好ましい編集ポイント:
- フレーズ間の息
- 完了した思考の後の自然な間
- 音節の途中ではなくルームトーン
- 5 ms フェードをマスクする子音ノイズ(軽く使う。語を台無しにしない)
避けるカット:
- 母音の最大ピーク
- 破裂音の立ち上がり
- 残す語の最初の10 ms
先に 長い録音のミスを見つける と、削除するブロックをマークする。長いインタビューを短くする と、マイクロトリムの前に大きなセクションを削除する。どちらのワークフローも、小さなカットは活発な発話の中ではなく間に当てるときによりうまく機能する。
トランスクリプトカットと自動エッジスムージング
トランスクリプトベースのエディタは選択テキストに一致する音声を削除する。裏では依然としてサンプルレベルのカット。良いツールは短いフェードを適用するか、段落に沿ったクリックの列を避けるために間の近くの境界を選ぶ。
トランスクリプトで編集するなら:
- 可能なら語の途中ではなくフレーズ境界で削除。
- 各バッチのカット後に段落レベルで聴き返す。
- チックが聞こえたら、選択を音節分短くするか、クリップ端に手動フェードを追加。
audioeditor.pro では、トランスクリプトカットとタイムラインフェードが同じビューにあり、ツール間を行き来せずトリムしながらチックを直せる。

編集由来でないクリック
すべてにフェードする前に、ポップが編集にあるか確認:
- 再生のたびに同じ位置 — たいていカットか固定デジタルグリッチ
- 再生中のみランダムなポップ — バッファまたはドライバの問題、ファイルに焼き込まれていない
- リズミカルなチック — クロックまたはサンプルレートの不一致
- 広帯域クラックル — ケーブル、インターフェース、またはキャプチャのグラウンドノイズ
高ズームで波形を開く。編集クリックは1サンプルでの突然の垂直エッジのように見える。ポップが接合部にないなら、フェードは根本原因を直さない。
クリーンなカットの予防チェックリスト
エクスポート前にこれを使う:
- 大きなセクションを先にカット。クリッキーなマイクロ編集は最後。
- 可能なら息または間に編集を配置。
- 無音にないクリップ端に 5〜20 ms のフェードを追加。
- 2つの音声クリップが接する箇所に 10〜20 ms クロスフェード。
- トリムのバッチ後、各分を 1x で再生しチックを探す。
- つなぎ行がぎこちなければ、クロスフェードを延長するかルームトーンで再カット。
カット後のクリックは正常な物理であり、ファイルを壊したサインではない。波形に滑らかに着地する場所がなかったという意味。数ミリ秒のフェードでたいてい直る。
FAQ
ゼロ交差とは?
波形がゼロ振幅(実質的な無音)を横切る点。ゼロ交差でのカットは活発な音声上のカットよりクリックしにくい。
話し対話のフェードはどれくらい?
単一クリップ端に 5〜20 ms、2つの音声クリップが接する箇所に 10〜30 ms クロスフェードから始める。まだチックが聞こえたらわずかに延長。
動画エディタはオーディオエディタよりクリックが多いのはなぜ?
動画タイムラインはフレーム(秒24〜30)にスナップし、ゼロ交差が実際にある秒48,000オーディオサンプルではない。
編集クリックは口のクリックやケーブルノイズと同じ?
いいえ。編集クリックは毎回同じ接合部で繰り返す。録音の問題はランダムかパフォーマンスに結びつき、カットポイントではない。
トランスクリプトベースのカットにもフェードが必要?
はい。テキスト削除もサンプルレベルのカット。良いツールは自動フェードまたは間境界を選ぶ。常に段落レベルで聴き返す。
