Silence removal
無音削除がぎこちなく聞こえるのはなぜ?
ぎこちない無音削除は、しきい値が高すぎるか間が短く切りすぎのサイン。死に空気を締めつつ音声を切らない設定の学び方。

TL;DR
- ぎこちない無音削除は、しきい値が高すぎるか最小時間が低すぎることが多い。
- ポッドキャストはしきい値 -40〜-45 dB、最小 300〜500 ms から始める。
- 80〜250 ms のパディングで語の立ち上がりと尾を守る。
- audioeditor.pro はブラウザで死に空気検出とエクスポート前のタイムライン確認を提供。
ポッドキャストに無音削除を実行すると、尺が10分短くなる。良い。再生するとホストが息ができないように聞こえる。語が弾ける。ジョークが速すぎる。編集がぎこちない。
壊れたツールではない。たいて い、話し尾、息、思考の間を死に空気として扱う攻撃的な検出。
引き締めた編集で「ぎこちない」とは
ぎこちない無音削除は1つの大きなグリッチではない。リズムの問題:
- 文が耳の期待より早く始まる
- フレーズ間の息の余地が消える
- 語の始まりの子音が切れる(「a」なしの「-tion」)
- インタビューの話の交代が急ぐ
- 感情的なビートが重みを与えた間を失う
リスナーは「無音削除」とは思わない。話者が緊張しているか、編集が明らかだと思う。
自動無音削除の仕組み
ほとんどのツールは、音量しきい値を下回り、最小時間より長い区間をスキャン。該当するものは短縮または削除。
ほぼすべてを制御する2つのノブ:
| 設定 | 役割 | 攻撃的すぎるとき… |
|---|---|---|
| しきい値 | どれだけ静かが無音か | 柔らかい発話と息がフラグされる |
| 最小時間 | 静かがどれだけ続けば切るか | 短い自然な間が削除される |
一部のエディタはパディング(各カットの前後に X ms 保持)を追加。パディングがタイトなペーシングとぎこちないペーシングを分けることが多い。audioeditor.pro では、全エピソードに死に空気削除を実行する前に短いクリップでしきい値とパディングを調整できる。

しきい値の下に静かなル ームトーン、尾の「s」、または「the」の始まりがあると、ツールがそれらを食う。それが無音削除がぎこちなく聞こえる主な理由。

しきい値が高すぎる
高すぎるしきい値は静かな音声を無音として扱う。
よくある犠牲者:
- レベルが落ちる語尾
- リモートマイクの柔らかい話者
- 低音量の破裂音(「p」「t」「k」)
- フレーズ間のルームトーンの落ち込み
話しポッドキャストの出発点: クリーンな声トラックでおよそ -40 dB から -45 dB。ノイジーな部屋はしきい値を下げ(より負の数)、ルームのヒスを発話と誤認しないように。
クイックテスト: パス後に音節全体が消えたら、しきい値を下げる。長い空の隙間が残ったら、わずかに上げるか最小時間を下げる。
最小時間が低すぎる
自然な発話にはマイクロポーズが必要。200 ms 未満のすべての隙間を削除すると、すべてのフィラー語を削除 するのと同じロボット的な急ぎを生む。
実用的な最小値:
- インタビューとカジュアルポッドキャストに 300〜500 ms
- ホストが難しい質問で考えるなら 500〜800 ms
- 800 ms 以上は明らかな死に空気を狙い、リズムではないときだけ
2〜3 秒を超える死に空気は短縮してよいことが多い。半秒未満の間はしばしばパフォーマンスの一部。
パディングがきつすぎるか欠けている
正しいカットでも息の尾が残らなければぎこちなく聞こえる。
目標:
- 次の語の前に 80〜120 ms(子音の立ち上がりを保護)
- 前の語の後に 150〜250 ms(文を解決させる)
高エネルギーの短尺コンテンツはよりタイト(40〜80 ms)にできる。長尺インタビューはより多くの余地が必要。

これは ジャンプカットを避ける ことと重なる:隙間を削除するだけでなく遷移時間を保つ。
波形が嘘をつくとき
波形はまだ重要な音声がある場所で空に見える。フラットな線に隠れるもの:
- 次の文の前の柔らかい吸気
- 話者間のルームトーンのシフト
- 次の語の最初の数ミリ秒
自動削除の後は必ず聴く。タイムライン表示だけから出荷しない。audioeditor.pro では、エクスポート前にタイムラインでトリムした接合部をスクラブし、フラットな波形に隠れる切れた音節を捕まえる。
ヘッドホンで 1x で1分通し再生。急いだと感じたら、最悪のセクションで間を戻してからグローバル設定をいじる。
削除ではなく短縮
すべての隙間をゼロにすべきではない。
2秒の思考の間には:
- 完全削 除の代わりに 400〜600 ms に短縮
- ナラティブコンテンツのドラマチックな間を保持
- 二人インタビューの往復リズムを残す
長いインタビューを短くする と、構造編集が大きな穴を先に削除。無音削除は残りを引き締めるべきで、意図的に残したストーリービートと戦うべきではない。
カットポイントのクリック
攻撃的な無音トリムは、波形がサイクル途中で切られると クリックとポップ も起こしうる。パス後にチックが聞こえたら:
- 接合部に 10〜20 ms クロスフェードを追加
- 最もノイジーなカットでパディングを延長
- 活発な発話の中に当たるトリムを取り消す
録音タイプ別設定
| フォーマット | しきい値開始 | 最小時間 | パディングメモ |
|---|---|---|---|
| ソロポッドキャスト | -40〜-45 dB | 400〜600 ms | 中程度の尾 |
| リモートインタビュー | -38〜-42 dB | 500〜800 ms | 柔らかいゲストに注意 |
| ナラティブ / ストーリー | -42〜-48 dB | 800 ms+ | ドラマチックな間を保持 |
| ノイジーな部屋 | 先にノイズ修正 | 500 ms+ | 語のクリッピングリスク高 |
ノイジーな録音は攻撃的な無音削除の前にクリーンアップまたはエンハンスが必要。そうでなければツールがヒスを発話と、発話を無音と混同する。
すでにぎこちなく聞こえるときの復旧ワークフロー
- 最後の無音パスを取り消すか、トリム前バージョンに戻す。
- 最小時間を 200 ms 上げ、しきい値を 3〜5 dB 下げる。
- 一章または5分クリップでテスト再実行。
- 感情的または面白いビートで最も長く削除された間を復元。
- 1x で通し聴き。最悪の1分だけ手動修正。
手動復元は、同じ攻撃的プリセットを2回実行するより良い。

予防チェックリスト
- 無音検出の前にノイジーな音声をクリーンまたはエンハンス。
- 中程度のしきい値(-40 dB 付近)と 400 ms 以上の最小から始める。
- 語の始まりと終わりが生き残るパディングを使う。
- 長い死に空気を短縮。短い思考の間は保持。
- 各自動パス後に 1x で聴く。
- 接合部でチックが聞こえたらマイクロクロスフェードを追加。
無音削除はペーシングを引き締めるべきで、人間の話し方を消すべきではない。設定が息、尾、文脈を尊重すれば、死に空気は消え、声は信じられるまま。
FAQ
ぎこちない無音削除の原因は?
たいていしきい値が高すぎ(柔らかい発話を無音扱い)、最小時間が低すぎ(自然な間を削除)、またはカットポイントのパディング不足。
ポッドキャストのしきい値はどこから?
クリーンな声トラックでおよそ -40 dB から -45 dB。音節が消えたらしきい値を下げ、長い死に空気が残ったらわずかに上げる 。
インタビューで安全な最小無音時間は?
カジュアル番組ではしばしば 300〜500 ms、ホストが考えるなら 500〜800 ms。200 ms 未満のすべての隙間をトリムしない。
間を完全削除すべきか短縮すべきか?
可能なら長い思考の間をゼロにせず 400〜600 ms に短縮。ナラティブではドラマチックなビートを保持。
すでにぎこちしければ?
パスを取り消し、最小時間を約 200 ms 上げ、しきい値を 3〜5 dB 下げ、5分でテストし、主要な感情的間を手動復元。
