Merge pull request #199 from snakers4/adamnsandle

fx end of chunk may exceed audio length
2026-02-05 18:09:22 +08:00 · 2022-06-02 13:40:42 +03:00
parent 900c71a109 8eba346bc9
commit 7c671a75c2
1 changed files with 2 additions and 2 deletions
--- a/utils_vad.py
+++ b/utils_vad.py
@@ -252,8 +252,8 @@ def get_speech_timestamps(audio: torch.Tensor,
                speech['end'] += int(silence_duration // 2)
                speeches[i+1]['start'] = int(max(0, speeches[i+1]['start'] - silence_duration // 2))
            else:
-                speech['end'] += int(speech_pad_samples)
-                speeches[i+1]['start'] -= int(speech_pad_samples)
+                speech['end'] = int(min(audio_length_samples, speech['end'] + speech_pad_samples))
+                speeches[i+1]['start'] = int(max(0, speeches[i+1]['start'] - speech_pad_samples))
        else:
            speech['end'] = int(min(audio_length_samples, speech['end'] + speech_pad_samples))