Merge pull request #579 from snakers4/adamnsandle

fx https://github.com/snakers4/silero-vad/issues/576
2026-02-05 18:09:22 +08:00 · 2024-11-22 11:18:26 +03:00
parent 93b9782f28 782e30d28f
commit f356a8081a
1 changed files with 3 additions and 2 deletions
--- a/src/silero_vad/utils_vad.py
+++ b/src/silero_vad/utils_vad.py
@@ -376,9 +376,10 @@ def get_speech_timestamps(audio: torch.Tensor,
            speech['end'] = int(min(audio_length_samples, speech['end'] + speech_pad_samples))

    if return_seconds:
+        audio_length_seconds = audio_length_samples / sampling_rate
        for speech_dict in speeches:
-            speech_dict['start'] = round(speech_dict['start'] / sampling_rate, 1)
-            speech_dict['end'] = round(speech_dict['end'] / sampling_rate, 1)
+            speech_dict['start'] = max(round(speech_dict['start'] / sampling_rate, 1), 0)
+            speech_dict['end'] = min(round(speech_dict['end'] / sampling_rate, 1), audio_length_seconds)
    elif step > 1:
        for speech_dict in speeches:
            speech_dict['start'] *= step