From ac86c5bc529f79977f0cb845105b68384a1e0296 Mon Sep 17 00:00:00 2001 From: adamnsandle Date: Thu, 15 Apr 2021 14:12:30 +0000 Subject: [PATCH] clear out --- silero-vad.ipynb | 350 +++++------------------------------------------ 1 file changed, 34 insertions(+), 316 deletions(-) diff --git a/silero-vad.ipynb b/silero-vad.ipynb index 89babc3..7d40db1 100644 --- a/silero-vad.ipynb +++ b/silero-vad.ipynb @@ -34,36 +34,16 @@ }, { "cell_type": "code", - "execution_count": 1, + "execution_count": null, "metadata": { "ExecuteTime": { "end_time": "2020-12-30T17:35:43.397137Z", "start_time": "2020-12-30T17:33:10.962078Z" }, - "colab": { - "base_uri": "https://localhost:8080/" - }, "hidden": true, - "id": "5w5AkskZ2Fwr", - "outputId": "545c0988-965d-4462-eb06-d4c5a48d8969" + "id": "5w5AkskZ2Fwr" }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "\u001b[?25l\r\u001b[K |▏ | 10kB 16.5MB/s eta 0:00:01\r\u001b[K |▍ | 20kB 20.7MB/s eta 0:00:01\r\u001b[K |▌ | 30kB 23.6MB/s eta 0:00:01\r\u001b[K |▊ | 40kB 24.5MB/s eta 0:00:01\r\u001b[K |▉ | 51kB 25.9MB/s eta 0:00:01\r\u001b[K |█ | 61kB 23.6MB/s eta 0:00:01\r\u001b[K |█▏ | 71kB 19.5MB/s eta 0:00:01\r\u001b[K |█▍ | 81kB 20.3MB/s eta 0:00:01\r\u001b[K |█▌ | 92kB 18.4MB/s eta 0:00:01\r\u001b[K |█▊ | 102kB 17.6MB/s eta 0:00:01\r\u001b[K |█▉ | 112kB 17.6MB/s eta 0:00:01\r\u001b[K |██ | 122kB 17.6MB/s eta 0:00:01\r\u001b[K |██▏ | 133kB 17.6MB/s eta 0:00:01\r\u001b[K |██▍ | 143kB 17.6MB/s eta 0:00:01\r\u001b[K |██▌ | 153kB 17.6MB/s eta 0:00:01\r\u001b[K |██▊ | 163kB 17.6MB/s eta 0:00:01\r\u001b[K |██▉ | 174kB 17.6MB/s eta 0:00:01\r\u001b[K |███ | 184kB 17.6MB/s eta 0:00:01\r\u001b[K |███▏ | 194kB 17.6MB/s eta 0:00:01\r\u001b[K |███▍ | 204kB 17.6MB/s eta 0:00:01\r\u001b[K |███▌ | 215kB 17.6MB/s eta 0:00:01\r\u001b[K |███▊ | 225kB 17.6MB/s eta 0:00:01\r\u001b[K |███▉ | 235kB 17.6MB/s eta 0:00:01\r\u001b[K |████ | 245kB 17.6MB/s eta 0:00:01\r\u001b[K |████▏ | 256kB 17.6MB/s eta 0:00:01\r\u001b[K |████▍ | 266kB 17.6MB/s eta 0:00:01\r\u001b[K |████▌ | 276kB 17.6MB/s eta 0:00:01\r\u001b[K |████▊ | 286kB 17.6MB/s eta 0:00:01\r\u001b[K |█████ | 296kB 17.6MB/s eta 0:00:01\r\u001b[K |█████ | 307kB 17.6MB/s eta 0:00:01\r\u001b[K |█████▎ | 317kB 17.6MB/s eta 0:00:01\r\u001b[K |█████▍ | 327kB 17.6MB/s eta 0:00:01\r\u001b[K |█████▋ | 337kB 17.6MB/s eta 0:00:01\r\u001b[K |█████▊ | 348kB 17.6MB/s eta 0:00:01\r\u001b[K |██████ | 358kB 17.6MB/s eta 0:00:01\r\u001b[K |██████ | 368kB 17.6MB/s eta 0:00:01\r\u001b[K |██████▎ | 378kB 17.6MB/s eta 0:00:01\r\u001b[K |██████▍ | 389kB 17.6MB/s eta 0:00:01\r\u001b[K |██████▋ | 399kB 17.6MB/s eta 0:00:01\r\u001b[K |██████▊ | 409kB 17.6MB/s eta 0:00:01\r\u001b[K |███████ | 419kB 17.6MB/s eta 0:00:01\r\u001b[K |███████ | 430kB 17.6MB/s eta 0:00:01\r\u001b[K |███████▎ | 440kB 17.6MB/s eta 0:00:01\r\u001b[K |███████▍ | 450kB 17.6MB/s eta 0:00:01\r\u001b[K |███████▋ | 460kB 17.6MB/s eta 0:00:01\r\u001b[K |███████▊ | 471kB 17.6MB/s eta 0:00:01\r\u001b[K |████████ | 481kB 17.6MB/s eta 0:00:01\r\u001b[K |████████ | 491kB 17.6MB/s eta 0:00:01\r\u001b[K |████████▎ | 501kB 17.6MB/s eta 0:00:01\r\u001b[K |████████▍ | 512kB 17.6MB/s eta 0:00:01\r\u001b[K |████████▋ | 522kB 17.6MB/s eta 0:00:01\r\u001b[K |████████▊ | 532kB 17.6MB/s eta 0:00:01\r\u001b[K |█████████ | 542kB 17.6MB/s eta 0:00:01\r\u001b[K |█████████ | 552kB 17.6MB/s eta 0:00:01\r\u001b[K |█████████▎ | 563kB 17.6MB/s eta 0:00:01\r\u001b[K |█████████▌ | 573kB 17.6MB/s eta 0:00:01\r\u001b[K |█████████▋ | 583kB 17.6MB/s eta 0:00:01\r\u001b[K |█████████▉ | 593kB 17.6MB/s eta 0:00:01\r\u001b[K |██████████ | 604kB 17.6MB/s eta 0:00:01\r\u001b[K |██████████▏ | 614kB 17.6MB/s eta 0:00:01\r\u001b[K |██████████▎ | 624kB 17.6MB/s eta 0:00:01\r\u001b[K |██████████▌ | 634kB 17.6MB/s eta 0:00:01\r\u001b[K |██████████▋ | 645kB 17.6MB/s eta 0:00:01\r\u001b[K |██████████▉ | 655kB 17.6MB/s eta 0:00:01\r\u001b[K |███████████ | 665kB 17.6MB/s eta 0:00:01\r\u001b[K |███████████▏ | 675kB 17.6MB/s eta 0:00:01\r\u001b[K |███████████▎ | 686kB 17.6MB/s eta 0:00:01\r\u001b[K |███████████▌ | 696kB 17.6MB/s eta 0:00:01\r\u001b[K |███████████▋ | 706kB 17.6MB/s eta 0:00:01\r\u001b[K |███████████▉ | 716kB 17.6MB/s eta 0:00:01\r\u001b[K |████████████ | 727kB 17.6MB/s eta 0:00:01\r\u001b[K |████████████▏ | 737kB 17.6MB/s eta 0:00:01\r\u001b[K |████████████▎ | 747kB 17.6MB/s eta 0:00:01\r\u001b[K |████████████▌ | 757kB 17.6MB/s eta 0:00:01\r\u001b[K |████████████▋ | 768kB 17.6MB/s eta 0:00:01\r\u001b[K |████████████▉ | 778kB 17.6MB/s eta 0:00:01\r\u001b[K |█████████████ | 788kB 17.6MB/s eta 0:00:01\r\u001b[K |█████████████▏ | 798kB 17.6MB/s eta 0:00:01\r\u001b[K |█████████████▎ | 808kB 17.6MB/s eta 0:00:01\r\u001b[K |█████████████▌ | 819kB 17.6MB/s eta 0:00:01\r\u001b[K |█████████████▋ | 829kB 17.6MB/s eta 0:00:01\r\u001b[K |█████████████▉ | 839kB 17.6MB/s eta 0:00:01\r\u001b[K |██████████████ | 849kB 17.6MB/s eta 0:00:01\r\u001b[K |██████████████▏ | 860kB 17.6MB/s eta 0:00:01\r\u001b[K |██████████████▍ | 870kB 17.6MB/s eta 0:00:01\r\u001b[K |██████████████▌ | 880kB 17.6MB/s eta 0:00:01\r\u001b[K |██████████████▊ | 890kB 17.6MB/s eta 0:00:01\r\u001b[K |██████████████▉ | 901kB 17.6MB/s eta 0:00:01\r\u001b[K |███████████████ | 911kB 17.6MB/s eta 0:00:01\r\u001b[K |███████████████▏ | 921kB 17.6MB/s eta 0:00:01\r\u001b[K |███████████████▍ | 931kB 17.6MB/s eta 0:00:01\r\u001b[K |███████████████▌ | 942kB 17.6MB/s eta 0:00:01\r\u001b[K |███████████████▊ | 952kB 17.6MB/s eta 0:00:01\r\u001b[K |███████████████▉ | 962kB 17.6MB/s eta 0:00:01\r\u001b[K |████████████████ | 972kB 17.6MB/s eta 0:00:01\r\u001b[K |████████████████▏ | 983kB 17.6MB/s eta 0:00:01\r\u001b[K |████████████████▍ | 993kB 17.6MB/s eta 0:00:01\r\u001b[K |████████████████▌ | 1.0MB 17.6MB/s eta 0:00:01\r\u001b[K |████████████████▊ | 1.0MB 17.6MB/s eta 0:00:01\r\u001b[K |████████████████▉ | 1.0MB 17.6MB/s eta 0:00:01\r\u001b[K |█████████████████ | 1.0MB 17.6MB/s eta 0:00:01\r\u001b[K |█████████████████▏ | 1.0MB 17.6MB/s eta 0:00:01\r\u001b[K |█████████████████▍ | 1.1MB 17.6MB/s eta 0:00:01\r\u001b[K |█████████████████▌ | 1.1MB 17.6MB/s eta 0:00:01\r\u001b[K |█████████████████▊ | 1.1MB 17.6MB/s eta 0:00:01\r\u001b[K |█████████████████▉ | 1.1MB 17.6MB/s eta 0:00:01\r\u001b[K |██████████████████ | 1.1MB 17.6MB/s eta 0:00:01\r\u001b[K |██████████████████▏ | 1.1MB 17.6MB/s eta 0:00:01\r\u001b[K |██████████████████▍ | 1.1MB 17.6MB/s eta 0:00:01\r\u001b[K |██████████████████▌ | 1.1MB 17.6MB/s eta 0:00:01\r\u001b[K |██████████████████▊ | 1.1MB 17.6MB/s eta 0:00:01\r\u001b[K |███████████████████ | 1.1MB 17.6MB/s eta 0:00:01\r\u001b[K |███████████████████ | 1.2MB 17.6MB/s eta 0:00:01\r\u001b[K |███████████████████▎ | 1.2MB 17.6MB/s eta 0:00:01\r\u001b[K |███████████████████▍ | 1.2MB 17.6MB/s eta 0:00:01\r\u001b[K |███████████████████▋ | 1.2MB 17.6MB/s eta 0:00:01\r\u001b[K |███████████████████▊ | 1.2MB 17.6MB/s eta 0:00:01\r\u001b[K |████████████████████ | 1.2MB 17.6MB/s eta 0:00:01\r\u001b[K |████████████████████ | 1.2MB 17.6MB/s eta 0:00:01\r\u001b[K |████████████████████▎ | 1.2MB 17.6MB/s eta 0:00:01\r\u001b[K |████████████████████▍ | 1.2MB 17.6MB/s eta 0:00:01\r\u001b[K |████████████████████▋ | 1.2MB 17.6MB/s eta 0:00:01\r\u001b[K |████████████████████▊ | 1.3MB 17.6MB/s eta 0:00:01\r\u001b[K |█████████████████████ | 1.3MB 17.6MB/s eta 0:00:01\r\u001b[K |█████████████████████ | 1.3MB 17.6MB/s eta 0:00:01\r\u001b[K |█████████████████████▎ | 1.3MB 17.6MB/s eta 0:00:01\r\u001b[K |█████████████████████▍ | 1.3MB 17.6MB/s eta 0:00:01\r\u001b[K |█████████████████████▋ | 1.3MB 17.6MB/s eta 0:00:01\r\u001b[K |█████████████████████▊ | 1.3MB 17.6MB/s eta 0:00:01\r\u001b[K |██████████████████████ | 1.3MB 17.6MB/s eta 0:00:01\r\u001b[K |██████████████████████ | 1.3MB 17.6MB/s eta 0:00:01\r\u001b[K |██████████████████████▎ | 1.4MB 17.6MB/s eta 0:00:01\r\u001b[K |██████████████████████▍ | 1.4MB 17.6MB/s eta 0:00:01\r\u001b[K |██████████████████████▋ | 1.4MB 17.6MB/s eta 0:00:01\r\u001b[K |██████████████████████▊ | 1.4MB 17.6MB/s eta 0:00:01\r\u001b[K |███████████████████████ | 1.4MB 17.6MB/s eta 0:00:01\r\u001b[K |███████████████████████ | 1.4MB 17.6MB/s eta 0:00:01\r\u001b[K |███████████████████████▎ | 1.4MB 17.6MB/s eta 0:00:01\r\u001b[K |███████████████████████▌ | 1.4MB 17.6MB/s eta 0:00:01\r\u001b[K |███████████████████████▋ | 1.4MB 17.6MB/s eta 0:00:01\r\u001b[K |███████████████████████▉ | 1.4MB 17.6MB/s eta 0:00:01\r\u001b[K |████████████████████████ | 1.5MB 17.6MB/s eta 0:00:01\r\u001b[K |████████████████████████▏ | 1.5MB 17.6MB/s eta 0:00:01\r\u001b[K |████████████████████████▎ | 1.5MB 17.6MB/s eta 0:00:01\r\u001b[K |████████████████████████▌ | 1.5MB 17.6MB/s eta 0:00:01\r\u001b[K |████████████████████████▋ | 1.5MB 17.6MB/s eta 0:00:01\r\u001b[K |████████████████████████▉ | 1.5MB 17.6MB/s eta 0:00:01\r\u001b[K |█████████████████████████ | 1.5MB 17.6MB/s eta 0:00:01\r\u001b[K |█████████████████████████▏ | 1.5MB 17.6MB/s eta 0:00:01\r\u001b[K |█████████████████████████▎ | 1.5MB 17.6MB/s eta 0:00:01\r\u001b[K |█████████████████████████▌ | 1.5MB 17.6MB/s eta 0:00:01\r\u001b[K |█████████████████████████▋ | 1.6MB 17.6MB/s eta 0:00:01\r\u001b[K |█████████████████████████▉ | 1.6MB 17.6MB/s eta 0:00:01\r\u001b[K |██████████████████████████ | 1.6MB 17.6MB/s eta 0:00:01\r\u001b[K |██████████████████████████▏ | 1.6MB 17.6MB/s eta 0:00:01\r\u001b[K |██████████████████████████▎ | 1.6MB 17.6MB/s eta 0:00:01\r\u001b[K |██████████████████████████▌ | 1.6MB 17.6MB/s eta 0:00:01\r\u001b[K |██████████████████████████▋ | 1.6MB 17.6MB/s eta 0:00:01\r\u001b[K |██████████████████████████▉ | 1.6MB 17.6MB/s eta 0:00:01\r\u001b[K |███████████████████████████ | 1.6MB 17.6MB/s eta 0:00:01\r\u001b[K |███████████████████████████▏ | 1.6MB 17.6MB/s eta 0:00:01\r\u001b[K |███████████████████████████▎ | 1.7MB 17.6MB/s eta 0:00:01\r\u001b[K |███████████████████████████▌ | 1.7MB 17.6MB/s eta 0:00:01\r\u001b[K |███████████████████████████▋ | 1.7MB 17.6MB/s eta 0:00:01\r\u001b[K |███████████████████████████▉ | 1.7MB 17.6MB/s eta 0:00:01\r\u001b[K |████████████████████████████ | 1.7MB 17.6MB/s eta 0:00:01\r\u001b[K |████████████████████████████▏ | 1.7MB 17.6MB/s eta 0:00:01\r\u001b[K |████████████████████████████▍ | 1.7MB 17.6MB/s eta 0:00:01\r\u001b[K |████████████████████████████▌ | 1.7MB 17.6MB/s eta 0:00:01\r\u001b[K |████████████████████████████▊ | 1.7MB 17.6MB/s eta 0:00:01\r\u001b[K |████████████████████████████▉ | 1.8MB 17.6MB/s eta 0:00:01\r\u001b[K |█████████████████████████████ | 1.8MB 17.6MB/s eta 0:00:01\r\u001b[K |█████████████████████████████▏ | 1.8MB 17.6MB/s eta 0:00:01\r\u001b[K |█████████████████████████████▍ | 1.8MB 17.6MB/s eta 0:00:01\r\u001b[K |█████████████████████████████▌ | 1.8MB 17.6MB/s eta 0:00:01\r\u001b[K |█████████████████████████████▊ | 1.8MB 17.6MB/s eta 0:00:01\r\u001b[K |█████████████████████████████▉ | 1.8MB 17.6MB/s eta 0:00:01\r\u001b[K |██████████████████████████████ | 1.8MB 17.6MB/s eta 0:00:01\r\u001b[K |██████████████████████████████▏ | 1.8MB 17.6MB/s eta 0:00:01\r\u001b[K |██████████████████████████████▍ | 1.8MB 17.6MB/s eta 0:00:01\r\u001b[K |██████████████████████████████▌ | 1.9MB 17.6MB/s eta 0:00:01\r\u001b[K |██████████████████████████████▊ | 1.9MB 17.6MB/s eta 0:00:01\r\u001b[K |██████████████████████████████▉ | 1.9MB 17.6MB/s eta 0:00:01\r\u001b[K |███████████████████████████████ | 1.9MB 17.6MB/s eta 0:00:01\r\u001b[K |███████████████████████████████▏| 1.9MB 17.6MB/s eta 0:00:01\r\u001b[K |███████████████████████████████▍| 1.9MB 17.6MB/s eta 0:00:01\r\u001b[K |███████████████████████████████▌| 1.9MB 17.6MB/s eta 0:00:01\r\u001b[K |███████████████████████████████▊| 1.9MB 17.6MB/s eta 0:00:01\r\u001b[K |███████████████████████████████▉| 1.9MB 17.6MB/s eta 0:00:01\r\u001b[K |████████████████████████████████| 1.9MB 17.6MB/s \n", - "\u001b[?25h" - ] - }, - { - "name": "stderr", - "output_type": "stream", - "text": [ - "Downloading: \"https://github.com/snakers4/silero-vad/archive/master.zip\" to /root/.cache/torch/hub/master.zip\n" - ] - } - ], + "outputs": [], "source": [ "#@title Install and Import Dependencies\n", "\n", @@ -115,43 +95,16 @@ }, { "cell_type": "code", - "execution_count": 2, + "execution_count": null, "metadata": { "ExecuteTime": { "end_time": "2020-12-30T17:35:44.362860Z", "start_time": "2020-12-30T17:35:43.398441Z" }, - "colab": { - "base_uri": "https://localhost:8080/" - }, "hidden": true, - "id": "aI_eydBPjsrx", - "outputId": "17d317e6-ec8c-46a2-c5ec-682c1391e58d" + "id": "aI_eydBPjsrx" }, - "outputs": [ - { - "name": "stderr", - "output_type": "stream", - "text": [ - "/usr/local/lib/python3.7/dist-packages/torch/nn/modules/module.py:889: UserWarning: stft will soon require the return_complex parameter be given for real inputs, and will further require that return_complex=True in a future PyTorch release. (Triggered internally at /pytorch/aten/src/ATen/native/SpectralOps.cpp:639.)\n", - " result = self.forward(*input, **kwargs)\n" - ] - }, - { - "name": "stdout", - "output_type": "stream", - "text": [ - "[{'end': 35000, 'start': 0},\n", - " {'end': 112000, 'start': 35000},\n", - " {'end': 124000, 'start': 112000},\n", - " {'end': 320000, 'start': 143000},\n", - " {'end': 628000, 'start': 319000},\n", - " {'end': 752000, 'start': 632000},\n", - " {'end': 801000, 'start': 775000},\n", - " {'end': 960000, 'start': 811000}]\n" - ] - } - ], + "outputs": [], "source": [ "wav = read_audio(f'{files_dir}/en.wav')\n", "# get speech timestamps from full audio file\n", @@ -191,37 +144,12 @@ }, { "cell_type": "code", - "execution_count": 3, + "execution_count": null, "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, "hidden": true, - "id": "SQOtu2Vl2Fwt", - "outputId": "3a560cf3-a882-4db7-ad7e-0ab9bf1a9698" + "id": "SQOtu2Vl2Fwt" }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "[{'end': 35000, 'start': 0},\n", - " {'end': 112000, 'start': 35500},\n", - " {'end': 246000, 'start': 142500},\n", - " {'end': 288500, 'start': 251500},\n", - " {'end': 315500, 'start': 289500},\n", - " {'end': 603500, 'start': 318000},\n", - " {'end': 623000, 'start': 606500},\n", - " {'end': 713000, 'start': 631000},\n", - " {'end': 728500, 'start': 712000},\n", - " {'end': 748500, 'start': 726500},\n", - " {'end': 798500, 'start': 775000},\n", - " {'end': 899500, 'start': 811000},\n", - " {'end': 914000, 'start': 897000},\n", - " {'end': 962000, 'start': 913000}]\n" - ] - } - ], + "outputs": [], "source": [ "wav = read_audio(f'{files_dir}/en.wav')\n", "# get speech timestamps from full audio file\n", @@ -271,44 +199,16 @@ }, { "cell_type": "code", - "execution_count": 4, + "execution_count": null, "metadata": { "ExecuteTime": { "end_time": "2020-12-15T13:09:59.199321Z", "start_time": "2020-12-15T13:09:59.196823Z" }, - "colab": { - "base_uri": "https://localhost:8080/" - }, "hidden": true, - "id": "q-lql_2Wjsry", - "outputId": "ada632d4-eaba-475e-b00c-fa8238411792" + "id": "q-lql_2Wjsry" }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "[{4000: 'start'}]\n", - "[{39000: 'end'}]\n", - "[{43000: 'start'}]\n", - "[{115500: 'end'}]\n", - "[{121500: 'start'}]\n", - "[{127500: 'end'}]\n", - "[{150500: 'start'}]\n", - "[{291000: 'end'}]\n", - "[{295000: 'start'}]\n", - "[{322000: 'end'}]\n", - "[{326500: 'start'}]\n", - "[{631500: 'end'}]\n", - "[{640500: 'start'}]\n", - "[{755000: 'end'}]\n", - "[{782500: 'start'}]\n", - "[{804500: 'end'}]\n", - "[{818500: 'start'}]\n" - ] - } - ], + "outputs": [], "source": [ "wav = f'{files_dir}/en.wav'\n", "\n", @@ -329,47 +229,12 @@ }, { "cell_type": "code", - "execution_count": 5, + "execution_count": null, "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, "hidden": true, - "id": "BX3UgwwB2Fwv", - "outputId": "8d704639-6f3e-4520-d6ac-7ac988265286" + "id": "BX3UgwwB2Fwv" }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "[{2000: 'start'}]\n", - "[{40000: 'end'}]\n", - "[{44000: 'start'}]\n", - "[{115500: 'end'}]\n", - "[{151000: 'start'}]\n", - "[{251000: 'end'}]\n", - "[{260000: 'start'}]\n", - "[{291500: 'end'}]\n", - "[{298000: 'start'}]\n", - "[{320500: 'end'}]\n", - "[{326500: 'start'}]\n", - "[{612500: 'end'}]\n", - "[{615000: 'start'}]\n", - "[{628000: 'end'}]\n", - "[{639500: 'start'}]\n", - "[{718500: 'end'}]\n", - "[{720500: 'start'}]\n", - "[{755500: 'end'}]\n", - "[{783500: 'start'}]\n", - "[{805000: 'end'}]\n", - "[{819500: 'start'}]\n", - "[{902000: 'end'}]\n", - "[{905500: 'start'}]\n", - "[{921000: 'start'}]\n" - ] - } - ], + "outputs": [], "source": [ "wav = f'{files_dir}/en.wav'\n", "\n", @@ -664,37 +529,17 @@ }, { "cell_type": "code", - "execution_count": 6, + "execution_count": null, "metadata": { "ExecuteTime": { "end_time": "2021-04-15T13:30:22.938755Z", "start_time": "2021-04-15T13:30:20.970574Z" }, "cellView": "form", - "colab": { - "base_uri": "https://localhost:8080/" - }, "hidden": true, - "id": "Q4QIfSpprnkI", - "outputId": "119e85c9-bb9a-43bb-ae23-7d197b470096" + "id": "Q4QIfSpprnkI" }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "\u001b[K |████████████████████████████████| 4.1MB 19.5MB/s \n", - "\u001b[?25h" - ] - }, - { - "name": "stderr", - "output_type": "stream", - "text": [ - "Downloading: \"https://github.com/snakers4/silero-vad/archive/master.zip\" to /root/.cache/torch/hub/master.zip\n" - ] - } - ], + "outputs": [], "source": [ "#@title Install and Import Dependencies\n", "\n", @@ -759,35 +604,16 @@ }, { "cell_type": "code", - "execution_count": 7, + "execution_count": null, "metadata": { "ExecuteTime": { "end_time": "2021-04-15T13:30:14.475412Z", "start_time": "2021-04-15T13:30:14.427933Z" }, - "colab": { - "base_uri": "https://localhost:8080/" - }, "hidden": true, - "id": "krnGoA6Kjsr0", - "outputId": "edab010a-e066-42a0-9b4c-2ab2579b6b47" + "id": "krnGoA6Kjsr0" }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "[{'end': 33000, 'start': 0},\n", - " {'end': 112000, 'start': 35000},\n", - " {'end': 287000, 'start': 143000},\n", - " {'end': 317000, 'start': 287000},\n", - " {'end': 623000, 'start': 319000},\n", - " {'end': 752000, 'start': 632000},\n", - " {'end': 801000, 'start': 775000},\n", - " {'end': 960000, 'start': 811000}]\n" - ] - } - ], + "outputs": [], "source": [ "model = init_onnx_model(f'{files_dir}/model.onnx')\n", "wav = read_audio(f'{files_dir}/en.wav')\n", @@ -827,38 +653,12 @@ }, { "cell_type": "code", - "execution_count": 8, + "execution_count": null, "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, "hidden": true, - "id": "uIVs56rb2Fw2", - "outputId": "50ce9117-17d8-4bef-eb53-7204c56c4b7b" + "id": "uIVs56rb2Fw2" }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "[{'end': 35000, 'start': 0},\n", - " {'end': 112500, 'start': 34500},\n", - " {'end': 245000, 'start': 140000},\n", - " {'end': 286500, 'start': 251500},\n", - " {'end': 315000, 'start': 285000},\n", - " {'end': 527500, 'start': 316500},\n", - " {'end': 603500, 'start': 524500},\n", - " {'end': 623500, 'start': 606500},\n", - " {'end': 713000, 'start': 629500},\n", - " {'end': 738500, 'start': 711500},\n", - " {'end': 751000, 'start': 735000},\n", - " {'end': 797500, 'start': 772500},\n", - " {'end': 883000, 'start': 809000},\n", - " {'end': 914500, 'start': 897000},\n", - " {'end': 962000, 'start': 911500}]\n" - ] - } - ], + "outputs": [], "source": [ "model = init_onnx_model(f'{files_dir}/model.onnx')\n", "wav = read_audio(f'{files_dir}/en.wav')\n", @@ -877,22 +677,9 @@ "start_time": "2021-04-15T13:34:41.368055Z" }, "hidden": true, - "id": "cox6oumC2Fw3", - "outputId": "1c18d7b1-ae80-42cb-c2e1-b6494104e5f7" + "id": "cox6oumC2Fw3" }, - "outputs": [ - { - "ename": "NameError", - "evalue": "name 'save_audio' is not defined", - "output_type": "error", - "traceback": [ - "\u001b[0;31m\u001b[0m", - "\u001b[0;31mNameError\u001b[0mTraceback (most recent call last)", - "\u001b[0;32m\u001b[0m in \u001b[0;36m\u001b[0;34m\u001b[0m\n\u001b[1;32m 1\u001b[0m \u001b[0;31m# merge all speech chunks to one audio\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m----> 2\u001b[0;31m \u001b[0msave_audio\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m'only_speech.wav'\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mcollect_chunks\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mspeech_timestamps\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0mwav\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0;36m16000\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m 3\u001b[0m \u001b[0mAudio\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m'only_speech.wav'\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n", - "\u001b[0;31mNameError\u001b[0m: name 'save_audio' is not defined" - ] - } - ], + "outputs": [], "source": [ "# merge all speech chunks to one audio\n", "save_audio('only_speech.wav', collect_chunks(speech_timestamps, wav), 16000)\n", @@ -922,7 +709,7 @@ }, { "cell_type": "code", - "execution_count": 9, + "execution_count": null, "metadata": { "ExecuteTime": { "end_time": "2020-12-15T13:09:09.606031Z", @@ -939,44 +726,16 @@ }, { "cell_type": "code", - "execution_count": 10, + "execution_count": null, "metadata": { "ExecuteTime": { "end_time": "2020-12-15T13:09:11.453171Z", "start_time": "2020-12-15T13:09:09.633435Z" }, - "colab": { - "base_uri": "https://localhost:8080/" - }, "hidden": true, - "id": "NC6Jim0hjsr1", - "outputId": "4c48843d-8510-4d26-c546-220e22a85361" + "id": "NC6Jim0hjsr1" }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "[{4000: 'start'}]\n", - "[{37000: 'end'}]\n", - "[{43000: 'start'}]\n", - "[{115500: 'end'}]\n", - "[{150500: 'start'}]\n", - "[{291000: 'end'}]\n", - "[{294500: 'start'}]\n", - "[{321000: 'end'}]\n", - "[{326500: 'start'}]\n", - "[{627000: 'end'}]\n", - "[{639000: 'start'}]\n", - "[{718000: 'end'}]\n", - "[{721000: 'start'}]\n", - "[{755500: 'end'}]\n", - "[{783000: 'start'}]\n", - "[{804000: 'end'}]\n", - "[{818500: 'start'}]\n" - ] - } - ], + "outputs": [], "source": [ "for batch in single_audio_stream(model, wav, run_function=validate_onnx):\n", " if batch:\n", @@ -995,7 +754,7 @@ }, { "cell_type": "code", - "execution_count": 11, + "execution_count": null, "metadata": { "hidden": true, "id": "RZwc-Khk2Fw4" @@ -1008,53 +767,12 @@ }, { "cell_type": "code", - "execution_count": 12, + "execution_count": null, "metadata": { - "colab": { - "base_uri": "https://localhost:8080/" - }, "hidden": true, - "id": "Z4lzFPs02Fw4", - "outputId": "8d2f9cb4-dbc7-4c7c-dde1-ff3b3297aa07" + "id": "Z4lzFPs02Fw4" }, - "outputs": [ - { - "name": "stdout", - "output_type": "stream", - "text": [ - "[{0: 'start'}]\n", - "[{38000: 'end'}]\n", - "[{43000: 'start'}]\n", - "[{115000: 'end'}]\n", - "[{148500: 'start'}]\n", - "[{250500: 'end'}]\n", - "[{260000: 'start'}]\n", - "[{292000: 'end'}]\n", - "[{293500: 'start'}]\n", - "[{320000: 'end'}]\n", - "[{325000: 'start'}]\n", - "[{548000: 'end'}]\n", - "[{547500: 'start'}]\n", - "[{613000: 'end'}]\n", - "[{615000: 'start'}]\n", - "[{626500: 'end'}]\n", - "[{638000: 'start'}]\n", - "[{697500: 'start'}]\n", - "[{718000: 'end'}]\n", - "[{720000: 'start'}]\n", - "[{756000: 'end'}]\n", - "[{781000: 'start'}]\n", - "[{804500: 'end'}]\n", - "[{817500: 'start'}]\n", - "[{872000: 'end'}]\n", - "[{871000: 'start'}]\n", - "[{902000: 'end'}]\n", - "[{905500: 'start'}]\n", - "[{920500: 'end'}]\n", - "[{920000: 'start'}]\n" - ] - } - ], + "outputs": [], "source": [ "for batch in single_audio_stream(model, wav, iterator_type='adaptive', run_function=validate_onnx):\n", " if batch:\n",