使用本機資源做語音轉文字: Whisper 地端版

Cheng Lin Tsai
Nov 29, 2023

--

  1. 下載網站:https://github.com/Const-me/Whisper/releases
  2. 下載 WhisperDesktop.zip 檔案,解壓縮後雙擊 WhisperDesktop.exe

3. 點”其他資訊” → 仍要執行

4. Huggingface 網站下載模型,在速度與正確率權衡下選擇 ggml-medium.bin 會是較佳選擇 (模型越大速度越慢,正確率越高,最大模型轉錄時間甚至會比錄音時間久),電腦有 GPU 佳速度相較快速。

5. Model Path 點三個點選下載後的 ggml-medium.bin 路徑,Model Implementation 選GPU。

6. Advanced 選項內 Graphic adapter 選擇 GPU,如果沒有選預設,點選 OK

7. Language:選 Chinese 轉錄為中文,如果需要翻譯為英文請勾選 Translate。

7.1 Transcribe File:選擇錄音檔位置

7.2 Output Format:Text file(文字檔), Text with timestamps (帶時間戳的文字), SubRip subtitle 字幕 (標準的字幕格式時段+文字), WebVTT(Web Video Text Tracks)字幕是一種用於在網絡上顯示字幕的標準格式。

8. 設定輸出路徑,設定好點 Transcribe 等待轉錄完成

Mac:MacWhisper

🎙️ MacWhisper (gumroad.com)

Reference:

https://github.com/Const-me/Whisper

https://github.com/ggerganov/whisper.cpp

https://github.com/chenxwh/insanely-fast-whisper

--

--