17.5. Automatic Speech Recognition

17.5. Automatic Speech Recognition
上一页	第 17 章语音处理	下一页

         
docker run -it kaldiasr/kaldi:latest bash
docker run -it --runtime=nvidia kaldiasr/kaldi:gpu-latest bash

         
docker run -it kaldiasr/kaldi:latest bash

https://github.com/openai/whisper

         
import openai
audio_file= open("/path/to/file/audio.mp3", "rb")
transcript = openai.Audio.transcribe("whisper-1", audio_file)

上一页	上一级	下一页
17.4. AI文字转语音模型Bark	起始页	第 18 章视频