-
OpenAI Whisper 教程:Whisper – 转录和二值化(说话人识别)
什么是耳语? Whisper 是来自 OpenAI 的最先进的语音识别系统,它已经接受了 680,000 小时从网络收集的多语言和多任务监督数据的训练。这个庞大而多样化的数据集提高了对口音、背景噪音和技术语言的鲁棒性。此外,它还支持多种语言的转录,以及将这些语言翻译成英语。OpenAI 发布了模型和代码,作为构建利用语音识别的有用应用程序的基础。 Whisper 的一大缺点是,它无法告诉您谁在对话…- 25
- 0