这是一个AI文字语音处理网站,提供Whisper(OpenAI)自动语音识别系统的信息。
Whisper是由OpenAI开发的自动语音识别系统,训练集包括68万小时的多语言和多任务监督数据。使用如此大而多样的数据集可以提高对口音、背景噪音和技术语言的鲁棒性。该模型可在GitHub上使用,可以执行多语言语音识别、语音翻译和语言识别。OpenAI还提供了Whisper和ChatGPT模型的API,并且他们有一个博客,介绍最新的项目和研究。
TTS-Voice-Wizard是一个Github存储库,为用户提供了一些可访问性功能,以改善他们在VRChat中的体验。它包括语音识别和文本转语音的方法,并且也可以在VRChat之外使用。Github Wiki...
Novels AI是一家提供AI生成的音频冒险故事的网站,包括各种类型的可定制角色和情节选择。
BibiGPT哔哔终结者是一款总结音视频内容的工具,可以从Bilibili、YouTube、播客、会议和本地文件等多个来源总结内容概要。
LOVO AI是一款AI语音生成器和文字转语音平台,可为创作者节省90%的时间和预算。它使用领先的AI技术提供优质的结果。随着语音AI发展的速度,可能性是无限的。LOVO AI总部位于加州伯...
Nuro.video是一个AI视频编辑软件,可帮助用户将10小时的未编辑原始视频素材转化为具有标题,过渡和动画的完全编辑好的专业视频。用户可以申请邀请来测试软件,并加入VIP等待列表。...
Krisp是一个噪声抵消应用程序,通过AI技术提高在线会议的生产效率。它提供免费版,被全球最大的品牌所信任。