Musenet (OpenAI)是一个基于深度神经网络的生成模型,可生成长度为4分钟,包含10种不同乐器和多种风格的音乐作品。该模型使用了类似于GPT-2的无监督学习方法,通过学习预测数十万...
Musenet (OpenAI)是基于深度神经网络的生成模型,可生成长度为4分钟,包含10种不同乐器和多种风格的音乐作品。它的生成方式是通过计算所有可能的音符和乐器的概率,从而生成每个音符。但是,当音乐风格和乐器选择不太常见时,如肖邦与低音和鼓的搭配,模型可能会出现一些问题。该模型已被OpenAI的研究索引收录。
Revocalize AI是一个提供基于人工智能的服务来克隆、保护和创建无需歌唱技能的独特声音轨的网站。网站提供了一个私人测试版,并提供超过450种语言的70多种语音。定价包括免费版和...
Hanami live translator是一个实时翻译工具,可捕捉来自Windows扬声器或麦克风的任何音频并将其翻译成所需的语言。
TTS-Voice-Wizard是一个Github存储库,为用户提供了一些可访问性功能,以改善他们在VRChat中的体验。它包括语音识别和文本转语音的方法,并且也可以在VRChat之外使用。Github Wiki...
Dumme是一个短视频生成和上传网站,提供字幕、标题和描述功能。
AI Voice Detector是提供语音验证服务的网站,用于检测AI生成的声音并确保其真实性。
Article.Audio是一个将文章转...