EmotiVoice - 网易有道开源强大且现代化的文本转语音引擎

大家好,又见面了,我是 GitHub 精选君!

背景介绍

在数字化语音的领域中,我们经常会遇到一个问题:怎么样能降低机器生成语音的机械性,增强情感色彩。比如在任何需要语音互动的场合,如智能语音助手、导航、儿童故事机、电台等,更真实且多样化的语音会极大提升用户体验。这就是我们需要解决的痛点。

今天要给大家推荐一个 GitHub 开源项目 netease-youdao/EmotiVoice,该项目在 GitHub 有差不多 1000 Star,用一句话介绍该项目就是:“EmotiVoice 😊: a Multi-Voice and Prompt-Controlled TTS Engine”。

以下是 EmotiVoice 生成的一些示例:

~/Downloads/EmotiVoice-1.mp4

~/Downloads/EmotiVoice-2.mp4

项目介绍

EmotiVoice 是一个强大且现代化的文本转语音引擎,可以以 2000 多种不同的声音读出英文和中文文本。其最突出的特点是能完成情感合成,让生成的语音带有各种情绪,如开心、兴奋、伤心、生气等。它提供了一个易于使用的 web 界面,还有脚本接口可以批量生成结果。

如何使用

我们可以通过运行 docker 镜像快速尝试 EmotiVoice。首先需要有 NVidia 的 GPU,然后设置好 NVidia 容器工具,最后运行以下命令启动它:

docker run -dp 127.0.0.1:8501:8501 syq163/emoti-voice:latest

现在在浏览器中打开 http://localhost:8501 就可以使用 EmotiVoice 的强大 TTS 能力了。同时,它也提供了后台方式运行,需要先通过相应的命令行完成环境的配置和模型文件的准备,之后就可以开始语音的生成了。具体安装方式可参考项目 README。

项目推介

EmotiVoice 是网易有道出品的开源项目,得益于公司的强大研发实力,项目的质量和维护都有保证。

以下是该项目 Star 趋势图(代表项目的活跃程度):

更多项目详情请查看如下链接。

开源项目地址:https://github.com/netease-youdao/EmotiVoice

开源项目作者:netease-youdao

以下是参与项目建设的所有成员:

关注我们,一起探索有意思的开源项目。


更多精彩请扫码关注如下公众号。

Written on November 13, 2023