如何在Azure文本到语音中自定义句子组之间的静默时间

xyhw6mcr  于 2023-03-31  发布在  其他
关注(0)|答案(1)|浏览(224)

我正在尝试在Azure控制台的文本到语音中减少两个句子组之间差距。可以通过指定sentenceboundarysilencesentenceboundarysilence="5ms"来减少句子之间的间隙,但我不知道如何自定义句子组之间的静音(如下图所示)。基本上,我想指定第一句组(以“有史以来最好的游戏”结尾)和第二句组(以“第一个理由”开头)之间的持续时间

a5g8bdjr

a5g8bdjr1#

通过SSML文档挖掘,自定义暂停的主要方式是使用SentenaceBoundary,break和silence。可以在文本的任何位置添加break。仅可以在文本结束时使用Silence。如果您想增加两组文本之间的暂停,请使用以下选项:在一组句子中的最后一个句子的末尾添加break。对于Azure Speech Studio,您可以通过将时间放在方括号内来添加中断,如下所示:

[600ms]

以下是一些关于在SSML中添加breaks/silence的文档:https://learn.microsoft.com/en-us/azure/cognitive-services/speech-service/speech-synthesis-markup-structure#add-silence
我不相信有一个选项可以减少两个句子组之间的停顿,而不创建一些非常混乱的SSML(你可以设置句子边界的时间为你的最小停顿时间,然后在每个句子的开头添加休息,以增加需要的时间。

相关问题