winforms Azure语音到文本单词准确率(%),使用自定义模型microsoft azure

s8vozzvw  于 2022-11-17  发布在  其他
关注(0)|答案(1)|浏览(99)

我正在Microsoft Azure的C#窗口窗体中制作语音到文本应用程序,它工作正常,并在Visual Studio中运行,我想制作一个自定义模型,因为就像90%的单词识别正确,但一些单词没有被正确识别,如在任何文件中都没有提到如何处理或如何准备测试数据,也不知道实现这一点所需的数据量。如何使用Azure认知服务语音工作室指定已识别的单词?

eh57zj3b

eh57zj3b1#

如果你想提高识别能力,你可以指定自己的模型,或者你可以指定一个短语列表。
如果您需要命令的特定关键字或用户/人员名称列表,则它们是简单 * 短语列表 * 的理想候选项。

  • 医学疾病或诊断以及其他一些高度技术性的术语通常不适合作为 * 短语列表 * 的候选项,因为它们通常具有 * 拉丁语 * 或其他 * 非英语 * 来源,因此基本 * 英语 * 模型根本不太可能针对这些内容进行训练。

词组清单是预先提供的单字或词组清单,可协助改善识别。将词组加入词组清单会增加其重要性,因此更容易被识别。

实现短语列表

使用Speech SDK,您可以单独添加短语,然后运行语音识别。然后,您可以选择清除或更新短语列表,使其在下一次识别之前生效。

var phraseList = PhraseListGrammar.FromRecognizer(recognizer);
  phraseList.AddPhrase("Pneumoultramicroscopicsilicovolcanoconiosis");

****注意:**这个特定的单词仍然不太可能被检测为一个短语,部分原因是它是由其他单词组成的复合词,在标准英语语音模型中的代表性非常低。您必须以恒定的节奏说它,才能被识别为一个单词,而不是它的组成部分,这实际上很难掌握 *

如果您想要建立特定领域或商业领域词汇的模型,自订语音会很有用。不过,若要建立模型,您必须上传自己的数据、测试并训练自订模型。


使用“自定义语音”,您可以评估和提高应用程序和产品的Microsoft语音到文本的准确性。
即用型语音到文本转换利用通用语言模型作为基本模型,该模型是使用Microsoft拥有的数据训练的,并反映了常用的口语。基本模型是使用代表各种常见领域的方言和语音预先训练的。当您发出语音识别请求时,默认使用每种支持语言的最新基本模型。2基本模型在大多数语音识别情况下都能很好地工作。
自定义模型可用于扩充基本模型,以通过提供文本数据来训练模型来改进对特定于应用的领域特定词汇的识别。它还可用于通过提供具有参考转录的音频数据来改进基于应用的特定音频条件的识别。
这里有太多的内容,甚至无法涵盖 * 自定义语音 * 的简单实现,但是您可以看到围绕此主题的文档非常详细,这是所有Microsoft Azure服务的标准。

相关问题