我正在尝试在我的React网站中实现语音到文本识别,我使用的是npm的react-speech-recognition
包,我使用的是他们在这里的包描述中指定的确切代码:npm
现在它适用于日常用语,我说的任何话,但当我诱导技术行话时,它就偏离了!
这就是我想对它说的,这是航空术语:
Cleared to enter the CTR, not above 1500 feet, join and report on a right downwind runway 19, QNH 1018, squak 2732
这是我得到的回应:
please to enter the city are not above 15 feet heart penetrate join and report on a ride on the wind blown away 9 theme
我还需要做什么来修正识别的准确性?
1条答案
按热度按时间7cwmlq891#
该包利用浏览器的Web Speech API的Speech Recognition Interface,React库的API允许您通过调用
getRecognition()
方法获取底层SpeechRecognition
对象。底层SpeechRecognition对象的API允许使用JSpeech Grammar Format添加语法。下面是一个示例。因此,理论上,您可以提供更多有关您希望在应用中听到的单词的信息,从而提高性能。
但也有一些警告,包括:
你也许可以从基于云的语音服务中获得更好的准确性。例如,Azure Cognitive Services允许你创建自定义语音模型、自定义语法等。当然,他们也会根据使用情况进行charge you,如果你使用自定义,他们会收取更多的费用。