目前只能通过文字聊天,但语音聊天更为方便。
如果调用可选的语音识别接口(如openai whipser,国内一众语音/或是自定义的接口),然后转为问答调用LLM,再通过在线的TTS接口转为语音返回进行播放。
at0kjp5o1#
检测到问题正文的语言不是英语,请自动翻译。
标题: [功能请求]:是否支持语音输入功能?
目前您只能通过文本聊天,但语音聊天更方便
如果您调用可选的语音识别接口(如openai whipser、国内语音/或自定义接口),然后切换到问答呼叫llm,再通过在线tts接口切换回语音返回进行播放
8cdiaqws2#
由于本地存储的限制,实现这个功能更具挑战性。与图片不同,图片可以使用base64在浏览器的本地存储中存储,但此功能带来了更多困难。
kuuvgm7e3#
我这边有实现,可以看看: https://github.com/vual/ChatGPT-Next-Web-Pro不能直接用 不感兴趣
xienkqul4#
检测到问题正文的语言不是英语,自动翻译。我有一个实现在这里,你可以查看它: https://github.com/vual/ChatGPT-Next-Web-Pro不能直接使用。不感兴趣。
jtoj6r0c5#
@kms9 有关于这个功能的计划,但是正如@H0llyW00dzZ所说,由于存储问题,我们仍然预计服务器端实现将来会支持音频文件。在短期内,可能可以使用浏览器API直接将语音转换为文本,但无法回放音频。
5条答案
按热度按时间at0kjp5o1#
检测到问题正文的语言不是英语,请自动翻译。
标题: [功能请求]:是否支持语音输入功能?
问题描述
目前您只能通过文本聊天,但语音聊天更方便
解决方案描述
如果您调用可选的语音识别接口(如openai whipser、国内语音/或自定义接口),然后切换到问答呼叫llm,再通过在线tts接口切换回语音返回进行播放
考虑的其他替代方案
其他上下文
8cdiaqws2#
问题描述
目前只能通过文字聊天,但语音聊天更为方便。
解决方案描述
如果调用可选的语音识别接口(如openai whipser,国内一众语音/或是自定义的接口),然后转为问答调用LLM,再通过在线的TTS接口转为语音返回进行播放。
考虑的其他方案
附加的上下文信息
由于本地存储的限制,实现这个功能更具挑战性。与图片不同,图片可以使用base64在浏览器的本地存储中存储,但此功能带来了更多困难。
kuuvgm7e3#
我这边有实现,可以看看: https://github.com/vual/ChatGPT-Next-Web-Pro
不能直接用 不感兴趣
xienkqul4#
检测到问题正文的语言不是英语,自动翻译。
我有一个实现在这里,你可以查看它: https://github.com/vual/ChatGPT-Next-Web-Pro
不能直接使用。不感兴趣。
jtoj6r0c5#
@kms9 有关于这个功能的计划,但是正如@H0llyW00dzZ所说,由于存储问题,我们仍然预计服务器端实现将来会支持音频文件。在短期内,可能可以使用浏览器API直接将语音转换为文本,但无法回放音频。