ChatGPT-Next-Web **功能需求** :是否支持语音输入功能

8e2ybdfx  于 5个月前  发布在  其他
关注(0)|答案(5)|浏览(61)

问题描述

目前只能通过文字聊天,但语音聊天更为方便。

解决方案描述

如果调用可选的语音识别接口(如openai whipser,国内一众语音/或是自定义的接口),然后转为问答调用LLM,再通过在线的TTS接口转为语音返回进行播放。

考虑的其他方案

  • 无响应*

附加的上下文信息

  • 无响应*
at0kjp5o

at0kjp5o1#

检测到问题正文的语言不是英语,请自动翻译。

标题: [功能请求]:是否支持语音输入功能?

问题描述

目前您只能通过文本聊天,但语音聊天更方便

解决方案描述

如果您调用可选的语音识别接口(如openai whipser、国内语音/或自定义接口),然后切换到问答呼叫llm,再通过在线tts接口切换回语音返回进行播放

考虑的其他替代方案

  • 无响应*

其他上下文

  • 无响应*
8cdiaqws

8cdiaqws2#

问题描述

目前只能通过文字聊天,但语音聊天更为方便。

解决方案描述

如果调用可选的语音识别接口(如openai whipser,国内一众语音/或是自定义的接口),然后转为问答调用LLM,再通过在线的TTS接口转为语音返回进行播放。

考虑的其他方案

  • 无响应*

附加的上下文信息

  • 无响应*

由于本地存储的限制,实现这个功能更具挑战性。与图片不同,图片可以使用base64在浏览器的本地存储中存储,但此功能带来了更多困难。

kuuvgm7e

kuuvgm7e3#

我这边有实现,可以看看: https://github.com/vual/ChatGPT-Next-Web-Pro
不能直接用 不感兴趣

xienkqul

xienkqul4#

检测到问题正文的语言不是英语,自动翻译。
我有一个实现在这里,你可以查看它: https://github.com/vual/ChatGPT-Next-Web-Pro
不能直接使用。不感兴趣。

jtoj6r0c

jtoj6r0c5#

@kms9 有关于这个功能的计划,但是正如@H0llyW00dzZ所说,由于存储问题,我们仍然预计服务器端实现将来会支持音频文件。在短期内,可能可以使用浏览器API直接将语音转换为文本,但无法回放音频。

相关问题