我们遇到了一个问题,在流媒体对话期间通过WebSocket连接发送的音频片段之间有一种“点击”或静态声音,几乎就像麦克风被轻轻敲击一样。
发送的代码相当简单
media_message = {
"event": "media",
"streamSid": stream_sid,
"media": {
"payload": base64_encoded_audio,
},
}
await websocket.send(json.dumps(media_message))
self.logger.info(f"Audio sent over websocket to Twilio.")
#TODO: change mark name
mark_message = {
"event": "mark",
"streamSid": stream_sid,
"mark": {"name": "testMarkLabel"},
}
await websocket.send(json.dumps(mark_message))
我们正在合成一些片段(一句接一句),并将它们连续发送。如果在发送后续剪辑之间没有延迟,这种情况似乎发生得最多-我已经通过在尝试发送另一个之前计算每个音频剪辑的持续时间来缓解这种情况,并检查我们是否收到“标记”事件,但即使这样似乎也不能消除这种情况的发生。
有什么想法吗?这与音频编码或格式无关-当我在发送之间引入任意大的延迟时,点击完全消失。我也试过淡入/淡出的音频剪辑,没有帮助。
1条答案
按热度按时间vlf7wbxs1#
我有同样的问题,你有没有想出一种方法,使音频点击噪音消失时,迅速发送多个音频剪辑?同样,我尝试淡入/淡出或等待前一个剪辑结束也不起作用:/