unilm 如何使用wavlm模型提取说话者嵌入以进行说话者验证任务？

uyto3xhc 于 2个月前发布在其他

关注(0)|答案(2)|浏览(34)

你好，
我想使用wavlm模型来提取说话者嵌入以进行说话者验证任务。在the paper中提到，对于说话者验证任务，应该使用来自Transformer层的表示的加权和。
我使用了所有层表示的平均值以及最后一层表示作为说话者的嵌入，并且没有得到两个属于同一个说话者的嵌入之间的合理的余弦相似度。
我想问一下，你能否提供给我Transformer层的学习权重,这样我就可以从模型中提取稳健的说话者嵌入。

来源：https://github.com/microsoft/unilm/issues/802

2条答案

按热度按时间

你好，@fatemeshiravand。我们已经发布了预训练的说话人验证模型here。请参考README说明和脚本进行说话人表示提取。

赞(0）回复(0）举报 2个月前

感谢您的回复@Sanyuan-Chen。
我已经阅读了您为我提供的the repo,并使用WavLM大型模型来比较来自同一说话者和两个不同说话者的音频。在这两种情况下，我都得到了接近1(大约0.99)的余弦相似度，并且我不确定是模型不起作用还是我做错了什么。

赞(0）回复(0）举报 2个月前

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 21天前
xxl-job 不能和nacos兼容？
回答(3) 发布于 21天前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 21天前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 21天前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 21天前