Paddle 如何实现多embedding按权融合

7cjasjjr 于 2021-11-30 发布在 Java

关注(0)|答案(2)|浏览(391)

使用paddle对特征目前最常用的两种处理方式为
1)word_emb，即fluid.layers.embedding，我理解这种特征比较适合单特征
2)text_cnn，即先fluid.layers.embedding后进行fluid.nets.sequence_conv_pool，目前字符串、多值特征多用该种处理方式

目前有这么一类多值特征，每个值有不同的权重，对这样的特征如何设计embedding更合理？是否有按权融合多值特征embedding的方法呢？谢谢

来源：https://github.com/PaddlePaddle/Paddle/issues/25940

2条答案

按热度按时间

可以为每个值学习一个 embeddding 表？然后加权求和即可

类似于 BERT 的 word/position/sentence embedding，只是这里的权重为 1

https://github.com/PaddlePaddle/models/blob/eb7eb9cd5f2bffe5edd8b7d6a35b46f38a6db498/PaddleNLP/pretrain_language_models/BERT/model/bert.py#L106

赞(0）回复(0）举报 2021-11-30

类似这样是否可以 paddle本地跑没问题
求和融合以及concat融合方式

赞(0）回复(0）举报 2021-11-30

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 4个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 4个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 4个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 4个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 4个月前