PaddlePaddle 2.0,CPU,Linux,python3.8
ctr训练,一部分cate_feature 想要做embedding,怎样得到训练好的embedding表,以及如何查询,
这样在线上部署的时候可以省去embedding的训练过程
比如说,职业,消费水平等 多个类别特征,输入模型的时候,定义一个embedding
self.embedding = paddle.nn.Embedding(
self.sparse_feature_number,
self.sparse_feature_dim,
sparse=True,
weight_attr=paddle.ParamAttr(
name="SparseFeatFactors",
initializer=paddle.nn.initializer.Uniform()))
label是点击
在训练后,想要得到一个embedding 的查询表
当输入类别特征时,直接得到一个向量。需要怎样做?
2条答案
按热度按时间vnzz0bqm1#
您好,我们已经收到了您的问题,会安排技术人员尽快解答您的问题,请耐心等待。请您再次检查是否提供了清晰的问题描述、复现代码、环境&版本、报错信息等。同时,您也可以通过查看官网API文档、常见问题、历史Issue、AI社区来寻求解答。祝您生活愉快~
Hi! We've received your issue and please be patient to get responded. We will arrange technicians to answer your questions as soon as possible. Please make sure that you have posted enough message to demo your request. You may also check out the API,FAQ,Github Issue and AI community to get the answer.Have a nice day!
envsm3lx2#
使用
paddle.nn.Embedding
接口,在训练后会得到一个名为SparseFeatFactors
(跟用户配置有关)的文件, 可以参考https://www.paddlepaddle.org.cn/documentation/docs/zh/guides/02_paddle2.0_develop/08_model_save_load_cn.html#canshuzairu 进行模型加载。可将加载后的参数通过numpy转换为numpy自行使用。
关于查询:
使用
paddle.nn.Embedding
接口保存的embedding是一个(词表*维度)的一个矩阵,ID为[0, N-1)。 用户可以自行采用IDMap行的方式,获取到指定ID的embedding.