我想问一下,有没有人知道如何在一个变压器模型中提供两个序列(多头注意,使其像交叉注意一样工作),我尝试了很多次,但不明白如何执行两个相同类型的输入(类型csv:csv 128、32的数字数据、尺寸,另一个相同)
Model = sequential()
Input1 = tf.keras.input(shape=[128,32])
Input2 = tf.keras.input(shape=[128,32])
Mha = tf.keras.layers.MultiheadAttention(num_heads=2)
Output_tensor = Mha(Input1,Input2)
Retune Model
这只是一个虚拟代码,我从tensorflow理解,如果有人可以提供一个更好的例子,这将是非常有帮助的,我试图执行交叉注意两个输入与多头注意
先谢谢你了
1条答案
按热度按时间06odsfpq1#
在官方API文档中可以找到一个交叉关注的例子。https://www.tensorflow.org/api_docs/python/tf/keras/layers/MultiHeadAttention
在
MultiHeadAttention
的调用方法中,第一个参数target
为query,第二个参数source
为value,当key
为None(默认值)时,key和value相同,那么当target和source相同时,这就是自关注。