Gemini等模型支持输入文本和图像,但也支持其他格式,如音频、视频或PDF文件。本票据的目标是为音频、视频和富格式文件添加支持,从Gemini开始进行实验。
ct3nt3jp1#
你好,Guillaume,这太棒了。我正在为Azure Open AI开发音频支持。如果我们能使用相同的音频模型,用户就可以轻松地在它们之间切换。我会尽快添加你(希望几个小时后),如果你更快的话,我很乐意使用/增强你的实现。
jaxagkaj2#
哦,刚刚看到你的评论@SandraAhlgrimm。我根据与Image和ImageContent相同的结构添加了Audio/AudioContent和Video/VideoContent类。我已经将它们添加到了#1464中。
Image
ImageContent
Audio
AudioContent
Video
VideoContent
2条答案
按热度按时间ct3nt3jp1#
你好,Guillaume,这太棒了。
我正在为Azure Open AI开发音频支持。如果我们能使用相同的音频模型,用户就可以轻松地在它们之间切换。我会尽快添加你(希望几个小时后),如果你更快的话,我很乐意使用/增强你的实现。
jaxagkaj2#
哦,刚刚看到你的评论@SandraAhlgrimm。
我根据与
Image
和ImageContent
相同的结构添加了Audio
/AudioContent
和Video
/VideoContent
类。我已经将它们添加到了#1464中。