前提条件
在提交问题之前,请先为自己回答以下问题。
- [ Y] 我正在使用最新的TensorFlow Model Garden发布版和TensorFlow 2。
- [ Y] 我正在向正确的仓库报告问题(Model Garden官方或研究目录)。
- [ Y] 我检查过了,确保这个问题还没有被提交过。
1. 你正在使用的文件的整个URL
https://github.com/tensorflow/models/blob/master/official/nlp/modeling/models/bert_classifier.py
2. 描述bug
在使用FP32或FP16优化模型后,我没有得到任何速度提升。对于int8,我在优化过程中遇到了错误。
3. 重现步骤
1-使用tensorRT进行优化
2-测试新模式(推理时间没有变化)
4. 预期行为
优化后,推理时间应该会减少。
5. 其他信息
6. 系统信息
- Docker镜像:tensorflow/tensorflow:2.10.0-gpu
- OS平台和发行版(例如,Linux Ubuntu 16.04):亚马逊linux
- 如果问题发生在移动设备上,移动设备的名称:
- 从哪里安装的TensorFlow(源代码或二进制文件):二进制文件
- TensorFlow版本(使用下面的命令):2.10
- Python版本:3.X
- Bazel版本(如果从源代码编译):
- GCC/编译器版本(如果从源代码编译):
- CUDA/cuDNN版本:11.2.1/8.1.0.77-1
- GPU型号和内存:T4
6条答案
按热度按时间h79rfbju1#
你好,saberkun。
请问你能调查一下这个问题吗?
谢谢。
jfgube3f2#
我们需要来自TFRT运行时团队的帮助。我们没有太多的知识。@qqfish负责路由。
9vw9lbht3#
这个问题已经被自动标记为过时,因为它没有最近的活动。如果没有进一步的活动发生,它将被关闭。谢谢。
tvmytwxo4#
关闭为陈旧状态。如果您想进一步处理此问题,请重新打开。
ruarlubt5#
你对你的问题的解决是否满意?
是
否
hjqgdpho6#
@bixia1, 请您查看这个问题。谢谢!