flink-bucketingsink到gcs上的多个bucket

aydmsdu9  于 2021-06-26  发布在  Flink
关注(0)|答案(0)|浏览(316)

我一直在尝试将序列文件写入gcs bucket,并且必须根据数据中的特定字段来管理它们的分区。这就创建了一个场景,即每秒(约100个存储桶/秒)写入多个配置单元分区目录(在同一gcs存储桶内)。
由于堆空间耗尽内存,作业在几分钟后失败。
我还使用visualvm进行了一些内存分析,看到mediahttpuploader占用了大部分内存,并且不经常释放它。

即使在失败/取消作业之后,我看到内存峰值仍保持原样(内存泄漏?)。有人能推荐一个解决这个问题的方法吗?

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题