虽然可以在Glue中运行自定义代码,但由于它基于Spark,因此仅支持Scala和Python。关于Python子进程的问题,它似乎不是documentation中提到的选项: Only pure Python libraries can be used. Libraries that rely on C extensions, such as the pandas Python Data Analysis Library, are not yet supported. 正如@Isc评论的那样,我建议使用Docker和ECS来运行使用R的批量ETL作业。
1条答案
按热度按时间vyswwuz21#
不可能
虽然可以在Glue中运行自定义代码,但由于它基于Spark,因此仅支持Scala和Python。关于Python子进程的问题,它似乎不是documentation中提到的选项:
Only pure Python libraries can be used. Libraries that rely on C extensions, such as the pandas Python Data Analysis Library, are not yet supported.
正如@Isc评论的那样,我建议使用Docker和ECS来运行使用R的批量ETL作业。