我使用mysql、oracle等从各地获得了数据源。每个数据源都将日期作为记录存储在一个表中,但格式不是标准的,甚至可以在同一数据源中的不同表(yyyy-mm-dd、yyyy-dd-mm、mm-dd-yyyyy、yyyy-mm-dd-hh:mm:ss:ss等)中有所不同。有哪些选项可以标准化这些存储在配置单元中的不同日期字段?Pig?
q0qdq0h21#
如果使用sqoop将数据拉入配置单元,则可以编写自己的查询,以特定的标准格式获取日期。
sqoop --options-file <Source RDMS options file> --query "select to_char(start_date,'mm/dd/yyyy') as my_date from SALES"
1条答案
按热度按时间q0qdq0h21#
如果使用sqoop将数据拉入配置单元,则可以编写自己的查询,以特定的标准格式获取日期。