这个 Spark 警告非常方便,在我们使用新的csv文件从2022切换到2023的时候。
它注意到我们不再匹配了。这个警告已经解释了我的事情,救了我几十次。
WARN CSVDataSource: CSV header does not conform to the schema.
Header: VendorID, passenger_count, trip_distance, RatecodeID, ...
Schema: VendorID, store_and_fwd_flag, RatecodeID, PULocationID, ...
字符串
有没有一种方法,通过 Spark 配置,要求它停止当前的错误操作,而不仅仅是发出警告?
1条答案
按热度按时间zd287kbt1#
检查这个issue我认为你可以通过添加
字符串