你把infer_schema_length弄反了。将其设置为None不会使其解析整个文件。如果将其设置为None,则它将使用默认值100。See here 我不认为有一种方法可以告诉polars放弃int而选择Floats。 作为一种变通方法,您可以加载该文件的一个小子集,然后使用它创建一个dtypes列表,用Floats替换Int
df=pl.read_csv(filepath, n_rows=5, n_threads=1, sample_size=5)
df=pl.read_csv(filepath, dtypes=[x if not "Int" in str(x) else pl.Float64() for x in df.dtypes])
1条答案
按热度按时间h43kikqp1#
你把
infer_schema_length
弄反了。将其设置为None
不会使其解析整个文件。如果将其设置为None
,则它将使用默认值100。See here我不认为有一种方法可以告诉polars放弃int而选择Floats。
作为一种变通方法,您可以加载该文件的一个小子集,然后使用它创建一个dtypes列表,用Floats替换Int
注意:在我看来,不应该指定
sample_size
参数,所以我在bug报告中提出了这个问题,希望在未来的版本中,这是不必要的。