我可以像这样使用DataFrameSchema验证DataFrame索引:
import pandera as pa
from pandera import Column, DataFrameSchema, Check, Index
schema = DataFrameSchema(
columns={
"column1": pa.Column(int),
},
index=pa.Index(int, name="index_name"),
)
# raises the error as expected
schema.validate(
pd.DataFrame({"column1": [1, 2, 3]}, index=pd.Index([1, 2, 3], name="index_incorrect_name"))
)
字符串
有没有一种方法可以使用SchemaModel来做同样的事情?
3条答案
按热度按时间qybjjes11#
找到an answer in GitHub
可以使用pa.typing.Index对索引进行类型注解。
字符串
了解如何验证MultiIndex索引:https://pandera.readthedocs.io/en/stable/schema_models.html#multiindex
wf82jlnq2#
你可以这样做-
字符串
qacovj5a3#
从pandera 0.14.0开始,SchemaModel只是DataFrameModel的别名。在可预见的未来,SchemaModel将继续作为指定DataFrame模型类型的有效方法,并将在0.20.0版本中弃用。
来源:Pandera Documentation