请原谅我问这个问题的方式,但我们如何添加字段选项(即:Django字段选择),或者我们如何强制关键字列表(即:国家/地区列表)添加到给定字段?
我想刮数据从不同的网站束,我可以相当干净的数据,因为在一般的延伸。然而,我需要的是一种方法,迫使项目类字段接受某些值,如果该值不在列表中引发错误。
例如:
我有一个名为SourceCountry = Field()的字段,我知道我可以设置一个规则来只接受字符串值Field(serializer=str),所以现在,我至少可以避免其他数据类型的值。
现在,假设我清理了被擦除的国家/地区数据,并将其格式化为我所期望的国家/地区数据。我存储的值是“USA”,并且在我的列表中,我希望用作字段选项的值也是“USA”。太好了!我可以保存这些被擦除的数据。因此,另一方面,如果数据是“glass”,显然,它不会出现在列表中,并且Items应该会引发错误。
就我所能想象的,我可以创建一组列表,我想使用这些列表作为数据字段选择,并在将结果存储到Items中之前将其与之进行比较。
有没有更好的解决方案?更专业?
所以,我愿意接受任何建议。
- 谢谢-谢谢
1条答案
按热度按时间xtupzzrd1#
您可以子类化
scrapy.Item
类,并添加一些过滤方法来检查不需要的值。例如:
项目.py
引号.py