假设我有一个名为sample.csv的csv文件:
CODE AGE SEX CITY
---- --- --- ----
E101 25 M New York
E102 42 F New York
E103 31 M Chicago
E104 67 F Chicago
字符串
我想数一数数据中的男性和女性的数量。例如,对于这一个,答案是:
M : 2
F : 2
型
我应该从哪里开始,我应该如何编码它?
6条答案
按热度按时间l0oc07j21#
你可以这样做:
字符串
bgtovc5b2#
字符串
xesrikrc3#
1.导入CSV文件。
1.把“性”一栏去掉。
字符串
q3qa4bjr4#
另一个解决方案是使用pandas包来实现。
字符串
将返回一个以'M'和'F'为索引、以计数为值的pd.Series对象。它也是检查错误数据的一个很好的解决方法,如果您有另一个类别或丢失数据,您会立即注意到它。
sxpgvts35#
最简单的方法是使用Pandas从csv读取数据并按以下方式分组:
字符串
输出量:
型
qaxu7uf26#
在你使用外部
pandas
或内置csv
模块从文件中读取后,你可以内置模块collections
'Counter
来计算占用率,考虑示例:字符串
输出量:
型
说明:
collections.Counter
是一个类似dict
的对象,它在创建过程中接受iterable,并计算iterable中的占用次数。