如何在csv列中找到最常用的字符串值并返回？(Python)

r8uurelv 于 2022-12-10 发布在 Python

关注(0)|答案(1)|浏览(133)

(Not允许使用Pandas）
我对python还很陌生，正在努力解决这个问题。我正在尝试创建一个函数。我有一个CSV文件（名为personal_info.csv），里面有一堆不同的列（full_name，weight_b，height_c等）。我正在尝试循环遍历名为height_c的列，并返回最常用的数字。更多信息：所述列的范围是0-10，尽管有可能一些数字不会出现。这些数字以字符串形式存储（例如：'4'），我也尝试以字符串的形式返回值。如果出现频率最高的数字有任何联系，我只想返回第一个出现的数字。
下面是csv文件中的一些数据：
| 文件名|权重_B|高度_c|
| - -|- -|- -|
| 约翰·史密斯|七十四|2个|
| 雷切尔·兰姆|三十二|五个|
| 亚当·李|十二|2个|
| 麦肯齐特雷|二十六人|2个|
| 艾比·华莱士|七十九|一个|
| 凯伦棕|四十六|七个|
| 哈里赖特|七十三|九个|
| 马迪轴承|五十三个|四个|
因此，我尝试遍历height_c列，找到最常见的值（在本例中为2），但文件比这个长得多。
（编辑此内容以删除无用代码）

python

来源：https://stackoverflow.com/questions/74736352/how-to-find-most-frequent-string-value-in-a-csv-column-and-return-it-python

1条答案

按热度按时间

nhhxz33t1#

我建议将csv文件加载到Pandas Dataframe 中：

import pandas as pd
df = pd.read_csv('file.csv')

然后你可以很容易地得到'heigt_m'列中最常见的值：

df['heigt_m'].value_counts().idxmax()

编辑：如果不使用Pandas，我会打开并存储所有'height_c'值，然后计算最常见的值：

import csv

height_c = []
with open('file.csv', mode='r') as csv_file:
    csv_reader = csv.DictReader(csv_file)
    for row in csv_reader:
        height_c.append(row['height_c'])
        
most_frequent_height_c = max(set(height_c), key = height_c.count)

print(most_frequent_height_c)
2

其中.csv文件包含

file_name,weight_b,height_c
john smith,74,2
rachel lamb,32,5
adam lee,12,2
mackenzie tre,26,2
abby wallace,79,1
karen brown,46,7
harry wright,73,9
madi bear,53,4

赞(0）回复(0）举报 2022-12-10

我来回答

如何在csv列中找到最常用的字符串值并返回？(Python)

1条答案

相关问题

热门标签

最新问答