我在尝试获取另一列字符串值的字符计数列时遇到了问题,并且还没有想出如何高效地执行。
for index in range(len(df)):
df['char_length'][index] = len(df['string'][index]))
字符串
这显然涉及到首先创建一列空值,然后重写它,这在我的数据集上花费了很长时间。那么什么是最有效的方法来获得像
'string' 'char_length'
abcd 4
abcde 5
型
我查了很多遍,但我还没弄明白。
2条答案
按热度按时间wydwbb8l1#
Pandas有一个vectorised string method:
str.len()
。要创建新列,可以写入:字符串
举例来说:
型
这应该比使用Python
for
循环在DataFrame上循环要快得多。许多其他熟悉的Python字符串方法也被引入到Pandas中。例如,
lower
(用于转换为小写字母),count
用于计算特定子串的出现次数,replace
用于交换一个子串。jqjz2hbq2#
这里有一个办法。
字符串