我有一个CSV文件,里面有一些关于产品颜色的信息。因为有时候会有一些额外的细节,我想只提取颜色名称。我找到了一些库,但是我的数据是法语的,所以它们不适合这些。我试着用Python来做。从“透明的蓝色”我只想保持“蓝色”这张表是这样的:| 产品参考|颜色|销售数量|| - ------|- ------|- ------|| F33|蓝色透明|第二章|| K367|艾卡耶·马龙|1个|我想买“蓝”(蓝色)和“马龙”(棕色),看看哪种颜色更销售
ttisahbt1#
您可以创建一个转换器函数,然后将其apply到列。下面是一个例子(使用问题中的数据)。
apply
import pandas as pd # original dataframe data = {'Product ref': ['F33', 'K367'], 'Color': ['Bleu transparent', 'Ecaille Marron'], 'Sales quantity': [2, 1]} df = pd.DataFrame(data) def translate(french): ''' translating function ''' if 'Bleu' in french: return 'blue' if 'Marron' in french: return 'brown' return '-' # apply the result df['english'] = df['Color'].apply(translate) print(df)
这就是结果:
Product ref Color Sales quantity english 0 F33 Bleu transparent 2 blue 1 K367 Ecaille Marron 1 brown
googletrans
1条答案
按热度按时间ttisahbt1#
您可以创建一个转换器函数,然后将其
apply
到列。下面是一个例子(使用问题中的数据)。
这就是结果:
googletrans
)。上面的例子是一个工作示例。