csv 在法语中提取颜色

ckx4rj1h  于 2023-01-28  发布在  其他
关注(0)|答案(1)|浏览(140)

我有一个CSV文件,里面有一些关于产品颜色的信息。因为有时候会有一些额外的细节,我想只提取颜色名称。我找到了一些库,但是我的数据是法语的,所以它们不适合这些。我试着用Python来做。
从“透明的蓝色”我只想保持“蓝色”
这张表是这样的:
| 产品参考|颜色|销售数量|
| - ------|- ------|- ------|
| F33|蓝色透明|第二章|
| K367|艾卡耶·马龙|1个|
我想买“蓝”(蓝色)和“马龙”(棕色),看看哪种颜色更销售

ttisahbt

ttisahbt1#

您可以创建一个转换器函数,然后将其apply到列。
下面是一个例子(使用问题中的数据)。

import pandas as pd

# original dataframe
data = {'Product ref': ['F33', 'K367'],
        'Color': ['Bleu transparent', 'Ecaille Marron'],
        'Sales quantity': [2, 1]}

df = pd.DataFrame(data)

def translate(french):
    ''' translating function '''
    if 'Bleu' in french:
        return 'blue'
    
    if 'Marron' in french:
        return 'brown'
    
    return '-'

# apply the result
df['english'] = df['Color'].apply(translate)
print(df)

这就是结果:

Product ref             Color  Sales quantity english
0         F33  Bleu transparent               2    blue
1        K367    Ecaille Marron               1  brown
    • 注意**:你可以使用一个更深奥的翻译和匹配函数(例如googletrans)。上面的例子是一个工作示例。

相关问题