已关闭,此问题需要details or clarity。目前不接受答复。
**想改善这个问题吗?**通过editing this post添加详细信息并澄清问题。
2天前关闭。
Improve this question
这是我的当前字符串值:
"""
|name, model, os
|A,"I PAD (10.0"", 2020, Wi-Fi)",OS_A
"""
我希望输出像下面这样,并最终保存为csv:
| 姓名|模型|奥斯|
| - -----|- -----|- -----|
| 一个|I PAD(10.0”",2020,Wi-Fi)|OS|
我被绊倒了,因为在模型字段中,字符串里面有逗号和双引号。我目前的想法是正则化任何有问题的文本,但有没有其他解决方案?
4条答案
按热度按时间g52tjvyc1#
假设输入数据的格式是一致的,我们可以使用创造性的可迭代解包来容忍中间列中的
,
。只要外部列不包含逗号,我们就可以使用pandas.to_csv()
来编写csv输出
DataFrame
:csv.read_csv
和quotechar
看起来非常强大,代码读起来也很不错:但这确实会扰乱outut
""
字符:ttvkxqim2#
https://onlinegdb.com/cslea1uYz
neskvpey3#
如果我没理解你的问题,这应该能帮你找到你想要的。
下面是输出:
这假设与输入一致,所以如果所有输入字符串都有点不同,可能需要添加一些东西。
如果您希望保留一个空间,请使用
string = re.sub(" +", " ", string)
。sg24os4d4#
下面是使用PySpark的解决方案,我使用Spark 3.4和Python 3.11执行此示例。
创建包含以下内容的
input.csv
文件。名称、型号、操作系统
A,“I PAD(10.0”",2020,Wi-Fi)",OS_A
PySpark代码: