加载数据本地infile-无效的utf8mb4字符串

wsxa1bj1  于 2021-06-23  发布在  Mysql
关注(0)|答案(1)|浏览(849)

我正试图把这个俄罗斯巨魔tweets的csv文件放到mysql数据库中。
我正在尝试像这样使用加载数据本地填充:

LOAD DATA LOCAL INFILE
'/path/to/csv/data.csv' 
INTO TABLE
mytable
CHARACTER SET
utf8mb4
FIELDS TERMINATED BY 
','
ENCLOSED BY 
'"'
LINES TERMINATED BY
'\n'
IGNORE 1 LINES;

它似乎适用于一个小样本的数据,但当我试图做完整的csv,我得到了这个错误:
错误1300(hy000):无效的utf8mb4字符串:“研究历史的人知道这甚至不被认为是历史”
引发错误的行是:
4036537452,4mysquad,那些研究历史的人知道这甚至不算历史b\с 那是最近的事#blackhistorymonth[此处省略缩写链接],美国,英语,2/8/2016 23:18,2/8/2016 23:20483628021053,,左,0,0,左
如果使用字符集latin1,那么它可以导入,但是我会丢失tweets中的emojis以及俄语tweets中的emojis。
csv有俄语、德语、瑞典语和emojis的tweet。有没有办法把这些都输入我的数据库?
谢谢,如果这个问题还有什么需要我提供的信息,请告诉我。

6psbrbz9

6psbrbz91#

最后我做了一个大规模的查找/替换,用'\'替换每个''。
很有魅力。谢谢,马雷克富尔和弗雷迪雷霆让我走上正轨。

相关问题