在JavaScript中导出csv文件时出现UTF-8编码问题

xvw2m8pv  于 2023-11-14  发布在  Java
关注(0)|答案(4)|浏览(198)

我使用下面的函数将数组导出到JavaScript中的csv文件中,但在Windows 7中使用Microsoft Excel 2013时,汉字变得混乱。
我用记事本打开导出的文件,但它显示得很好。

function arrayToCSVConvertor(arrData, reportTitle) {
    var CSV='';
    arrData.forEach(function(infoArray, index){
        var dataString = infoArray.join(",");
        dataString= dataString.split('\n').join(';');
        CSV += dataString+ "\n";
    });

    if (CSV == '') {
        alert("Invalid data");
        return;
    }

    //create a link and click, remove
    var link = document.createElement("a");
    link.id="lnkDwnldLnk";

    //this part will append the anchor tag and remove it after automatic click
    document.body.appendChild(link);

    var csv = CSV;

    var blob = new Blob([csv], { type: ' type: "text/csv;charset=UTF-8"' });//Here, I also tried charset=GBK , and it does not work either
    var csvUrl = createObjectURL(blob);

    var filename = reportTitle+'.csv';

    if(navigator.msSaveBlob){//IE 10
        return navigator.msSaveBlob(blob, filename);
    }else{
        $("#lnkDwnldLnk")
            .attr({
                'download': filename,
                'href': csvUrl
            });
        $('#lnkDwnldLnk')[0].click();
        document.body.removeChild(link);
    }
}

字符串

z2acfund

z2acfund1#

通过在csv字符串的开头添加BOM解决了问题:

var csv = "\ufeff"+CSV;

字符串

shstlldc

shstlldc2#

这是我的解决方案:

var blob = new Blob(["\uFEFF"+csv], {
    type: 'text/csv; charset=utf-8'
});

字符串

sshcrbum

sshcrbum3#

var csv = "\ufeff"+CSV;

字符串
关于这段代码的解释:
BOM字符(在JavaScript中表示为“\ufeff”)是一种特殊的Unicode字符,用于指示文本的字节顺序和编码方案。
某些软件应用程序要求在UTF-8编码文件中存在BOM字符,以便将文件识别为UTF-8编码文本文件。例如,Microsoft Excel可能无法识别没有BOM字符的UTF-8编码CSV文件,并且可能会错误地显示字符。
因此,将BOM字符添加到CSV数据字符串可确保生成的文件被大多数软件应用程序(包括Excel)识别为UTF-8编码的文本文件。

z18hc3ub

z18hc3ub4#

根据RFC 2781,字节顺序标记(BOM)0xFEFF是UTF-16小端编码(UTF 16-LE)的BOM。虽然添加BOM可以解决Windows的问题,但如果要在MacOS上使用Excel打开生成的CSV文件,问题仍然存在。
编写跨不同操作系统平台(Windows、Linux、MacOS)工作的多字节CSV文件的解决方案应用以下三条规则:
1.用制表符而不是逗号分隔字段
1.使用UTF 16-LE编码内容
1.以UTF 16-LE BOM为内容前缀,即0xFEFF
更详细的阐述、示例代码和用例可以在this article中看到

相关问题