旗下导航:搜·么
当前位置:网站首页 > JAVA教程 > 正文

java导出csv乱码解决方法引见【JAVA教程】,java

作者:搜教程发布时间:2019-12-04分类:JAVA教程浏览:52评论:0


导读:1、问题将查询的数据以xls文件导出时(UTF-8编码),数据一般;但以CSV文件导出时,文件中的中文乱码,同样是UTF-8编码,改成GBK编码导出时,中文显现一般。...

1、问题

将查询的数据以xls文件导出时(UTF-8编码),数据一般;但以CSV文件导出时,文件中的中文乱码,同样是UTF-8编码,改成GBK编码导出时,中文显现一般。

本认为问题处理,背面导出含拉丁字符(如ÀÆÊàÌ)的数据时,以xls文件导出数据一般显现,以CSV文件导出时,文件中的拉丁字符显现为“?”号。

试着改成其他编码体式格局都无效,背面网上搜到了一篇处理该问题的要领。

2、处理要领

以CSV体式格局导出的文件中默许不含BOM信息,通过给将要输出的内容设置BOM标识(以 EF BB BF 开头的字撙节)即可处理该问题。具体要领以下:(引荐:java视频教程)

...
OutputStreamWriter outputStreamWriter = new OutputStreamWriter(response.getOutputStream(), "UTF-8");  
// 要输出的内容  
result = (String)contentMap.get(RESPONSE_RESULT);  
response.setHeader("Content-Disposition", "attachment;filename=test.csv");  
outputStreamWriter.write(new String(new byte[]{(byte) 0xEF, (byte) 0xBB, (byte) 0xBF}));  
outputStreamWriter.write(result);  
outputStreamWriter.flush();

假如是以OutputStream流完成的 ,参数能够按以下修正:

out = response.getOutputStream();     
//加上UTF-8文件的标识字符      
out.write(new byte []{(byte) 0xEF, (byte) 0xBB, (byte) 0xBF});

注:

BOM: Byte Order Mark,字节递次标记(以下摘自百度百科)

在UCS 编码中有一个叫做 “Zero Width No-Break Space” ,中文译名作“零宽无间断距离”的字符,它的编码是 FEFF。而 FFFE 在 UCS 中是不存在的字符,所以不应该出现在现实传输中。

UCS 范例发起我们在传输字撙节前,先传输字符 “Zero Width No-Break Space”。如许假如接收者收到 FEFF,就表明这个字撙节是 Big-Endian 的;假如收到FFFE,就表明这个字撙节是 Little- Endian 的。因而字符 “Zero Width No-Break Space(零宽无间断距离)” 又被称作 BOM。

UTF-8 不需要 BOM 来表明字节递次,但能够用 BOM 来表明编码体式格局。字符 “Zero Width No-Break Space” 的 UTF-8 编码是 EF BB BF。所以假如接收者收到以 EF BB BF 开头的字撙节,就晓得这是 UTF-8编码了。Windows 就是运用 BOM 来标记文本文件的编码体式格局的。

更多java学问请关注java基础教程栏目。

以上就是java导出csv乱码处理要领引见的细致内容,更多请关注ki4网别的相干文章!

标签:java


欢迎 发表评论: