我有问题的编码后,我从网站下载数据的rss饲料。某些字符无法正确解释。我使用HttpResponse.getEntity()
并在循环中放入read inputStream和write in ByteArrayOutPutStream
。
例如,ByteArrayOutPutStream bs;在写上“bs”后,我使用String test = bs.toString("UTF-8");
但是有些字符是这样:
Mytest��������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������
我不能改变那些性格,任何想法。
谢谢你
1条答案
按热度按时间ehxuflar1#
不是
UTF-8
编码,很可能是Big5
编码(您的问题历史记录确认您来自中国/香港)。Mytest簿翹癡職疇繡矇簿翹疇簞簣癡瞽竄疆癡穠矇簡疇瞼矇罈疇簫矇繕瓣罈繞癟糧罈癟繕簣瓣繡瓣繙矇癟瞼疇簧瞽疆繞
您应该能够通过自己阅读
HttpEntity#getContentType()
来确定这一点。它应该返回类似于