用Hadoop处理数据的时候,输出结果总是乱码,这是因为Hadoop在设计编码的时候,默认是UTF-8,当文件编码格式不是为UTF-8的时候,可能输出的时候出现乱码。(感觉就是运气,我舍友第一次运行正常,第二次运行乱码,哈哈哈哈哈哈哈哈哈)

我的mapper类中的value为text

问题解决:

我的文件是GBK格式的,以GBK读入数据,以下代码加到开头,分割用line。

String line = new String(value.getBytes(),0,value.getLength(),"GBK"); 
Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐