`
snoopy7713
  • 浏览: 1124853 次
  • 性别: Icon_minigender_2
  • 来自: 火星郊区
博客专栏
Group-logo
OSGi
浏览量:0
社区版块
存档分类
最新评论

Java读取中文字符的文件

    博客分类:
  • java
阅读更多

    众所周知,java的中文问题一直是一个老大难的问题,这个现象可以在csdn中java论坛里关于中文乱码的提问率就可以了解到,甚至软件巨人IBM专 门开辟了一个解决中文问题的专区,作为一个俗人(一直梦想希望想金凯利那样成为一个“冒牌天神”,只是一直没有成功,也许是因为上帝不照顾中国吧),我也 为同意的问题困扰,好在今天解决了。

    随着我对.net平台的彻底放弃(只是生活所迫,毕竟我还要生活),将原有的资源转到Java平台上来是我当前的一个重要任务之一,说到这里,不得不承认.net对中文问题解决的很好,虽然偶尔也会出现乱码。

通过打开文件是指定文件编码的方法把这个问题轻松的解决了。

  最后总结一下:java要读取数据流的时候一定要指定数据流的编码方式(至少读取String流的时候要这么作。

如果使用UTF-8读取出来是乱码,用GBK 或者 GB2312试试,一定会成功的。

	/**
	 * 读取文件内容
	 * 
	 * @param filePathName
	 *            文件名称
	 * @return 文件内容
	 */
	public static byte[] readFileByBytes(String filePathName) {
		StringBuffer sb = new StringBuffer("");
		InputStreamReader in = null;
		try {
			String fileFullPathAndName = PathUtil
					.getKnowbaseFilePath(filePathName);
			File file = new File(fileFullPathAndName);
			BufferedReader reader = new BufferedReader(in);
			if (file.exists()) {
				in = new InputStreamReader(new FileInputStream(file), "UTF-8");
				String line;
				while ((line = reader.readLine()) != null) {
					sb.append(line);
				}
			}
		} catch (IOException e) {
			e.printStackTrace();
		} finally {
			if (in != null) {
				try {
					in.close();
				} catch (IOException ex) {
					ex.printStackTrace();
				}
			}
		}

		return sb.toString().getBytes();
	}

     这里,Java的读文件和写文件都是基于字符流的,主要用到下面的几个类:
1、FileReader----读取字符流
2、FileWriter----写入字符流
3、BufferedReader----缓冲指定文件的输入
该类的方法有:
void close() 
        关闭该流。
 void mark(int readAheadLimit) 
        标记流中的当前位置。
 boolean markSupported() 
        判断此流是否支持 mark() 操作(它一定支持) int read() 
        读取单个字符。
 int read(char[] cbuf, int off, int len) 
        将字符读入数组的某一部分。
 String readLine() 
        读取一个文本行。
 boolean ready() 
        判断此流是否已准备好被读取。
 void reset() 
        将流重置为最新的标记。
 long skip(long n) 
        跳过字符。
4、BufferedWriter----将缓冲对文件的输出
该类的方法有:
void close() 
        关闭该流。
 void flush() 
        刷新该流的缓冲。
 void newLine() 
        写入一个行分隔符。
 void write(char[] cbuf, int off, int len) 
        写入字符数组的某一部分。
 void write(int c) 
        写入单个字符。
 void write(String s, int off, int len) 
        写入字符串的某一部分。

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics