在用StreamReader sr = new StreamReader(FileName);
的时候,再输出sr.ReadLine();的时候,发现文件中的中文部分全都变成了乱码。
******
究其原因,原来自从Windows 2000之后的操作系统在文件处理时默认编码采用Unicode,所以.Net
的文件默认编码也是Unicode。除非另外指定,StreamReader 的默认编码为 Unicode,而不是当前系统的 ANSI
代码页。但是文档大部分还是以ANSI编码储存,中文文本使用的是gb2312,所以才造成中文乱码的状况,也就是说在读取文本的时候要指定编码格式。
******
解决方法是System.Text.Encoding.Default 告诉
StreamReader 目前操作系统的编码即可。
StreamReader reader = new StreamReader(FileName,
System.Text.Encoding.Default)