首页 | 互联网 | IT动态 | IT培训 | Cisco | Windows | Linux | Java | .Net | Oracle | 软件测试 | C/C++ | 嵌入式开发 | 存储世界 | 服务器
网络设备 | IDC | 安全 | 求职招聘 | 数字网校 | 网页设计 | 平面设计 | 技术专题 | 电子书下载 | 教学视频 | 源码下载 | 搜索 | 博客 | 论坛
中国IT实验室Linux频道
Google
首页 入门 Linux编程 系统管理 网络管理 Linux认证 Unix/BSD Linux数据库 Linux集群 Linux手册 Linux下载 Ubuntu 论坛 专题 RSS
您现在的位置: 中国IT实验室 >> Linux >> 系统管理 >> 系统管理 >> 正文

Linux系统中关于文件编码以及编码转换

  Windows中默认的文件格式是GBK(gb2312),当然也可以保存为UTF-8的,最简单的方法是用记事本的“另存为”就可以做到。
 
  为了与windows兼容,SecureCRT中文件编码的默认配置是“Default”,其实也就是GBK.如果我们将其更改为了“UTF-8″,那么我们查看从windows中scp过去的GBK文件就会变成乱码,需要进行转换,比较麻烦。
 
  不过有时候我们也需要进行编码的转换,比如这次我这次在建立cacti的模板的时候使用了中文,apache默认是UTF-8的编码,所以记录到mysql数据库中的就是UTF-8的编码了(奇怪的是,在mysql中使用“set names utf-8″看不到正确的中文,需要使用”hex()“函数来看二进制,数一下字符数量,看是不是utf-8………)。而当我使用批量添加主机的脚本来添加新服务器信息到数据库后,发现在网页中出现了乱码。原因是在cli中使用脚本的话,中文是使用GBK的格式保存到数据库中的。于是变成了很郁闷的情况,无论将浏览器编码设置为”UTF-8″还是“GB2312″,总会有一部分中文是乱码的。
 
  解决的方法,不是将原来的模板的中文都转换成gb2312,就是要将以后添加的主机信息里面的中文转换成UTF-8.因为我比较喜欢UTF-8一点,所以我决定用后一种方法。
 
  linux里面转换编码的方法很多,google了一下,一般的人都是用“iconv”命令来进行转换。但是由于我需要在脚本里面判断文件的编码,“iconv”就不太适用。其实Linux里面还有另一个能进行编码转换,并比“iconv”功能强大的“enca”。
 
  debian中的安装:
 
  aptitude install enca
 
  使用方法:
 
  enca -L zh_CN file 检查文件的编码
 
  enca -L zh_CN -x UTF-8 file 将文件编码转换为"UTF-8"编码
 
  enca -L zh_CN -x UTF-8 < file1 > file2 如果不想覆盖原文件可以这样
 
  除了有检查文件编码的功能以外,“enca”还有一个好处就是如果文件本来就是你要转换的那种编码,它不会报错,还是会print出结果来,而“iconv”则会报错。这对于脚本编写是比较方便的事情。
 
【责编:Zenghui】
中国IT教育
相关产品和培训
文章评论
 友情推荐链接
 专题推荐

 ·防范Linux病毒 打造没有病毒的乐土…
 ·Linux Shell编程实用指南…
 ·Linux日志分析与管理
 ·揭密Linux内存管理
 ·邮件服务Sendmail应用配置
 ·Linux 安全管理…
 ·Linux 下DNS服务器架设攻略…
 ·Linux 下的路由的配置与应用…
 ·专题:Apache实用手册
 ·全面剖析Linux文件系统
 今日更新
 认证培训
 频道精选
 Windows频道导航