UTF16,UTF32,UNICODE,ANSI,CP54936编打字符串转换工具.比如:在工具中输入我是中国人,UTF16,UTF32,UNICODE,ANSI,CP54936各栏中会相应显示对应的编码数据.在一些开发编码有关方面会有用到简单好使.本人就常用,很便捷.感谢原作者.
我在工作中常常需要查询几个字的编码,或者查询几个编码对应的字符,所以写了这个工具。用户可以在文本栏输入文本,或者在编码栏输入对应的编码。在你输入的同时,其它各栏会同步变化。输入编码格式是固定的:需要用两个16进制数字表示一个字节。每一个字节用一个空格分隔。
CodeView有一点特点,就是用户可以设置要显示的代码页(两个左侧有按钮的编码栏)。点击代码页按钮,在弹出的对话框选择代码页:
可以用编码栏右边的保存按钮将数据保存到文件,可以选择是不是需要加BOM。BOM的定义可以见 浅析文字编码和Unicode(下) 的4.2.4节。假如你不熟知UTF16-LE、UTF16-BE等定义,可以看看这篇文章的的4.2节。
请注意:当某个编码栏不支持特定字符时,CodeView会显示默认编码,一般是3F。
CodeView 是一个查询文本编码的小工具。大家用它来解决这个乱码问题。
2.1 得到CP1252字符
第一要得到命名实体对应的乱码,即CP1252字符。
à′Dêμ£DD
假如你的邮件已经是这个样子,就能跳过这步。假如你的邮件是
Agrave;acute;ETH;Aring;Ecirc;Otilde;micro;frac12;pound;not;ETH;raquo;ETH;raquo;
你就新建一个文本文件,内容如下:
Agrave;acute;ETH;Aring;Ecirc;Otilde;micro;frac12;pound;not;ETH;raquo;ETH;raquo;
BODY标签之间粘贴上要转换的命名实体。保存到html文件,用浏览器打开,就能看到:
à′Dêμ£DD
复制这类CP1252字符。
2.2 由CP1252字符得到对应编码
打开CodeView。CodeView有两行是可以自己设置编码的。把第二行设置成CP1252,将最后一行设置成CP936,即GBK。 然后把前面复制的字符粘贴到文本行
如此就能从CP1252行得到CP1252字符对应的编码文本。在CP1252行点右键,在右键菜单选择“复制全部”复制这行编码文本。
2.3 将编码当作GBK编码转换到文本
先删除掉最后一行的文本,然后将复制的CP1252编码文本粘贴到最后一行,即CP936行。这个时候在文本行就能看到对应的文本。
3 结束语
假如把CP1252编码当作GBK编码,文本行还是乱码,你可以再试一试Big5,即把最后一行设置成CP950。 这类的乱码邮件还是很容易处置的,你可以自己动手解决它。
转载请说明来源于当快软件园(https://www.lrvxg.com)
本文地址:https://www.lrvxg.com/soft/983.html
郑重声明:文章来源于网络作为参考,本站仅用于分享不存储任何下载资源,如果网站中图片和文字侵犯了您的版权,请联系我们处理!邮箱3450399331@qq.com