锟斤拷是什么?我也是最近才搞明白的。
http://www.baidu.com/baidu?word=%EF%BF%BD%EF%BF%BD
http://www.google.com/search?hl=en&q=%E9%94%9F%E6%96%A4%E6%8B%B7
我考证了一下,这个乱码的原因来源相当经典。
Unicode和老编码体系的转化过程中,肯定有一些字,用Unicode是没法表示的,Unicode官方用了一个占位符来表示这些文字,这就是:U+FFFD REPLACEMENT CHARACTER
那么U+FFFD的UTF-8编码出来,恰好是 '\xef\xbf\xbd'。
如果这个'\xef\xbf\xbd',重复多次,例如 '\xef\xbf\xbd\xef\xbf\xbd',然后放到GBK/CP936/GB2312/GB18030的环境中显示的话
一个汉字2个字节,最终的结果就是:锟斤拷 哈哈。。。
Python代码:
>>> u'\uFFFD'.encode('utf-8')*2
'\xef\xbf\xbd\xef\xbf\xbd'
>>>
>>> print u'\uFFFD'.encode('utf-8')*2
锟斤拷
例如这个招聘就非常经典:
单位性质: 外商独资企业 所属行业: 线缆
单位规模: 100 - 499人 注册资金: 1299
联 系 人: 锟斤拷锟斤拷 联系人职位: 锟斤拷锟斤拷
传 真: 021-69178632 联系电话:
电子信箱: xuan_guo@walsin.com
通信地址:
邮 编:
单位网址:
单位介绍: 台锟斤拷锟斤拷业锟斤拷台锟斤拷锟斤拷锟侥碉拷f锟斤拷锟斤拷锟斤拷锟?锟斤拷锟斤拷/锟斤拷锟斤拷
招聘职位:锟斤拷锟斤拷 人数:20人
发布日期: 2007-07-17
联系人: 锟斤拷锟斤拷
编码问题真是个TMD烦人的问题。例如:
最后我在wikipedia上开了一个 锟斤拷 的页面。瓦咔咔。。瓦咔咔。。。
分享到:
相关推荐
甲:哦,这是乱码。 乙:为什么会出现乱码呢? 甲:说来话可长了… 乙:快说!快说! 甲:美国人发明电脑时,需要存储字符,所以使用了一个数字一个字符的方法,有128个字符。 乙:太少了。 甲:嗯。确实少。它只有7...
Stata跨版本乱码问题解决方案,Stata跨版本乱码问题解决方案Stata跨版本乱码问题解决方案Stata跨版本乱码问题解决方案Stata跨版本乱码问题解决方案Stata跨版本乱码问题解决方案Stata跨版本乱码问题解决方案Stata跨...
ubuntu rsync中文乱码 window ubuntu rsync同步中文乱码.docx
乱码解决 乱码解决 乱码解决 乱码解决 乱码解决 乱码解决 乱码解决
使用java IO技术实现将多文件中的内容集中到一个文件上 只需输入一个文件夹的路径和目的路径即可完成文件拷贝复制 并且解决了中文乱码的问题s
乱码处理文件乱码处理文件乱码处理文件乱码处理文件乱码处理文件乱码处理文件乱码处理文件乱码处理文件乱码处理文件乱码处理文件乱码处理文件乱码处理文件乱码处理文件乱码处理文件乱码处理文件乱码处理文件乱码处理...
js乱码转换js乱码转换js乱码转换js乱码转换js乱码转换js乱码转换js乱码转换js乱码转换
plsql developer 中文乱码 问号的解决办法,中文乱码 中文乱码 中文乱码
web乱码解决web乱码解决web乱码解决web乱码解决web乱码解决
乱码查看器乱码查看器乱码查看器乱码查看器
设置乱码问题,设置乱码问题设置乱码问题设置乱码问题设置乱码问题设置乱码问题设置乱码问题设置乱码问题设置乱码问题设置乱码问题设置乱码问题设置乱码问题设置乱码问题设置乱码问题设置乱码问题
layui表格乱码,日期乱码,table乱码
EL中文显示乱码的解决办法 EL中文乱码 EL中文显示乱码
qt乱码问题解决
soapUI输入中文显示为乱码 响应报文中文乱码问题解决方法
你也许听说过“国际C 语言乱码大赛(IOCCC)”,能获奖的人毫无疑问是世界顶级C程序员。这是他们利用C 语言的特点极限挖掘的结果。下面这个例子就是网上广为流传的一个经典作品:
韩文乱码转换器
MySQL乱码解决方案数据库乱码MySQL乱码解决方案数据库乱码
简易乱码解码器,简易乱码解码器简易乱码解码器简易乱码解码器简易乱码解码器