终于把unicode编码做了一个大致的了解了。
在学习的过程中知道了很多概念和相关的发展历史,对以前比较模糊的概念也有了比较深入的了解。
一些概念:
-
bom(byte order mark)用来区别是big endian(BE)还是little endian(LE)。
区别的方法: 在UTF-16文件的头2个字节里做个标记: LE [0xFF, 0xFE], BE [0xFE, 0xFF]; 而在UTF-8中,标记[0xEF, 0xBB, 0xBF],可有可无的
- Unicode的理解
- UCS(universal character set)通用字符集
- UTF-16
- UTF-8
- BMP(Basic Multilingual Plane),在表达一个Unicode的字符时,通常会用“U+”然后紧接着一组十六进制的数字来表示这一个字符。在BPM里的所有字符,要用四位十六进制数,在BMP以外的需要使用五位或六位十六进制数。
看完总结出来的简单的思维导图。
每一个点上都有细节可以研究,例如utf-8,utf-16等都有各自的算法,各自的实现方式。
http://tech.idv2.com/2008/02/21/unicode-intro/
- 大小: 15.3 KB
分享到:
相关推荐
Unicode 编码范围 各国文字 Unicode 编码范围 各国文字 Unicode 编码范围 各国文字 Unicode 编码范围 各国文字 Unicode 编码范围 各国文字 Unicode 编码范围 各国文字
Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码
汉字一、二级字库的汉字与unicode编码(十六进制)对照表,按照unicode的顺序排列
标准的unicode 编码表,提供的是现代维吾尔文的字母,标点符号等字符的编码
Fontcreate用Unicode编码下较完整的字符集分类压缩包
通用规范汉字UNICODE码表,提供一级字表、二级字表、三级字表全部8105字的UNICODE编码
中文unicode编码表
只要安装了jdk,都可以转换的简单windows命令,中文转Unicode码和Unicode码转中文,简单、方便、实用。
最全的常用汉字Unicode码表,举例:\u7684\u4e00\u662f\u4e86\u6211\u4e0d\u4eba\u5728\u4ed6\u6709\u8fd9\u4e2a\u4e0a\u4eec\u6765\u5230\u65f6\u5927\u5730\u4e3a\u5b50\u4e2d\u4f60\u8bf4\u751f\u56fd\u5e74 。
Unicode编码所有汉字,解压后打开cmd程序,电脑必须安装java
// unicode: 返回一个字符的unicode编码 // 调用格式: ucode = unicode(char); // 参数: char:字符或字符串。为字符串时返回第一个字符的unicode编码 // 返回值: 整型。字符的unicode编码值 // 补充说明: 常用半角...
标准的现代维吾尔文字符集unicode编码表
利用C语言实现将数字实现Unicode的方法,Unicode是目前机器的最通用的字符编码,所以其应用很广。
所有中文字Unicode编码区间及常用中文字Unicode编码,在生成随机验证码时可能使用到
主要介绍了C++11 Unicode编码转换的相关资料,帮助大家更好的理解和学习c++11,感兴趣的朋友可以了解下
excel 公式 自动转换unicode编码为汉字
汉字转换成16进制对应的unicode编码,用于汉字拼音排序
在网上找资料很少有汉字直接转GBK编码格式,一般都是汉字转Unicode编码,这套是将汉字先转换成Unicode编码,在通过参照表得出汉字的GBK编码数据。虽然是一个js文件,但是加以修改可以用于很多平台上如:小程序,...
TXT电子书批量转换中文Unicode编码,这是一个批量转换的好工具。 有一些人喜欢下电子书。而很多手机不支持直接看电脑上的txt文档,所以.....
用vc写的汉字转unicode码,可以得到多进制的unicode码