Windows Unicode-UTF8/GBK
Unicode,GBK和UTF8
各种编译器测试
1. Unicode是个字符集
- 和ASCII一样, 其作用是用一系列数字来表示字符(character),却别是ASCII只定义了128个字符,只需要1个字节就可定义
- 世界上字符太多,不够用,Unicode字符集出现,兼容ASCII,最多可以表示2^21(大概200万)个字符,已经足够囊括当今所有国家的文字
- 有了字符集, 就可以用任意数字来表示现实中的字符了
2. 字符编码
- 编码,用来约定“用多少个字节表示一个数字,以及每个字节的范围”
- 如果encode和decode的编码不一致,则得不到正常结果,出现乱码
- 常见的编码规则有utf-8,utf-16,gb2312,gbk等,例子:
3. wstring和utf8相互转换