[编程笔记] 关于字符编码(Character encoding)

实干、实践、积累、思考、创新。 简单的笔记。 ASCII:最早的字符编码,1个字节,最早是用7个二进制位(128个字符),后面又扩展到8个二进制位(256字符,扩展ASCII),主要用来表示英文字母。 Unicode: 由于ASCII编码不够用,不适合考虑各国语言,于是人们就把全世界的语言字符都放进来,通盘考虑,形成Unicode编码 (统一码、万国码、单一码),解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。 Unicode字符集又有多种不同的编码方式,如常见的UTF-8,UTF-16,UTF-32等等。 其中UTF-8是互联网上使用最广的一种Unicode实现方法。 微信公众号 ( Wechat Subscription) 欢迎关注 “结构之旅” 微信公众号