[编程笔记] 关于字符编码(Character encoding)

实干、实践、积累、思考、创新。


简单的笔记。

ASCII:最早的字符编码,1个字节,最早是用7个二进制位(128个字符),后面又扩展到8个二进制位(256字符,扩展ASCII),主要用来表示英文字母。

Unicode: 由于ASCII编码不够用,不适合考虑各国语言,于是人们就把全世界的语言字符都放进来,通盘考虑,形成Unicode编码 (统一码、万国码、单一码),解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。

Unicode字符集又有多种不同的编码方式,如常见的UTF-8,UTF-16,UTF-32等等。

其中UTF-8是互联网上使用最广的一种Unicode实现方法。


You already voted!

  • 微信公众号 ( Wechat Subscription)

WeChat_QRCode欢迎关注 “结构之旅” 微信公众号

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.