字符编码的示例分析
admin
2023-07-20 09:22:16
0

#ASCII 255 1bytes,1980年GB2312 7000,1995年GBK1.0 2w,2000年GB18030,Unicode 1bytes,utf-8 en:1bytes zh:3bytes
#都向下兼容。
#最后出现Unicode(统一码,万国码,单一码)
#ASCII码一个英文站1个字节,8位
#Unicode中英文都站2个字节,16位
#utf-8 英文为1字节,中文为3字节

#GBK [decode]转换为unicode编码然后通过[encode]转换成utf-8
#utf-8[decode]转换为unicode编码然后通过[encode]转换成GBK

import  sys

print(sys.getdefaultencoding())#打印默认使用的编码

#encode后都是字节(bytes)类型 decode转换成字符串
#decode后是unicode

q="你哈" #默认unicoude
print(q)
q_gbk=q.encode("gbk") # 默认是unicoude直接转换成gbk
q_utf8=q.encode()#默认转成utf-8
print(q_gbk)
print(q_utf8)
gbk_to_utf8=q_gbk.decode("gbk").encode("utf-8") #告诉decode我是gbk转成unicode再encode成utf-8
print("utf-8",gbk_to_utf8)

utf8_to_gbk=q_utf8.decode("utf-8").encode("gbk")#告诉decode我是utf-8转换成unicode再转换成gbk
print("gbk",utf8_to_gbk)

s="你哈"

#转换成gb2312
s_2312=s.encode("utf-8").decode("utf-8").encode("gb2312")
s_2=s.encode("gb2312")
print("gb2312",s_2312)
print("gb2",s_2)

相关内容

热门资讯

销售纸尿裤被指检出甲酰胺,消费... 极目新闻评论员 纪平近日,“好奇”“碧芭宝贝”“Babycare”等多个品牌的婴幼儿纸尿裤中被曝检出...
武契奇辞职前视察中企工地:我们... 据环球网,6月18日,塞尔维亚总统武契奇视察了由中企承建的项目工程,并发文表示感谢:我们仍有许多工作...
金融监管总局最新发布 个人信息和隐私数据不得用于生成式人工智能模型训练和优化。 6月18日,金融监管总局发布《关于银行业保...
油烟机不通电了是哪里坏了 一、电源线故障 电源线是油烟机通电的关键,如果电源线出现故障,就会导致油烟机无法正常工作。常见...
135亿!Manus收购案重大... 智东西 编译 | 程茜 编辑 | 李水青 智东西6月18日消息,刚刚,外媒The Informati...
油烟机总是响怎么回事 主要原因:油烟机一直有声音,很有可能是因为油烟机里面的轴承没有油了所以出现的这种情况。2、油烟机的长...
Windows笔记本迎来硬件巅... 过去两年,Windows 笔记本市场经历了深刻变革。曾经,主流价位的 Windows 设备不得不在性...
油烟机主板开不了机怎么办 如果油烟机主板不能开机,可能涉及到多个问题,这里介绍几种解决方案:1.检查电源插座和电源线是否连接牢...
小米电脑开不了机怎么回事 小... 小米电脑开不了机的原因有:   1、可能是由于电源的大电容出现鼓包,从而造成供电不足;   ...
创维电视机开不了机总是红灯 创维电视机开不了机总是红灯:一、机上键与遥控键都失效,不能进行开机操作,这个概率很小,一般不会都同时...