博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python字符编码
阅读量:6615 次
发布时间:2019-06-24

本文共 693 字,大约阅读时间需要 2 分钟。

python字符编码

最早的字符编码标准:ASCII

    127个字符,没有中文

    1个英文字母需要1个字节

        8个位=1字节

        1024字节=1kb

        1024kb=1MB

后来为了扩展中文支持,出现了GB2312、GBK后来出现Unicode

    把所有语言统一到一套编码里

    每个字符占用2个字节

最后出现UTF-8 (unicode的压缩和优化)

    1个英文 1个字节

    1个中文 3个字节

python3.X 默认unicode编码,默认支持中文

    python3.X 输入英文用的ASCII编码,占用1个字节。

    python3.X 输入中文用UTF-8编码,占用3个字节。

python2.X 默认ASCII编码,无法支持中文

    支持中文方式:

    #!/bin/bash/env python    #解释器

    #_*_ coding:utf-8 _*_     #支持中文,用utf-8格式编码中文。

encode 编码

decode 解码

python3.X socket传输数据必须是 二进制 才能传输。

b开头是 二进制bytes类型。

转换举例:

msg = "你好"

print(msg.encode(encoding="utf-8"))   括号里不指定编码,默认使用utf-8编码

print(msg.encode(encoding="utf-8").decode(encoding="utf-8"))

python2.X会以系统默认编码进行编码

     本文转自506554897 51CTO博客,原文链接:http://blog.51cto.com/506554897/1906358,如需转载请自行联系原作者
你可能感兴趣的文章
Modbus RTU 通信工具设计
查看>>
服务化改造实践 | 如何在 Dubbo 中支持 REST
查看>>
【第8章】JVM内存管理
查看>>
ovirt官方安装文档 附录G
查看>>
磁盘故障小案例
查看>>
HTML
查看>>
【转】左手坐标系和右手坐标系
查看>>
我的友情链接
查看>>
POJ 3335 Rotating Scoreboard 半平面交
查看>>
域名和网址链接被微信浏览器拦截怎么办 微信屏蔽网址打开如何解决
查看>>
使用SQL Server Analysis Services数据挖掘的关联规则实现商品推荐功能(二)
查看>>
ubuntu下安装jdk
查看>>
XML学习总结(2)——XML简单介绍
查看>>
python操作数据库-安装
查看>>
你真的了解interface和内部类么
查看>>
kuangbin专题七 POJ3264 Balanced Lineup (线段树最大最小)
查看>>
JS动画效果链接汇总
查看>>
陈云川的OPENLDAP系列
查看>>
P1197 [JSOI2008]星球大战
查看>>
urllib模块
查看>>