菜单 学习猿地 - LMONKEY

VIP

开通学习猿地VIP

尊享10项VIP特权 持续新增

知识通关挑战

打卡带练!告别无效练习

接私单赚外块

VIP优先接,累计金额超百万

学习猿地私房课免费学

大厂实战课仅对VIP开放

你的一对一导师

每月可免费咨询大牛30次

领取更多软件工程师实用特权

入驻
196
0

文本操作

原创
05/13 14:22
阅读数 56575


os的使用

上下文管理器


自定义一个上下文管理器

class File():

    def __init__(self, filename, mode):
        self.filename = filename
        self.mode = mode

    def __enter__(self):
        print("entering")
        self.f = open(self.filename, self.mode)
        return self.f

    def __exit__(self, *args):
        print("will exit")
        self.f.close()

装饰器下的上下文管理器

from contextlib import contextmanager

@contextmanager
def my_open(path, mode):
    f = open(path, mode)
    yield f
    f.close()

调用:
with my_open('out.txt', 'w') as f:
    f.write("hello , the simplest context manager")

编码问题

背景

计算机只能处理数字,因此处理文本必须转换成数字才行,最早的计算机在设计时采用8比特作为一个字节 8bit >> 1 bytes
而计算机采用的是二进制,所以一个字节可以表示256种不同的状态。每一个状态对应一个符号,
从 0000 0000 -1111 1111
美国人发明了计算机,同时制定了编码,以对应英文字符和二进制的关系,这就是ASCII码,一共规定了128个字符的编码
128个字符表示英文足够了,但是中文有超过十万个汉字,一个字节只能表示256种符号,所以,中国使用的是GB2312作为简体中文的常见编码形式,用两个字节表示一个汉字, 256*256=65536个符号,
但是各个国家的编码是不一样的,为了能够各国跨语言,跨平台的进行文本转换处理,就有了Unicode
Unicode被称为统一码,万国码
通常是两个字节,
ASC码转Unicode码就是在之前加0
应为在ASC中英文字母只需要一个字节就足够了,但是Unicode是两个,这样存储很浪费,
这样为了节省空间,开发了一些中间格式的字符集,这就是通用转换格式 Unicode transformation format( UTF) 常见的有utf-8。utf-16

发表评论

0/200
196 点赞
0 评论
收藏
为你推荐 换一批