专业编程基础技术教程

网站首页 > 基础教程 正文

Python 的底层 — 解释器和内存管理,你了解多少

ccvgpt 2024-10-12 13:46:28 基础教程 7 ℃


如何解释 Python

Python 是一种混合语言。这意味着,它被解释和编译。很高兴知道。但是这一切是如何运作的呢?看一下最简单的 python 文件:

Python 的底层 — 解释器和内存管理,你了解多少

print('hello, world');

要执行此文件,请使用以下命令:

python3 hello-world.py 

# Expected Output: hello, world

但是这里发生了什么?使用命令 python3 启动 python 解释器。python解释器非常好。它基本上对我们说:“你不用担心编译和解释 python。只需给我文件名即可。我帮你处理好。 它在后台非常快速地完成工作,并最终在控制台中向我们显示结果。实际上,在内部盖下发生什么?

Python 解释器由两部分组成:编译器和 PVM(Python 虚拟机)。

当启动解释器时,编译器首先会抓代码并将其转换为字节码。然后,在第二步中,Python 虚拟机获取代码并将其解释为机器代码。拥有的 PVM 以及机器代码最终的外观取决于的特定系统。

如果使用命令 python3 myfile.py 运行文件,则永远无法看到字节码。但也可以手动完成。

python3 -m py_compile hello-world.py

使用该命令将 python 文件 hello-world.py 编译为字节码。编译器创建一个名为 __pycahce__ 的新文件夹。在那里,可以找到一个名为这样的文件:hello-world.cpython-312.pyc

可以使用以下命令打开该文件:

cat hello-world.cpython-312.pyc

如果使用的是 Windows,则使用 type 而不是 cat .

得到这样的输出:

?
??e???ed?y)z
???n?r%     

是的,那是字节码。不是很人性化。但是 PVM 可以读取和解释它。

如果想了解更多关于字节码的信息以及幕后发生的事情,可以做一些事情。可以将其编译为字节码指令:

python3 -m dis hello-world.py 

这为提供了以下输出:

 0           0 RESUME                   0

  1           2 PUSH_NULL
              4 LOAD_NAME                0 (print)
              6 LOAD_CONST               0 ('hello, world')
              8 CALL                     1
             16 POP_TOP
             18 RETURN_CONST             1 (None)

Python 如何使用内存

如果运行 Python 程序,它会将内存分配给变量。嗯,实际上这并不完全正确。它将内存分配给值。变量只保存该地址。为了更清楚地说明这一点,让直接进入一个示例。

x = 42;
y = 19;
print(hex(id(x)));
print(hex(id(y)));
print(x);
print(y, end='\n\n');

y = x;
print(hex(id(x)));
print(hex(id(y)));
print(x);
print(y, end='\n\n');

x = 23;
print(hex(id(x)));
print(hex(id(y)));
print(x);
print(y);

# Expected Output:
# 0x10f86f400
# 0x10f86f120
# 42
# 19

# 0x10f86f400
# 0x10f86f400
# 42
# 42

# 0x10f86f1a0
# 0x10f86f400
# 23
# 42

# In your case, of course, the memory address will differ.

在上面的示例中,创建了两个变量: xy 。 打印它们的内存地址和值。这两个变量具有不同的值,因此具有不同的内存地址。然后,将 x 的值分配给 y,并再次打印内存地址和变量值。现在 x 和 y 具有相同的值和相同的内存地址。

但是在那之后,更改了 x 的值。y 的值也会改变吗?它应该,不是吗?它们都具有相同的内存地址。因此,如果更改存储在该内存地址中的值,则两个变量的值都应该更改。但是看,事实并非如此。Y 仍然持有相同的内存地址,其值没有改变。另一方面,X 具有新值和新的内存地址。如果为 var 赋值,Python 会在内存中查找该确切值是否已存储在某处。如果是这种情况,则为其赋值的变量将指向该内存地址。如果该值未保存在内存中,则 Python 将为其分配内存。不管它是一个全新的变量,还是已经存在并且为它分配了新值,新值在内存中的位置将比旧值不同。

这是否意味着,一旦值发生变化,在内存中就会有几个字符串、整数、浮点数等的“副本”?是的,这是因为字符串、整数和浮点数实际上是不可变的对象!

不可变数据类型与可变数据类型

看一下数据类型:

print(type(42));
print(type(3.14159));
print(type("hello, world"));
print(type(True));
print(type(['eins', 'zwei', 'drei']));

# Expected Output:
# <class 'int'>
# <class 'float'>
# <class 'str'>
# <class 'bool'>
# <class 'list'>

所有数据类型都是对象,或者更准确地说是实例。每次创建字符串、整数、浮点数或元组时,都会创建对象的实例。由于使用内存的方式,它们是不可变的。看一个带有字符串的例子:

x = "hello, world";
y = x;
print(hex(id(x)));
print(hex(id(y)));
print(x);
print(y, end='\n\n');
x = "hello, olof";
print(hex(id(x)));
print(hex(id(y)));
print(x);
print(y, end='\n\n');

# Expected Output:
# 0x103b29fb0
# 0x103b29fb0
# hello, world
# hello, world

# 0x103b2aef0
# 0x103b29fb0
# hello, olof
# hello, world

# In your case, of course, the memory address will differ.

得到的结果与数字示例中的结果相同。首先,它们具有相同的内存地址。更改字符串后,它将保存一个新的内存地址。

总结

  • Python 是一种混合语言,它被编译和解释
  • Python 是一种跨平台语言。因此,每个平台都有自己的 PVM(Python 虚拟机)
  • Python 中的变量不保存值,它只保存一个值的内存地址。
  • 字符串、数字和集合是可映射对象的实例
  • List、dictionaries 和 set 是可变对象的实例。

Tags:

最近发表
标签列表