PHP写时复制(Copy On Write)

一个例子:

变量 $foo 赋值给变量 $bar,这两个变量具有相同的值,没有必要新申请内存空间,他们可以共享同一块内存。在很多场景下PHP 的 COW 对内存进行优化。比如:变量的多次赋值、函数参数传递,并在函数体内修改实参等。

什么是写时复制

很明显在这段代码执行以后,$var_dup 的值应该还是”laruence”, 那么这又是怎么实现的呢?这就是 PHP 的 copy on write 机制:

PHP 在修改一个变量以前,会首先查看这个变量的 refcount,如果 refcount 大于1,PHP 就会执行一个分离的例程, 对于上面的代码,当执行到第三行的时候,PHP 发现 $var 指向的 zval 的 refcount 大于1,那么 PHP 就会复制一个新的 zval 出来,将原 zval 的 refcount 减 1,并修改 symbol_table,使得 $var 和 $var_dup 分离(Separation)。这个机制就是所谓的 copy on write(写时复制)。

(本例选自:http://www.laruence.com/2008/09/19/520.html

写时复制应用场景

写时复制(Copy on Write,也缩写为COW)的应用场景非常多, 比如Linux中对进程复制中内存使用的优化,在各种编程语言中,如C++的STL等等中均有类似的应用。 COW是常用的优化手段,可以归类于:资源延迟分配。只有在真正需要使用资源时才占用资源, 写时复制通常能减少资源的占用。

一个证明 PHP COW 优化内存占用的例子:

运行结果:

内存并没有显著提高。

何为复制

多个相同值的变量共用同一块内存的确节省了内存空间,但变量的值是会发生变化的,如果在上面的例子中, 指向同一内存的值发生了变化(或者可能发生变化),就需要将变化的值“分离”出去,这个“分离”的操作, 就是“复制”。

在PHP中,Zend引擎为了区别同一个zval地址是否被多个变量共享,引入了ref_count和is_ref两个变量进行标识:

ref_countis_ref是定义于zval结构体中(见第一章第一小节)
is_ref标识是不是用户使用 & 的强制引用;
ref_count是引用计数,用于标识此zval被多少个变量引用,即COW的自动引用,为0时会被销毁;
关于这两个变量的更多内容,跳转阅读:第三章第六节:变量的赋值和销毁的实现。
注:由此可见, $a=$b; 与 $a=&$b; 在PHP对内存的使用上没有区别(值不变化时);

实现原理

相信大家也可以了解到PHP中COW的实现原理: PHP 中的 COW 基于引用计数ref_count 和 is_ref 实现, 多一个变量指针,就将 ref_count 加 1, 反之减去 1,减到 0 就销毁; 同理,多一个强制引用 &,就将 is_ref 加 1,反之减去 1。

完整内容请参见如下链接:
http://www.php-internals.com/book/?p=chapt06/06-06-copy-on-write

打赏