PHP引用计数基础

2024-01-30 30

PHP变量实际上存储在称为“zval”的结构体中。每个zval除了存储变量的类型和值之外,还包含额外的两个信息:is_ref和refcount。is_ref表示这个变量是否是引用类型。如果is_ref被设置为1,那么表示这个变量是一个引用集合的一部分。对于普通的变量,is_ref将被设置为0。

refcount表示有多少个符号指向这个zval。符号是指变量名,所有符号都存储在一个符号表中。每个作用域都有一个符号表,主脚本有一个作用域,每个函数或方法也有一个作用域。PHP引擎会通过refcount来跟踪zval的使用情况,以便在不再需要使用它时及时释放内存。当refcount为0时,PHP引擎会自动释放zval所占用的内存。

除了is_ref和refcount之外,zval还包含其他一些信息,例如GC标记和GC链表指针等。这些信息帮助PHP引擎管理内存的使用。

一、创建新zval容器

当使用常量值创建新变量时,也会创建 zval 容器,例如:

<?php
$a = "new string";
?>

在这种情况下,新的符号名称 a 会在当前作用域中创建,并且会创建新的变量容器,其类型为 string,值为 new string。由于没有创建用户定义的引用,“is_ref”位默认设置为 false。“refcount”设置为 1,因为只有一个符号使用了这个变量容器。

二、显示zval信息

请注意,具有“refcount”为 1 的引用(即”is_ref”为 true)会视为非引用(即“is_ref”为 false)。如果安装了 » Xdebug,可以通过调用 xdebug_debug_zval() 来显示此信息。

<?php
$a = "new string";
xdebug_debug_zval('a');
?>

以上示例会输出:

a: (refcount=1, is_ref=0)='new string'

三、增加zval的refcount

将这个变量赋值给另一变量名将增加 refcount 的计数。

<?php
$a = "new string";
$b = $a;
xdebug_debug_zval( 'a' );
?>

以上示例会输出:

a: (refcount=2, is_ref=0)='new string'

这里的 refcount 是 2,因为同一个变量容器链接到 a 和 b。PHP 很聪明,当没有必要的时候,不会复制实际的变量容器。当“refcount”到 0 时,就会销毁变量容器。

四、减少zval refcount

当链接到变量容器的任何符号离开作用域(例如函数结束时)或取消符号赋值(例如通过调用 unset())时,“refcount”会减少 1。以下是示例:

<?php
$a = "new string";
$c = $b = $a;
xdebug_debug_zval( 'a' );
$b = 42;
xdebug_debug_zval( 'a' );
unset( $c );
xdebug_debug_zval( 'a' );
?>

以上示例会输出:

a: (refcount=3, is_ref=0)='new string'
a: (refcount=2, is_ref=0)='new string'
a: (refcount=1, is_ref=0)='new string'

如果现在调用 unset($a);,变量容器,包含类型和值,会从内存中移除。

五、复合类型

对于 array 和 object 这样的复合类型,情况会稍微复杂一些。与 scalar 值不同,array 和 object 的属性存储在自己的符号表中。这意味着以下示例将创建三个 zval 容器:

<?php
$a = array( 'meaning' => 'life', 'number' => 42 );
xdebug_debug_zval( 'a' );
?>

以上示例的输出类似于:

a: (refcount=1, is_ref=0)=array (
'meaning' => (refcount=1, is_ref=0)='life',
'number' => (refcount=1, is_ref=0)=42
)

图示:

PHP引用计数基础

这三个 zval 变量容器是 a、meaning 和 number。增加和减少“refcounts”的规则也适用于此。下面,再向数组添加一个元素,并将其值设置为已存在元素的内容:

<?php
$a = array( 'meaning' => 'life', 'number' => 42 );
$a['life'] = $a['meaning'];
xdebug_debug_zval( 'a' );
?>

以上示例的输出类似于:

a: (refcount=1, is_ref=0)=array (
'meaning' => (refcount=2, is_ref=0)='life',
'number' => (refcount=1, is_ref=0)=42,
'life' => (refcount=2, is_ref=0)='life'
)

图示:

PHP引用计数基础

从上面的 Xdebug 输出中,可以看到新旧的数组元素现在都指向“refcount”为 2 的 zval 容器。尽管 Xdebug 的输出显示了两个值为 ‘life’ 的 zval 容器,但它们实际上是同一个。xdebug_debug_zval() 函数没有显示这一点,但可以通过显示内存指针来看到它。

六、从数组中删除元素

从数组中删除元素就像从作用域中删除符号一样。删除后,数组元素指向的容器的“refcount”会减少。同样,当“refcount”到 0 时,变量容器就会从内存中删除。再举个例子来说明这一点:

<?php
$a = array( 'meaning' => 'life', 'number' => 42 );
$a['life'] = $a['meaning'];
unset( $a['meaning'], $a['number'] );
xdebug_debug_zval( 'a' );
?>

以上示例的输出类似于:

a: (refcount=1, is_ref=0)=array (
'life' => (refcount=1, is_ref=0)='life'
)

现在,如果将数组本身作为数组的一个元素添加进去,情况就会变得有趣起来。在下一个例子中这样做,并且偷偷加入引用运算符,否则 PHP 会创建副本:

<?php
$a = array( 'one' );
$a[] =& $a;
xdebug_debug_zval( 'a' );
?>

以上示例的输出类似于:

a: (refcount=2, is_ref=1)=array (
0 => (refcount=1, is_ref=0)='one',
1 => (refcount=2, is_ref=1)=...
)

图示:

PHP引用计数基础

可以看到数组变量(a)以及第二个元素(1)现在都指向“refcount”为 2 的变量容器。上面显示的“…”表示存在递归,这在这种情况下意味着“…”指向原数组。

七、清除$a

就像之前一样,清除变量会删除符号,并且指向的变量容器的引用计数会减少 1。因此,如果在运行上述代码后清除变量 $a,那么 $a 和元素“1”所指向的变量容器的引用计数会减少 1,从“2”变为“1”。可以表示为:

(refcount=1, is_ref=1)=array (
0 => (refcount=1, is_ref=0)='one',
1 => (refcount=1, is_ref=1)=...
)

图示:

PHP引用计数基础

八、清理问题

虽然在任何作用域中都没有指向这个结构的符号,却无法清理它,因为数组元素“1”仍然指向同一个数组。由于没有外部符号指向它,用户无法清理该结构;因此会出现内存泄漏。幸运的是,PHP 会在请求结束时清理这个数据结构,但在此之前,它会占用宝贵的内存空间。如果正在实现解析算法或其他需要子级元素指向”父级”元素的情况,会经常发生。当然,object 也可能出现相同的情况,因为 object 始终隐式引用。

如果这种情况只发生一两次,可能不是问题,但如果出现数千次,甚至数百万次的内存损失,显然就成了问题。这在长时间运行的脚本中尤为棘手,比如守护进程,其中请求基本上永远不会结束,或者在大量的单元测试集中。后者在运行 eZ Components 库的模板组件的单元测试时出现了问题。在某些情况下,它需要超过 2GB 的内存,而测试服务器并没有那么多内存可用。

  • 广告合作

  • QQ群号:707632017

温馨提示:
1、本网站发布的内容(图片、视频和文字)以原创、转载和分享网络内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。邮箱:2942802716#qq.com(#改为@)。 2、本站原创内容未经允许不得转裁,转载请注明出处“站长百科”和原文地址。
PHP引用计数基础
上一篇: PHP内置Web Server
PHP引用计数基础
下一篇: PHP回收循环