Python 源码理解: '+=' 和 'xx = xx + xx' 的区别

前菜

在我们使用Python的过程, 很多时候会用到+运算, 例如:

不光在加法中使用, 在字符串的拼接也同样发挥这重要的作用, 例如:

同样的, 在列表中也能使用, 例如:

为什么上面不同的对象执行同一个+会有不同的效果呢? 这就涉及到+的重载, 然而这不是本文要讨论的重点, 上面的只是前菜而已~~~

正文

先看一个例子:

这段代码的用途很明确, 就是一个简单的数字相加, 但是这样似乎很繁琐, 一点都Pythonic, 于是就有了下面的代码:

哈, 这样就很Pythonic了! 但是这种用法真的就是这么好么? 不一定. 看例子:

看起来结果都一样嘛~, 但是真的一样吗? 我们改下代码再看下:

看到结果了吗? 虽然结果一样, 但是通过id的值表示, 运算前后, 第一种方法对象是不同的了, 而第二种还是同一个对象! 为什么会这样?

结果分析

先来看看字节码:

在上诉的字节码, 我们着重需要看的是两个: BINARY_ADDINPLACE_ADD!

很明显:
l = l + [3, 4, 5]    这种背后就是BINARY_ADD
l += [3, 4, 5]     这种背后就是INPLACE_ADD

深入理解

虽然两个单词差很远, 但其实两个的作用是很类似的, 最起码前面一部分是, 为什么这样说, 请看源码:

从上面可以看出, 不管是BINARY_ADD 还是INPLACE_ADD, 他们都会有如下相同的操作:

因为两者的行为真的很类似, 所以在这着重讲INPLACE_ADD,BINARY_ADD感兴趣的童鞋可以在源码文件: abstract.c, 搜索: PyNumber_Add.实际上也就少了对列表之类对象的操作而已.

那我们接着继续, 先贴个源码:

INPLACE_ADD本质上是对应着abstract.c文件里面的PyNumber_InPlaceAdd函数, 在这个函数中, 首先调用binary_iop1函数, 然后进而又调用了里面的binary_op1函数, 这两个函数很大一个篇幅, 都是针对ob_type->tp_as_number, 而我们目前是list, 所以他们的大部分操作, 都和我们的无关. 正因为无关, 所以这两函数调用最后, 直接返回Py_NotImplemented, 而这个是用来干嘛, 这个有大作用, 是列表相加的核心所在!

因为binary_iop1的调用结果是Py_NotImplemented, 所以下面的判断成立, 开始寻找对象(也就是演示代码中l对象)ob_type->tp_as_sequence属性.

因为我们的对象是l(列表), 所以我们需要去PyList_type需找真相:

可以看出, 其实也就是直接取list_as_sequence, 而这个是什么呢? 其实是一个结构体, 里面存放了列表的部分功能函数.

接下来就是一个判断, 判断咱们这个l对象是否有Py_TPFLAGS_HAVE_INPLACEOPS这个特性, 很明显是有的, 所以就调用上步取到的结构体中的sq_inplace_concat函数, 那接下来呢? 肯定就是看看这个函数是干嘛的:

终于找到关键了, 原来最后就是调用这个listextend函数, 这个和我们python层面的列表的extend方法很类似, 在这不细讲了!

PyNumber_InPlaceAdd的执行调用过程, 简单整理下来就是:

所以在上面的结果, 第二种代码: l += [3,4,5], 我们看到的id值并没有改变, 就是因为+=通过sq_inplace_concat调用了列表的listextend函数, 然后导致新列表以追加的方式去处理.

结论

现在我们大概明白了+=实际上是干嘛了: 它应该能算是一个加强版的+, 因为它比+多了一个写回本身的功能.不过是否能够写回本身, 还是得看对象自身是否支持, 也就是说是否具备Py_NotImplemented标识, 是否支持sq_inplace_concat, 如果具备, 才能实现, 否则, 也就是和 + 效果一样而已.

2 4 收藏 评论

可能感兴趣的话题



直接登录
跳到底部
返回顶部