当我开始使用Python时,使用加号运算符+加入字符串是非常直观和容易的,就像许多编程语言(如Java)一样。
然而,很快我意识到许多开发人员似乎喜欢使用.join()方法,而不是+。在本文中,我将介绍这两种方法之间的区别,以及为什么您不应该使用+。
开始
作为初学者,或者有人刚刚从其他使用+连接字符串的语言切换过来,编写这样的代码非常容易:
str1 = “我爱”
str2 = "Python."打印(str1 + str2)
随着您越来越多地使用Python,您可能会意识到其他人更喜欢像这样使用join()方法:
str1 = “我爱”
str2 = "Python."print(''.join([str1, str2]))
老实说,当我第一次看到上述方法时,我认为这不直观,看起来有点难看。
加入多个字符串
尽管如此,有一次我需要加入一个列表中的多个字符串。
strs = ['Life', 'is', 'short,', 'I', 'use', 'Python']
最初,我是这样做的:
strs = ['Life', 'is', 'short,', 'I', 'use', 'Python']def join_strs(strs):
result = ''
for s in strs:
result += ' ' + s
return result[1:]join_strs(strs)
在这个例子中,我必须写一个for-loop来逐个连接字符串。此外,结果字符串需要修剪我在开头添加的空白,因为所有字符串都需要在前面添加空白,而不是第一个。您可能还有其他解决方案,例如向for循环添加索引,这样索引=0处的字符串就不应该添加这个空格。无论如何,你仍然需要这个for-loop,并为空白空间做一些事情。
在那之后,我回忆起我以前见过.join()方法,也许这是我需要使用它的时候!
def join_strs_better(strs):
return ' '.join(strs)join_strs_better(strs)
多么容易啊!一行代码可以完成一切。由于.join()方法由字符串对象调用,因此字符串对象将用于连接列表中的每个字符串,因此您无需担心开头的空白。
但是等等,你真的认为这是我们需要使用join()方法而不是+的唯一原因吗?不,请阅读下一节。
逻辑背后的join()方法
现在,让我们从性能方面比较这两种方法。我们可以使用Jupyter Notebook的神奇方法%timeit来评估它们。
上面显示的性能基于10万次试验,因此结果非常自信和明显。使用thejoinjoin()方法可能比使用+加入列表中的字符串快4倍。
为什么?
这是我绘制的概念图,用于演示使用+连接字符串的方法。
这显示了for-loop和+运算符的所作所为:
- 对于每个循环,从列表中找到字符串
- The Python executor interprets the expression result += ' ' + s and apply for memory address for the white space ' '.
- 然后,执行者意识到空白空间需要与字符串连接,因此它将应用字符串s的内存地址,这是第一个循环的“生命”。
- 对于每个循环,执行器需要申请两次内存地址,一次用于空格,另一次用于字符串
- 有12倍的内存分配
然而,join()方法发生了什么?
- 执行者将计算列表中的字符串数量。有6个。
- 这意味着用于加入列表中字符串的字符串需要重复6-1=5次。
- 它知道总共需要11个内存空间,因此所有这些空间都将同时应用并预先分配。
- 将字符串按顺序排列,返回结果。
因此,很明显,主要区别在于内存分配的次数是性能提高的主要原因。
想象一下,使用join()方法将6个字符串连接在一起已经快了4倍。如果我们连接了非常多的字符串呢?这将产生更大的差异!
总结
在这篇简短的文章中,我比较了在Python中加入字符串时+运算符和join()方法之间的差异。显然,join()方法因其性能而受到青睐。
学习编程语言通常是一条很长的曲线,但Python对初学者来说相对较短,这绝对很棒。在我们进入门后,开始使用Python,我们不应该止步于此,满足我们使用Python所能做的事情。通常,大师和普通开发人员之间的区别来自详细的知识。
让我们继续寻找更多关于Python的提示,让我们更接近Python大师!