Python-Itertools.zip_longest()

pythonserver side programmingprogramming

简介

在编程领域，效率和灵活性是开发人员努力实现的关键因素。Python 是一种以简单性和连贯性而闻名的语言，它提供了大量内置功能来帮助实现这些目标。其中一项功能是 itertools.zip_longest()，它定义在 Python 的 itertools 模块中，在处理长度不等的可迭代对象方面发挥着重要作用。在本文中，我们深入研究 itertools.zip_longest() 的内部工作原理，研究其优势、用例、挑战以及针对不同应用程序的建议。

Itertools.zip_longest() 解释?

zip_longest() 函数通过将多个可迭代对象"压缩"成元组来将它们组合在一起。它通过利用称为同步的算法范式来实现这一点。

在并行算法中，同步是指通过阻塞来协调并发进程，直到多个线程到达一个共同点。Zip_longest() 使用此方法并行化可迭代对象的使用。理论上，zip_longest() 实现了一种会合迭代器模式。它同步推进多个迭代器，暂停更快的可迭代对象的使用以保持同步。这使可迭代对象之间的输出生成保持一致。

当可迭代对象的长度不均匀时，同步需要填充较短的可迭代对象以匹配最长的长度。Zip_longest() 通过使用可配置的填充值(默认为 None)来处理此问题。从数学上讲，这在可迭代对象之间构造了一个笛卡尔积，填充类似于关系代数中的交叉连接。两个集合之间的笛卡尔积包含它们所有可能的有序对。

因此，zip_longest() 可以在集合论上建模为填充的笛卡尔积。它灵活地将笛卡尔积调整为具有不均匀集合的实际迭代环境。从计算上讲，zip_longest() 对于最大长度为 N 的 k 个可迭代对象具有时间复杂度 O(k*N)，因为每个元素都会被访问。输出的空间复杂度为 O(k)。

itertools.zip_longest() 可能是 Python 的 itertools 模块提供的一项工作，它解决了一个常见的编程挑战 -

组合可能长度不同的不同可迭代对象，同时保证其元素的平滑排列。当您处理的数据源可能不具有相同数量的组件，并且您希望以绑定的方式训练或分析它们时，它尤其有用。

itertools.zip_longest() 背后的核心思想是创建一个迭代器，该迭代器生成包含输入可迭代项的组件的元组。这些元组的构建方式考虑了输入可迭代项的变化长度。如果一个可迭代项比其他可迭代项长，则保留多余的组件，并使用指定的填充值填充较短可迭代项中丢失的组件。

语法

zip_longest(*iterables, fillvalue=None)

它将任意数量的可迭代项作为位置参数。可选的 fillvalue 参数指定当可迭代对象比最长对象短时使用的填充值。默认情况下，使用 None 作为填充。

zip_longest() 返回一个元组迭代器，其中包含传入的可迭代对象中配对的元素。由于输入是延迟使用的，因此它具有内存效率。

示例 1

from itertools import zip_longest

nums1 = [1, 2, 3] 
nums2 = [10, 20]

print(list(zip(nums1, nums2))) 
# [(1, 10), (2, 20)] 

print(list(zip_longest(nums1, nums2)))
# [(1, 10), (2, 20), (3, None)]

输出

[(1, 10), (2, 20)]
[(1, 10), (2, 20), (3, None)]

Example 2

from itertools import zip_longest

keys = ['name', 'age', 'city']
data = [['John'], ['25'], ['New York', 'Chicago']]

records = [dict(zip_longest(keys, parts, fillvalue=''))  
   for parts in data]

print(records)

# [{'name': 'John', 'age': '', 'city': ''},  
#  {'name': '', 'age': '25', 'city': ''},
#  {'name': '', 'age': '', 'city': 'New York'}]

输出

[{'name': 'John', 'age': '', 'city': ''}, {'name': '25', 'age': '', 'city': ''}, {'name': 'New York', 'age': 'Chicago', 'city': ''}]

应用和意义

itertools.zip_longest() 的应用意义在不同领域都有所扩大。在机器学习的数据预处理中，提取包括整合不同的数据源，这项工作证明了它的实用性。此外，在常见的方言处理中，将不同长度的序列(例如句子及其比较值名称)与 itertools.zip_longest() 保持一致。

结论

Zip_longest() 在压缩长度不等的可迭代对象时提供了更多的控制。填充、方向控制和填充值自定义可以干净地处理不同的可迭代对象。它是一种方便的工具，可以在 Python 中的迭代、理解和映射中以编程方式巧妙地合并、配对和处理不匹配的长度数据。尽管 zip() 适用于等长情况，但 zip_longest() 提供了灵活性，使其非常适合涉及不对称的实际数据整理任务。