使用 Python 将子列表按另一个列表分组
在 Python 中,我们可以使用各种方法将子列表按另一个列表分组,例如使用字典、使用 itertools.groupby() 函数、使用嵌套列表推导。在分析大型数据集和数据分类时,将子列表按另一个列表分组非常有用。它也用于文本分析和自然语言处理。在本文中,我们将探索在 Python 中将子列表按另一个列表分组的不同方法,并了解它们的实现。
方法 1:使用字典
在 Python 中,可以非常直接地使用字典将子列表按另一个列表分组。让我们借助一个示例来了解字典如何通过另一个列表对子列表进行分组。
语法
list_name.append(element)
此处,元素是要添加到列表末尾的元素。附加方法将此元素放在列表末尾。
示例
在下面的示例中,我们定义了一个函数 group_sublists,它接受两个参数:sublists(子列表的列表)和 grouping_list(确定分组顺序的列表)。在函数内部,我们创建空字典组来存储按其键分组的子列表。我们迭代子列表列表中的每个子列表。假设每个子列表的第一个元素是键,我们提取它并检查它是否存在于组字典中。如果符合,我们将当前子列表附加到该键的现有子列表列表中。否则,我们将在组字典中创建一个新的键值对,该键和当前子列表作为值。最后,我们返回一个列表推导,该列表推导按 grouping_list 指定的顺序检索分组的子列表。
def group_sublists(sublists, grouping_list): groups = {} for sublist in sublists: key = sublist[0] # Assuming the first element of each sublist is the key if key in groups: groups[key].append(sublist) else: groups[key] = [sublist] return [groups[key] for key in grouping_list] # 示例用法 sublists = [[1, 'apple'], [2, 'banana'], [1, 'orange'], [2, 'grape']] grouping_list = [1, 2] result = group_sublists(sublists, grouping_list) print(result)
输出
[[[1, 'apple'], [1, 'orange']], [[2, 'banana'], [2, 'grape']]]
方法 2:使用 itertools.groupby() 函数
Python 的 itertools 模块提供了一个名为 groupby() 的便捷函数,可用于根据关键函数对元素进行分组。让我们借助示例来理解这一点。
语法
list_name.append(element)
此处,append() 函数是一种列表方法,用于将元素添加到 list_name 的末尾。它通过将指定元素添加为新项目来修改原始列表。
itertools.groupby(iterable, key=None)
这里,iterable 是输入可迭代对象,可以是您想要分组的任何序列,key=None 是一个可选参数,可以是可用作分组键的函数。如果没有提供 key 函数,则元素本身将用作分组的键。
示例
在下面的示例中,我们首先根据键对子列表进行排序(假设它是第一个元素)。然后,我们创建一个名为 result 的空列表来存储分组的子列表。接下来,我们迭代 itertools.groupby() 生成的组。 groupby() 函数接受两个参数:可迭代对象(在本例中为子列表)和 key 函数(从每个子列表中提取键的 lambda 函数)。它返回键和包含分组子列表的迭代器的对。在循环内部,我们检查 grouping_list 中是否存在该键。如果存在,我们使用 list(group) 将迭代器转换为列表,并将其附加到结果列表中。最后,我们返回包含分组子列表的结果列表。
import itertools def group_sublists(sublists, grouping_list): sublists.sort(key=lambda x: x[0]) # Sort the sublists based on the key result = [] for key, group in itertools.groupby(sublists, lambda x: x[0]): if key in grouping_list: result.append(list(group)) return result # 示例用法 sublists = [[1, 'apple'], [2, 'banana'], [1, 'orange'], [2, 'grape']] grouping_list = [1, 2] result = group_sublists(sublists, grouping_list) print(result)
输出
[[[1, 'apple'], [1, 'orange']], [[2, 'banana'], [2, 'grape']]]
方法 3:使用嵌套列表推导式
我们可以使用 Python 编写嵌套列表推导式,它可用于按另一个列表对子列表进行分组。让我们看一个例子来了解如何实现这一点。
语法
[expression for item in list if condition]
此处,语法由方括号括起表达式,后跟遍历列表的 for 循环组成。任何 if 条件也可以添加到表达式的末尾以过滤掉某些元素。
示例
在下面的例子中,我们定义了函数 group_sublists,它将子列表和 grouping_list 作为参数。我们使用嵌套列表推导式来遍历 grouping_list 中的每个键。对于每个键,我们迭代子列表并仅过滤出具有匹配键的子列表(假设它是第一个元素)。然后,这些过滤后的子列表被收集到一个新列表中,表示该键的分组子列表。结果是一个列表列表,其中每个子列表都包含特定键的分组子列表。
def group_sublists(sublists, grouping_list): return [ [sublist for sublist in sublists if sublist[0] == key] for key in grouping_list ] # 示例用法 sublists = [[1, 'apple'], [2, 'banana'], [1, 'orange'], [2, 'grape']] grouping_list = [1, 2] result = group_sublists(sublists, grouping_list) print(result)
输出
[[[1, 'apple'], [1, 'orange']], [[2, 'banana'], [2, 'grape']]]
结论
在本文中,我们讨论了如何在 Python 中通过另一个列表对子列表进行分组。我们讨论了三种方法:使用字典和利用 itertools.groupby() 函数,以及使用嵌套列表推导。每种方法都有其优点,并且可能更适合,具体取决于程序的具体要求。