将字符串拆分为多个子字符串的 Python 程序

pythonserver side programmingprogramming

在 Python 中,我们可以使用 split() 方法将字符串拆分为子字符串。split() 方法是内置的 Python 字符串方法之一,它根据指定的分隔符将字符串拆分为子字符串列表。在本文中,我们将借助示例学习如何将字符串拆分为子字符串。

将字符串拆分为子字符串

方法 1:使用 split() 方法

split() 方法是 Python 中字符串的内置方法,它根据指定的分隔符将字符串拆分为子字符串列表。分隔符可以是分隔子字符串的任何字符或字符串。split() 方法接受一个参数,即分隔符。如果未指定分隔符,它将把字符串拆分为单个字符。

示例:分别根据空格和逗号分隔符进行拆分

在下面的示例中,我们将使用空格分隔符拆分字符串。我们使用 split() 方法并传递空格分隔符,根据空格拆分字符串。

string = "Hello World"
substrings = string.split()
print(substrings)

string1 = "apple,banana,orange"
substrings = string1.split(",")
print(substrings)

输出

['Hello', 'World']
['apple', 'banana', 'orange']

示例:使用正则表达式拆分

在下面的示例中,我们使用正则表达式模块中的 split() 函数,使用破折号和空格分隔符将字符串"23-456-7890"拆分为三个子字符串。

import re

string = "123-456-7890"
substrings = re.split("-|\s", string)
print(substrings)

输出

['123', '456', '7890']

方法 2:使用列表推导式

列表推导式是在 Python 中创建列表的一种简洁方法。它允许您基于现有列表或其他可迭代对象创建新列表,同时应用过滤条件并对可迭代元素执行转换。

语法

new_list = [expression for item in iterable if condition]

其中"expression"是对可迭代的每个元素执行的转换或操作,"item"是当前正在处理的元素,"iterable"是元素的来源,"condition"是可选的过滤条件,用于确定元素是否包含在结果列表中。

示例

在下面的示例中,我们从一个名为"sentence"的字符串开始,其中包含一系列由空格分隔的单词。我们使用 split() 方法将字符串拆分为单词列表,然后使用列表推导创建一个名为"words"的新列表,其中包含原始字符串中的每个单词。

sentence = "The quick brown fox jumps over the lazy dog"
words = [word for word in sentence.split()]
print(words)

输出

['The', 'quick', 'brown', 'fox', 'jumps', 'over', 'the', 'lazy', 'dog']

方法三:使用partition()方法

partition()方法是Python中字符串的内置方法,它根据指定的分隔符将字符串拆分为三部分。它返回一个元组,其中包含分隔符之前的字符串左侧部分、分隔符本身以及分隔符之后的字符串右侧部分。如果在字符串中找不到分隔符,则该方法将返回一个元组,该元组包含原始字符串,后跟两个空字符串。

语法

string.partition(delimiter)

此处,string 是要拆分的字符串,delimiter 是分区函数用于拆分字符串的分隔符。

示例

在下面的示例中,我们使用partition()方法根据空格分隔符将字符串"Hello World!"拆分为三部分。生成的元组包含左侧部分"Hello"、分隔符" "和右侧部分"World!"。

string = "Hello World!"
parts = string.partition(" ")
print(parts)

输出

('Hello', ' ', 'World!')

方法 4:使用 splitlines() 函数

splitlines() 方法是 Python 中字符串的内置方法,它根据换行符"\n"将字符串拆分为行列表。如果字符串不包含任何换行符,则返回一个列表,该列表包含原始字符串作为其唯一元素。

语法

string.splitlines()

此处,splitlines() 不接受任何参数,并且始终根据换行符拆分字符串。

示例

在下面的示例中,我们使用 splitlines() 方法将字符串"Line 1\nLine 2\nLine 3"拆分为行列表。结果列表包含三个元素,原始字符串中的每一行对应一个元素。

string = "Line 1\nLine 2\nLine 3"
lines = string.splitlines()
print(lines)

输出

['Line 1', 'Line 2', 'Line 3']

方法 5:使用 re.findall() 方法

re.findall() 方法是 Python 中 re 模块的一个函数,它在字符串中搜索指定正则表达式模式的所有出现位置,并返回所有匹配项的列表。正则表达式模式可以包含代表不同类型字符或序列的各种字符,从而允许进行复杂的模式匹配和提取字符串的特定部分。

语法

re.findall(regular_expression, string)

在这里,re.findall() 方法采用正则表达式从字符串中查找匹配单词的出现,该字符串也传递给 findall() 函数。

示例

在下面的示例中,我们使用 re.findall() 方法在字符串中搜索正则表达式模式 \b\w{5}\b 的所有出现。此模式匹配由单词边界(即单词的开头或结尾)包围的任何恰好五个单词字符(字母、数字或下划线)的序列。 re.findall() 方法返回在字符串中找到的所有匹配项的列表。

import re

string = "The quick brown fox jumps over the lazy dog"
matches = re.findall(r"\b\w{5}\b", string)
print(matches)

输出

['quick', 'brown', 'jumps']

结论

在本文中,我们讨论了如何使用 split() 函数、列表推导、partition 方法、splitline 方法和 re.findall() 方法将字符串拆分为 Python 中的多个子字符串。split() 函数将分隔符作为参数。然后根据该分隔符拆分字符串。 splitline 方法始终根据新行分隔符来拆分字符串。我们可以根据要执行的拆分类型使用本文中介绍的任何方法。


相关文章