Numpy char.split() 函数
Numpy char.split() 函数用于根据指定的分隔符将数组中的每个字符串元素拆分为子字符串列表。
默认情况下,split() 函数按空格拆分,但我们可以提供自定义分隔符。此函数可用于对文本数据进行分词或解析。
此函数会分别处理输入数组中的每个字符串,并返回一个相同形状的数组,其中每个元素都是拆分操作生成的子字符串列表。
语法
以下是 Numpy char.split() 函数的语法 -
numpy.char.split(a, sep=None, maxsplit=-1)
参数
以下是 Numpy char.split() 函数的参数 -
a(str 或 unicode 类型的数组): 包含待拆分字符串的输入数组拆分。
sep(str, 可选): 拆分字符串的分隔符。如果未提供,则默认为空格。
maxsplit(int, 可选): 执行拆分的最大次数。如果未提供或设置为 -1,则拆分次数不受限制。
返回值
此函数返回一个与输入形状相同的数组,其中每个字符串元素都被拆分操作生成的子字符串列表替换。
示例 1
以下是 Numpy char.split() 函数的基本示例,其中输入数组中的每个字符串在有空格的地方都被拆分为子字符串列表。生成的数组包含从每个原始字符串中提取的单词列表 -
import numpy as np arr = np.array(['apple banana cherry', 'date Elderberry fig']) split_arr = np.char.split(arr) print(split_arr)
以下是 numpy.char.split() 函数基本示例的输出 -
[list(['apple', 'banana', 'cherry']) list(['date', 'elderberry', 'fig'])]
示例 2
我们可以使用 char.split() 函数,根据自定义的分隔符。这在解析或标记文本数据时提供了更大的灵活性。在此示例中,我们使用分隔符 逗号 (',') 来拆分数组中的字符串 -
import numpy as np arr = np.array(['apple,banana,cherry', 'date,elderberry,fig']) split_arr = np.char.split(arr, sep=',') print(split_arr)
以下是使用自定义分隔符拆分的输出 -
[list(['apple', 'banana', 'cherry']) list(['date', 'elderberry', 'fig'])]
示例 3
我们可以使用char.split() 函数中的 maxsplit 参数用于控制执行拆分的次数。当我们想要限制每个字符串元素生成的子字符串数量时,此功能非常有用。以下示例解释了 maxsplit 参数的作用 -
import numpy as np arr = np.array(['one-two-three-four', 'five-six-seven']) split_arr = np.char.split(arr, sep='-', maxsplit=2) print(split_arr)
以下是限制拆分次数的输出 -
[list(['one', 'two', 'three-four']) list(['five', 'six', 'seven'])]