spaCy - Span._ _init_ _ 方法

这是 Span 类最有用的方法之一。顾名思义,它用于从切片 doc[start : end] 构造一个 Span 对象。

参数

下表解释了它的参数 −

NAME TYPE DESCRIPTION
Doc Doc 它代表父文档。
Start Int 它是 span 的第一个 token 的索引。
End Int 它代表 span 之后的第一个 token 的索引span。
标签 int / unicode 它是要附加到 span 的标签。例如,命名实体。从 2.1 版开始,标签也可以是 unicode 字符串。
kb_id int / unicode 它表示要附加到 span 的知识库 ID。例如,命名实体。此 ID 可以是整数,也可以是 unicode 字符串。
vector numpy.ndarray[ndim=1, dtype='float32'] 它是 span 的含义表示。

示例 1

下面给出了 Span._ _init_ _ 方法的示例 −

import spacy
nlp_model = spacy.load("en_core_web_sm")
doc = nlp_model("This is Tutorialspoint.com.")
span = doc[1:4]
span

输出

执行上述代码时,您应该看到以下输出−

is Tutorialspoint.com.

示例 2

下面给出了 Span._ _init_ _ 方法的另一个示例 −

[t.text for t in span]

输出

执行上述代码时,您应该看到以下输出 −

['is', 'Tutorialspoint.com', '.']

spacy_container_span_class.html