spaCy - Span._ _init_ _ 方法
这是 Span 类最有用的方法之一。顾名思义,它用于从切片 doc[start : end] 构造一个 Span 对象。
参数
下表解释了它的参数 −
NAME | TYPE | DESCRIPTION |
---|---|---|
Doc | Doc | 它代表父文档。 |
Start | Int | 它是 span 的第一个 token 的索引。 |
End | Int | 它代表 span 之后的第一个 token 的索引span。 |
标签 | int / unicode | 它是要附加到 span 的标签。例如,命名实体。从 2.1 版开始,标签也可以是 unicode 字符串。 |
kb_id | int / unicode | 它表示要附加到 span 的知识库 ID。例如,命名实体。此 ID 可以是整数,也可以是 unicode 字符串。 |
vector | numpy.ndarray[ndim=1, dtype='float32'] | 它是 span 的含义表示。 |
示例 1
下面给出了 Span._ _init_ _ 方法的示例 −
import spacy nlp_model = spacy.load("en_core_web_sm") doc = nlp_model("This is Tutorialspoint.com.") span = doc[1:4] span
输出
执行上述代码时,您应该看到以下输出−
is Tutorialspoint.com.
示例 2
下面给出了 Span._ _init_ _ 方法的另一个示例 −
[t.text for t in span]
输出
执行上述代码时,您应该看到以下输出 −
['is', 'Tutorialspoint.com', '.']
spacy_container_span_class.html