spaCy - Doc._ _init_ _ 方法
这是 Doc 类最有用的方法之一。顾名思义,它用于构造 Doc 对象。
参数
下表解释了它的参数 −
NAME | TYPE | DESCRIPTION |
---|---|---|
vocab | vocab | 此参数表示词汇类型的存储容器。 |
words | iterable | 它表示需要添加到容器。 |
spaces | iterable | 它是布尔值列表,表示每个单词是否有后续空格。如果指定它,则需要保持其长度与单词相同。默认值为 true。 |
示例 1
用于通过 nlp 对象构造的 Doc._ _init_ _ 方法的示例如下 −
import spacy nlp_model = spacy.load("en_core_web_sm") doc = nlp_model("This is Tutorialspoint.com.") doc
输出
运行代码时,您将看到以下输出 −
This is Tutorialspoint.com。
示例 2
通过 DOC 类进行构造的 Doc._ _init_ _ 方法示例如下 −
import spacy from spacy.tokens import Doc words = ["This is Tutorialspoint.com."] doc = Doc(nlp_model.vocab, words=words) doc
输出
运行代码时,您将看到以下输出 −
This is Tutorialspoint.com.