spaCy - Doc._ _init_ _ 方法

这是 Doc 类最有用的方法之一。顾名思义,它用于构造 Doc 对象。

参数

下表解释了它的参数 −

NAME TYPE DESCRIPTION
vocab vocab 此参数表示词汇类型的存储容器。
words iterable 它表示需要添加到容器。
spaces iterable 它是布尔值列表,表示每个单词是否有后续空格。如果指定它,则需要保持其长度与单词相同。默认值为 true。

示例 1

用于通过 nlp 对象构造Doc._ _init_ _ 方法的示例如下 −

import spacy
nlp_model = spacy.load("en_core_web_sm")
doc = nlp_model("This is Tutorialspoint.com.")
doc

输出

运行代码时,您将看到以下输出 −

This is Tutorialspoint.com。

示例 2

通过 DOC 类进行构造的 Doc._ _init_ _ 方法示例如下 −

import spacy
from spacy.tokens import Doc
words = ["This is Tutorialspoint.com."]
doc = Doc(nlp_model.vocab, words=words)
doc

输出

运行代码时,您将看到以下输出 −

This is Tutorialspoint.com.

spacy_containers.html