spaCy - Retokenizer.merge 方法
此 retokenizer 方法将标记要合并的跨度。
参数
下表解释了其参数 −
NAME | TYPE | DESCRIPTION |
---|---|---|
Span | Span | 它表示要合并的跨度。 |
Attrs | dict | 这些是在合并时设置的属性token。 |
示例
下面给出了 Retokenizer.merge 方法的一个示例 −
import spacy nlp_model = spacy.load("en_core_web_sm") doc = nlp_model("This is Tutorialspoint.com.") with doc.retokenize() as retokenizer: attrs = {"LEMMA": "Tutorialspoint.com"} retokenizer.merge(doc[2:4], attrs=attrs) doc
输出
您将收到以下输出 −
This is Tutorialspoint.com.
spacy_doc_class_contextmanager_and_property.html