spaCy - Token 属性

在本章中，我们将学习与 spaCy 中的 Token 类相关的属性。

属性

Token 属性及其各自的描述列在下面。

Sr.No.	Token 属性 &描述
1	Token.ancestors 用于此标记的语法后代中最右边的标记。
2	Token.conjuncts 用于返回协调标记的元组。
3	Token.children 用于返回标记的直接语法子代序列。
4	Token.lefts 用于左侧直接子代的单词。
5	Token.rights 用于单词的右侧直接子元素。
6	Token.n_rights 用于单词的右侧直接子元素的数量。
7	Token.n_lefts 用于单词的左侧直接子元素的数量。
8	Token.subtree 这将产生一个包含标记和所有标记的句法后代。
9	Token.vector 这表示实值含义。
10	Token.vector_norm 这表示标记向量表示的 L2 范数。

Token.ancestors

此标记属性用于此标记的句法后代的最右边标记。

示例

下面给出了 Token.ancestors 属性的示例 −

import spacy
nlp_model = spacy.load("en_core_web_sm")
from spacy.tokens import Token
doc = nlp_model("Give it back! He pleaded.")

it_ancestors = doc[1].ancestors
[t.text for t in it_ancestors]

输出

['Give']

Token.conjuncts

此标记属性用于返回协调标记的元组。这里，token 本身不会被包含。

示例

Token.conjuncts 属性的示例如下 −

import spacy
nlp_model = spacy.load("en_core_web_sm")
from spacy.tokens import Token
doc = nlp_model("I like cars and bikes")
cars_conjuncts = doc[2].conjuncts
[t.text for t in cars_conjuncts]

输出

输出如下 −

['bikes']

Token.children

此 token 属性用于返回 token 的直接语法序列子元素。

示例

Token.children 属性的示例如下 −

import spacy
nlp_model = spacy.load("en_core_web_sm")
from spacy.tokens import Token
doc = nlp_model("This is Tutorialspoint.com.")
give_child = doc[1].children
[t.text for t in give_child]

输出

['This', 'Tutorialspoint.com', '.']

Token.lefts

此 token 属性用于单词的左侧直接子元素。它将处于句法依赖性解析中。

示例

Token.lefts 属性的示例如下 −

import spacy
nlp_model = spacy.load("en_core_web_sm")
from spacy.tokens import Token
doc = nlp_model("This is Tutorialspoint.com.")
left_child = [t.text for t in doc[1].lefts]
left_child

输出

你将得到以下输出 −

['This']

Token.rights

此 token 属性用于单词的右侧直接子元素。它将处于句法依赖性解析中。

示例

Token.rights 属性的示例如下 −

import spacy
nlp_model = spacy.load("en_core_web_sm")
from spacy.tokens import Token
doc = nlp_model("This is Tutorialspoint.com.")
right_child = [t.text for t in doc[1].rights]
right_child

输出

['Tutorialspoint.com', '.']

Token.n_rights

此 token 属性用于表示单词的右侧直接子元素的数量。它将处于句法依赖性解析中。

示例

下面给出了 Token.n_rights 属性的一个示例 −

import spacy
nlp_model = spacy.load("en_core_web_sm")
from spacy.tokens import Token
doc = nlp_model("This is Tutorialspoint.com.")
doc[1].n_rights

输出

Token.n_lefts

此标记属性用于表示单词左侧直接子单词的数量。它将位于句法依赖性解析中。

示例

Token.n_lefts 属性的示例如下 −

import spacy
nlp_model = spacy.load("en_core_web_sm")
from spacy.tokens import Token
doc = nlp_model("This is Tutorialspoint.com.")
doc[1].n_lefts

输出

输出如下所示 −

Token.subtree

此 token 属性产生一个包含 token 及其所有句法后代的序列。

示例

Token.n_lefts 属性的示例如下 −

Token.subtree

此 token 属性产生一个包含 token 及其所有句法后代的序列。

示例

Token.subtree 属性如下 −

import spacy
nlp_model = spacy.load("en_core_web_sm")
from spacy.tokens import Token
doc = nlp_model("This is Tutorialspoint.com.")
subtree_doc = doc[1].subtree
[t.text for t in subtree_doc]

输出

['This', 'is', 'Tutorialspoint.com', '.']

Token.vector

此 token 属性表示实值含义。它将返回一个表示 token 语义的一维数组。

示例 1

Token.vector 属性的示例如下 −

import spacy
nlp_model = spacy.load("en_core_web_sm")
doc = nlp_model("The website is Tutorialspoint.com.")
doc.vector.dtype

输出

输出如下所示 −

dtype('float32')

示例 2

Token.vector 属性的另一个示例如下所示 −

doc.vector.shape

输出

输出如下所示 −

(96,)

Token.vector_norm

此 token 属性表示 token 向量表示的 L2 范数。

示例

Token.vector_norm 属性的示例如下所示 −

import spacy
nlp_model = spacy.load("en_core_web_sm")
doc1 = nlp_model("The website is Tutorialspoint.com.")
doc2 = nlp_model("It is having best technical tutorials.")
doc1[2].vector_norm !=doc2[2].vector_norm

输出

True

spaCy 教程

spaCy 其他

spaCy - Token 属性

属性

Token.ancestors

Token.conjuncts

Token.children

Token.lefts

Token.rights

Token.n_rights

Token.n_lefts

Token.subtree

Token.subtree

Token.vector

Token.vector_norm

颜色选择器

读后有收获微信请站长喝咖啡

错误报告

您的建议:

感谢您的帮助！