spaCy - Init Model 命令

与 1.x 版中的 spacy model 命令类似,Init model 命令用于从原始数据(例如 Brown 簇和词向量)创建新的模型目录。

Init model 命令如下 −

python -m spacy init-model [lang] [output_dir] [--jsonl-loc] [--vectors-loc][--prune-vectors]

参数

下表解释了其参数 −

参数 类型 描述
lang positional 它表示模型语言 ISO 代码。例如,en
output_dir positional 此参数表示模型输出目录。如果不存在,则会创建它。
--jsonl-loc, -j option 它表示具有词汇属性的 JSONL 格式词汇文件的可选位置。
--vectors-loc, -v option 它表示向量的可选位置。它应该是一个文件,其中第一行包含向量的维度,后跟一个空格分隔的 Word2Vec 表。该文件可以采用 .txt 格式提供,也可以采用 .zip.tar.gz 格式的压缩文本文件提供。
--truncate-vectors, -t option 在 2.3 版中引入,表示在读取向量文件时要截断的向量数量。默认值为 0,表示不截断。
--prune-vectors, -V option 此参数表示要将词汇表修剪为的向量数量。默认值为 -1,表示不修剪。
--vectors-name, -vn option 这是要分配给 meta.json 中的词向量的名称。例如,en_core_web_md.vectors
--omit-extra-lookups, -OEL flag 在 2.3 版中引入,它将省略模型中 spacy-lookups-data 中的任何额外查找表(cluster/prob/sentiment)。

spacy_command_line_helpers.html