spaCy - Init Model 命令
与 1.x 版中的 spacy model 命令类似,Init model 命令用于从原始数据(例如 Brown 簇和词向量)创建新的模型目录。
Init model 命令如下 −
python -m spacy init-model [lang] [output_dir] [--jsonl-loc] [--vectors-loc][--prune-vectors]
参数
下表解释了其参数 −
参数 | 类型 | 描述 |
---|---|---|
lang | positional | 它表示模型语言 ISO 代码。例如,en。 |
output_dir | positional | 此参数表示模型输出目录。如果不存在,则会创建它。 |
--jsonl-loc, -j | option | 它表示具有词汇属性的 JSONL 格式词汇文件的可选位置。 |
--vectors-loc, -v | option | 它表示向量的可选位置。它应该是一个文件,其中第一行包含向量的维度,后跟一个空格分隔的 Word2Vec 表。该文件可以采用 .txt 格式提供,也可以采用 .zip 或 .tar.gz 格式的压缩文本文件提供。 |
--truncate-vectors, -t | option | 在 2.3 版中引入,表示在读取向量文件时要截断的向量数量。默认值为 0,表示不截断。 |
--prune-vectors, -V | option | 此参数表示要将词汇表修剪为的向量数量。默认值为 -1,表示不修剪。 |
--vectors-name, -vn | option | 这是要分配给 meta.json 中的词向量的名称。例如,en_core_web_md.vectors。 |
--omit-extra-lookups, -OEL | flag | 在 2.3 版中引入,它将省略模型中 spacy-lookups-data 中的任何额外查找表(cluster/prob/sentiment)。 |
spacy_command_line_helpers.html