spaCy - Debug-data 命令

借助此命令,我们可以分析、调试和验证我们的训练和开发数据。我们还可以得到一些有用的统计数据,无效的实体注释,循环依赖关系和低数据标签等。

Debug-data命令如下 −

python -m spacy debug-data [lang] [train_path] [dev_path] [--base-model] [--pipeline] [--ignore-warnings] [--verbose] [--no-format]

参数

下表解释了其参数 −

参数 类型 描述
lang 位置 此参数表示模型语言。
train_path Positional 这是 JSON 格式的训练数据的位置,可以是文件或文件目录。
dev_path Positional 这是用于评估的 JSON 格式的开发数据的位置,可以是文件或文件目录。
--tag-map-path, -tm V2.2.4 Option 在 2.2.4 版本中引入,表示 JSON 格式的标签映射的位置。
--base-model, -b option 此参数是要更新的基础模型的名称。它是可选的。它可以是任何可加载的 spaCy 模型。
--pipeline, -p option 这是要训练的管道组件的逗号分隔名称。默认值为 'tagger,parser,ner'。
--ignore-warnings, -IW Flag 顾名思义,此参数将忽略警告,仅显示统计信息和错误。
--verbose, -V Flag 它将打印其他信息和说明。
–no-format, -NF Flag 它将打印结果。如果您想写入文件,可以使用此参数。