spaCy - Debug-data 命令
借助此命令,我们可以分析、调试和验证我们的训练和开发数据。我们还可以得到一些有用的统计数据,无效的实体注释,循环依赖关系和低数据标签等。
Debug-data命令如下 −
python -m spacy debug-data [lang] [train_path] [dev_path] [--base-model] [--pipeline] [--ignore-warnings] [--verbose] [--no-format]
参数
下表解释了其参数 −
参数 | 类型 | 描述 |
---|---|---|
lang | 位置 | 此参数表示模型语言。 |
train_path | Positional | 这是 JSON 格式的训练数据的位置,可以是文件或文件目录。 |
dev_path | Positional | 这是用于评估的 JSON 格式的开发数据的位置,可以是文件或文件目录。 |
--tag-map-path, -tm V2.2.4 | Option | 在 2.2.4 版本中引入,表示 JSON 格式的标签映射的位置。 |
--base-model, -b | option | 此参数是要更新的基础模型的名称。它是可选的。它可以是任何可加载的 spaCy 模型。 |
--pipeline, -p | option | 这是要训练的管道组件的逗号分隔名称。默认值为 'tagger,parser,ner'。 |
--ignore-warnings, -IW | Flag | 顾名思义,此参数将忽略警告,仅显示统计信息和错误。 |
--verbose, -V | Flag | 它将打印其他信息和说明。 |
–no-format, -NF | Flag | 它将打印结果。如果您想写入文件,可以使用此参数。 |