Apache NiFi - Processor(处理器)

Apache NiFi Processor(处理器)是创建数据流的基本块。 每个Processor(处理器)都有不同的功能,这有助于创建输出流文件。 下图所示的数据流是使用 GetFile Processor(处理器)从一个目录中获取文件,并使用 PutFile Processor(处理器)将其存储到另一个目录中。

PutFile Processor(处理器)

GetFile

GetFile 进程用于从特定目录中获取特定格式的文件。 它还为用户提供了其他选项,以更好地控制获取。 我们将在下面的属性部分讨论它。

GetFile

GetFile 设置

以下是GetFile进程的不同设置 −

Name

在"Name"设置中,用户可以根据项目或项目为Processor(处理器)定义任何名称,这使得名称更有意义。

Enable

用户可以使用此设置启用或禁用Processor(处理器)。

Penalty Duration

此设置允许用户在流程文件失败时添加惩罚持续时间。

Yield Duration

此设置用于指定Processor(处理器)的让出时间。 在此期间,不会再次安排该进程。

Bulletin Level

此设置用于指定该Processor(处理器)的日志级别。

Automatically Terminate Relationships

其中包含该特定进程的所有可用关系的检查列表。 通过选中这些框,用户可以对Processor(处理器)进行编程,以在该事件上终止流文件,并且不再在流中进一步发送它。

自动终止关系

GetFile 调度

这些是 GetFile Processor(处理器)提供的以下调度选项 −

Schedule Strategy

您可以通过选择时间驱动来按时间安排进程,也可以通过选择 CRON 驱动程序选项来安排指定的 CRON 字符串。

Concurrent Tasks

此选项用于定义该Processor(处理器)的并发任务计划。

执行

用户可以使用此选项定义是在所有节点中运行Processor(处理器)还是仅在主节点中运行Processor(处理器)。

Run Schedule

用于定义时间驱动策略的时间或CRON驱动策略的CRON表达式。

运行计划

GetFile 属性

GetFile 提供了多个属性,如下图所示,强制执行 输入目录和文件过滤器等属性到路径过滤器和最大文件大小等可选属性。 用户可以使用这些属性来管理文件获取过程。

获取文件属性

GetFile 注释

本节用于指定有关Processor(处理器)的任何信息。

GetFile 注释

PutFile

PutFileProcessor(处理器)用于将文件从数据流存储到特定位置。

PutFile

PutFile 设置

PutFile Processor(处理器)具有以下设置 −

Name

在"Name"设置中,用户可以根据项目或使名称更有意义的名称为Processor(处理器)定义任何名称。

Enable

用户可以使用此设置启用或禁用Processor(处理器)。

Penalty Duration

此设置允许用户在流程文件失败时添加惩罚持续时间。

Yield Duration

此设置用于指定Processor(处理器)的让出时间。 在此期间,不会再次安排该进程。

Bulletin Level

此设置用于指定该Processor(处理器)的日志级别。

Automatically Terminate Relationships

此设置包含该特定进程的所有可用关系的检查列表。 通过选中这些框,用户可以对Processor(处理器)进行编程,以在该事件上终止流文件,并且不再在流中进一步发送它。

自动终止

PutFile 调度

这些是 PutFile Processor(处理器)提供的以下调度选项 −

Schedule Strategy

您可以通过选择计时器驱动或通过选择 CRON 驱动程序选项指定的 CRON 字符串来按时间安排进程。 还有一个实验策略"事件驱动",它将在特定事件上触发Processor(处理器)。

Concurrent Tasks

此选项用于定义该Processor(处理器)的并发任务计划。

执行

用户可以使用此选项定义是在所有节点上运行Processor(处理器)还是仅在主节点上运行Processor(处理器)。

Run Schedule

用于定义定时器驱动策略的时间或CRON驱动策略的CRON表达式。

Putfile 运行计划

PutFile 属性

PutFile Processor(处理器)提供诸如 Directory 之类的属性来指定用于文件传输的输出目录,以及其他属性来管理传输,如下图所示。

PutFile 属性

PutFile 注释

本节用于指定有关Processor(处理器)的任何信息。

Putfile 注释