Apache NiFi - Processor(处理器)分类

在本章中,我们将讨论 Apache NiFi 中的Processor(处理器)分类。

数据摄取Processor(处理器)

数据摄取类别下的Processor(处理器)用于将数据摄取到 NiFi 数据流中。 这些主要是apache NiFi中任何数据流的起点。 属于这些类别的一些Processor(处理器)有 GetFile、GetHTTP、GetFTP、GetKAFKA 等。

路由和中介Processor(处理器)

路由和中介Processor(处理器)用于根据流文件的属性或内容中的信息将流文件路由到不同的Processor(处理器)或数据流。 这些Processor(处理器)还负责控制 NiFi 数据流。 属于此类别的一些Processor(处理器)有 RouteOnAttribute、RouteOnContent、ControlRate、RouteText 等。

数据库访问Processor(处理器)

此数据库访问类别的Processor(处理器)能够从数据库选择或插入数据或执行和准备其他 SQL 语句。 这些Processor(处理器)主要使用Apache NiFi的数据连接池控制器设置。 属于此类别的一些Processor(处理器)包括 ExecuteSQL、PutSQL、PutDatabaseRecord、ListDatabaseTables 等。

属性提取Processor(处理器)

属性提取Processor(处理器)负责NiFi数据流中的提取、分析、更改流文件属性处理。 属于此类别的一些Processor(处理器)包括 UpdateAttribute、EvaluateJSONPath、ExtractText、AttributesToJSON 等。

系统交互Processor(处理器)

系统交互Processor(处理器)用于在任何操作系统中运行进程或命令,这些Processor(处理器)还运行多种语言的脚本来与各种系统交互。 属于此类别的一些Processor(处理器)有 ExecuteScript、ExecuteProcess、ExecuteGroovyScript、ExecuteStreamCommand 等。

数据转换Processor(处理器)

属于数据转换的Processor(处理器)能够更改流文件的内容。 当用户必须将流文件作为 HTTP 主体发送以调用 HTTP Processor(处理器)时,这些可用于完全替换通常使用的流文件的数据。 属于此类别的一些Processor(处理器)有 ReplaceText、JoltTransformJSON 等。

发送数据Processor(处理器)

发送数据Processor(处理器)通常是数据流中的最终Processor(处理器)。 这些Processor(处理器)负责存储数据或将数据发送到目标服务器。 成功存储或发送数据后,这些Processor(处理器)会删除具有成功关系的流文件。 属于此类别的Processor(处理器)有 PutEmail、PutKafka、PutSFTP、PutFile、PutFTP 等。

拆分和聚合Processor(处理器)

这些Processor(处理器)用于拆分和合并流文件中存在的内容。 属于此类别的一些Processor(处理器)包括 SplitText、SplitJson、SplitXml、MergeContent、SplitContent 等。

HTTP Processor(处理器)

这些Processor(处理器)处理 HTTP 和 HTTPS 调用。 属于此类别的一些Processor(处理器)有 InvokeHTTP、PostHTTP、ListenHTTP 等。

AWS Processor(处理器)

AWSProcessor(处理器)负责与Amazon Web服务系统交互。属于此类别的Processor(处理器)有GetSQS、PutSNS、PutS3Object、FetchS3Object等。