Apache NiFi - 基本概念

Apache NiFi 由 Web 服务器、流量控制器和Processor(处理器)组成,运行在 Java 虚拟机上。 它还具有 3 个存储库 Flowfile Repository、Content Repository 和 Provenance Repository,如下图所示。

Apache Web 服务器

流文件存储库

该存储库存储通过 apache NiFi 数据流的每个流文件的当前状态和属性。 该存储库的默认位置位于 apache NiFi 的根目录中。 可以通过更改名为"nifi.flowfile.repository.directory"的属性来更改此存储库的位置。

内容存储库

该存储库包含 NiFi 所有流文件中存在的所有内容。 它的默认目录也在NiFi的根目录中,可以使用"org.apache.nifi.controller.repository.FileSystemRepository"属性进行更改。 该目录占用磁盘空间较大,建议安装盘有足够的空间。

来源存储库

存储库跟踪并存储在NiFi中流动的所有流文件的所有事件。 有两个来源存储库 - 易失性来源存储库(在此存储库中,所有来源数据在重新启动后都会丢失)和持久来源存储库。 它的默认目录也在NiFi的根目录中,可以使用相应存储库的"org.apache.nifi.provenance.PersistentProvenanceRepository"和"org.apache.nifi.provenance.VolatileProvenanceRepositor"属性来更改它。

Provenance 存储库