Apache Tajo - 配置设置

Tajo 的配置是基于 Hadoop 的配置系统。 本章详细介绍 Tajo 配置设置。

基本设置

Tajo 使用以下两个配置文件 −

  • catalog-site.xml − 目录服务器的配置。
  • tajo-site.xml − 其他 Tajo 模块的配置。

分布式模式配置

分布式模式设置在 Hadoop 分布式文件系统 (HDFS) 上运行。 让我们按照以下步骤配置 Tajo 分布式模式设置。

tajo-site.xml

此文件在 /path/to/tajo/conf 目录中可用,并充当其他 Tajo 模块的配置。 要以分布式模式访问 Tajo,请对"tajo-site.xml"应用以下更改。

<property> 
   <name>tajo.rootdir</name> 
   <value>hdfs://hostname:port/tajo</value> 
</property>
  
<property> 
   <name>tajo.master.umbilical-rpc.address</name> 
   <value>hostname:26001</value> 
</property> 
 
<property> 
   <name>tajo.master.client-rpc.address</name> 
   <value>hostname:26002</value> 
</property>
  
<property> 
   <name>tajo.catalog.client-rpc.address</name> 
   <value>hostname:26005</value> 
</property>   

主节点配置

Tajo 使用 HDFS 作为主要存储类型。 配置如下,应添加到"tajo-site.xml"中。

<property> 
   <name>tajo.rootdir</name> 
   <value>hdfs://namenode_hostname:port/path</value> 
</property> 

目录配置

如果您想自定义目录服务,请将 $path/to/Tajo/conf/catalogsite.xml.template 复制到 $path/to/Tajo/conf/catalog-site.xml 并根据需要添加以下任意配置。

例如,如果您使用"Hive目录存储"访问Tajo,则配置应如下所示 −

<property> 
   <name>tajo.catalog.store.class</name> 
   <value>org.apache.tajo.catalog.store.HCatalogStore</value> 
</property> 

如果需要存储MySQL目录,则应用以下更改 −

<property> 
   <name>tajo.catalog.store.class</name> 
   <value>org.apache.tajo.catalog.store.MySQLStore</value> 
</property> 

<property> 
   <name>tajo.catalog.jdbc.connection.id</name> 
   <value><mysql user name></value> 
</property>
 
<property> 
   <name>tajo.catalog.jdbc.connection.password</name> 
   <value><mysql user password></value> 
</property>
 
<property> 
   <name>tajo.catalog.jdbc.uri</name> 
   <value>jdbc:mysql://<mysql host name>:<mysql port>/<database name for tajo>
      ?createDatabaseIfNotExist = true</value> 
</property> 

同样,您可以在配置文件中注册其他 Tajo 支持的目录。

工作线程配置

默认情况下,TajoWorker 将临时数据存储在本地文件系统上。 它在"tajo-site.xml"文件中定义如下 −

<property> 
   <name>tajo.worker.tmpdir.locations</name> 
   <value>/disk1/tmpdir,/disk2/tmpdir,/disk3/tmpdir</value> 
</property> 

要增加每个工作资源运行任务的能力,请选择以下配置 −

<property> 
   <name>tajo.worker.resource.cpu-cores</name> 
   <value>12</value> 
</property>
 
<property> 
   <name>tajo.task.resource.min.memory-mb</name> 
   <value>2000</value> 
</property>
  
<property> 
   <name>tajo.worker.resource.disks</name> 
   <value>4</value> 
</property> 

要使 Tajo Worker 以专用模式运行,请选择以下配置 −

<property> 
   <name>tajo.worker.resource.dedicated</name> 
   <value>true</value> 
</property>