HBase - 创建数据

使用 HBase Shell 插入数据

本章演示如何在 HBase 表中创建数据。要在 HBase 表中创建数据,请使用以下命令和方法:

  • put 命令,

  • Put 类的 add() 方法,以及

  • HTable 类的 put() 方法。

作为示例,我们将在 HBase 中创建下表。

HBase Table

使用 put 命令,您可以将行插入表中。其语法如下:

put '<table name>','row1','<colfamily:colname>','<value>'

插入第一行

让我们将第一行值插入到 emp 表中,如下所示。

hbase(main):005:0> put 'emp','1','personal data:name','raju'
0 row(s) in 0.6600 seconds
hbase(main):006:0> put 'emp','1','personal data:city','hyderabad'
0 row(s) in 0.0410 seconds
hbase(main):007:0> put 'emp','1','professional
data:designation','manager'
0 row(s) in 0.0240 seconds
hbase(main):007:0> put 'emp','1','professional data:salary','50000'
0 row(s) in 0.0240 seconds

使用 put 命令以相同方式插入剩余行。如果插入整个表,您将获得以下输出。

hbase(main):022:0> scan 'emp'

   ROW                        COLUMN+CELL
1 column=personal data:city, timestamp=1417524216501, value=hyderabad

1 column=personal data:name, timestamp=1417524185058, value=ramu

1 column=professional data:designation, timestamp=1417524232601,

 value=manager
 
1 column=professional data:salary, timestamp=1417524244109, value=50000

2 column=personal data:city, timestamp=1417524574905, value=chennai

2 column=personal data:name, timestamp=1417524556125, value=ravi

2 column=professional data:designation, timestamp=1417524592204,

 value=sr:engg
 
2 column=professional data:salary, timestamp=1417524604221, value=30000

3 column=personal data:city, timestamp=1417524681780, value=delhi

3 column=personal data:name, timestamp=1417524672067, value=rajesh

3 column=professional data:designation, timestamp=1417524693187,

value=jr:engg
3 column=professional data:salary, timestamp=1417524702514,

value=25000 

使用 Java API 插入数据

您可以使用 Put 类的 add() 方法将数据插入 Hbase。您可以使用 HTable 类的 put() 方法保存数据。这些类属于 org.apache.hadoop.hbase.client 包。下面给出了在 HBase 表中创建数据的步骤。

步骤 1:实例化配置类

Configuration 类将 HBase 配置文件添加到其对象。您可以使用 HbaseConfiguration 类的 create() 方法创建配置对象,如下所示。

Configuration conf = HbaseConfiguration.create();

步骤 2:实例化 HTable 类

您有一个名为 HTable 的类,它是 HBase 中 Table 的实现。此类用于与单个 HBase 表进行通信。实例化此类时,它接受配置对象和表名作为参数。您可以按如下所示实例化 HTable 类。

HTable hTable = new HTable(conf, tableName);

步骤 3:实例化 PutClass

要将数据插入 HBase 表,请使用 add() 方法及其变体。此方法属于 Put,因此实例化 put 类。此类需要您要插入数据的行名称(字符串格式)。您可以实例化 Put 类,如下所示。

Put p = new Put(Bytes.toBytes("row1"));

步骤 4:插入数据

Put 类的 add() 方法用于插入数据。它需要 3 个字节数组,分别表示列族、列限定符(列名)和要插入的值。使用 add() 方法将数据插入 HBase 表,如下所示。

p.add(Bytes.toBytes("coloumn family "), Bytes.toBytes("column
name"),Bytes.toBytes("value"));

步骤 5:保存表中的数据

插入所需的行后,通过将 put 实例添加到 HTable 类的 put() 方法保存更改,如下所示。

hTable.put(p);

步骤 6:关闭 HTable 实例

在 HBase 表中创建数据后,使用 close() 方法关闭 HTable 实例,如下所示。

hTable.close();

下面给出了在 HBase 表中创建数据的完整程序。

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.client.HTable;
import org.apache.hadoop.hbase.client.Put;
import org.apache.hadoop.hbase.util.Bytes;

public class InsertData{

   public static void main(String[] args) throws IOException {

        // 实例化 Configuration 类
        Configuration config = HBaseConfiguration.create();
        
        // 实例化 HTable 类
        HTable hTable = new HTable(config, "emp");
        
        // 实例化 Put 类
        // 接受行名称。
        Put p = new Put(Bytes.toBytes("row1"));
        
        // 使用 add() 方法添加值
        // 接受列族名称、限定符/行名称、值
        p.add(Bytes.toBytes("personal"),
        Bytes.toBytes("name"),Bytes.toBytes("raju"));
        
        p.add(Bytes.toBytes("personal"),
        Bytes.toBytes("city"),Bytes.toBytes("hyderabad"));
        
        p.add(Bytes.toBytes("professional"),Bytes.toBytes("designation"),
        Bytes.toBytes("manager"));
        
        p.add(Bytes.toBytes("professional"),Bytes.toBytes("salary"),
        Bytes.toBytes("50000"));
        
        // 将 put 实例保存到 HTable。
        hTable.put(p);
        System.out.println("数据已插入");
        
        // 关闭 HTable
        hTable.close();
   }
}

编译并执行上述程序,如下所示。

$javac InsertData.java
$java InsertData

输出应如下所示:

data inserted