HBase - 读取数据

使用 HBase Shell 读取数据

get 命令和 HTable 类的 get() 方法用于从 HBase 中的表中读取数据。使用 get 命令,您可以一次获取一行数据。其语法如下:

get '<table name>','row1'

示例

以下示例显示如何使用 get 命令。让我们扫描 emp 表的第一行。

hbase(main):012:0> get 'emp', '1'

   COLUMN                     CELL
   
personal : city timestamp = 1417521848375, value = hyderabad

personal : name timestamp = 1417521785385, value = ramu

professional: designation timestamp = 1417521885277, value = manager

professional: salary timestamp = 1417521903862, value = 50000

4 row(s) in 0.0270 seconds

读取特定列

下面给出了使用 get 方法读取特定列的语法。

hbase> get '表名称', 'rowid', {COLUMN ⇒ '列系列:列名称 '}

示例

下面给出了读取 HBase 表中特定列的示例。

hbase(main):015:0> get 'emp', 'row1', {COLUMN ⇒ 'personal:name'}
COLUMN CELL
personal:name timestamp = 1418035791555, value = raju
1 row(s) in 0.0080 seconds

使用 Java API 读取数据

要从 HBase 表中读取数据,请使用 HTable 类的 get() 方法。此方法需要 Get 类的实例。按照下面给出的步骤从 HBase 表中检索数据。

步骤 1:实例化配置类

Configuration 类将 HBase 配置文件添加到其对象。您可以使用 HbaseConfiguration 类的 create() 方法创建配置对象,如下所示。

Configuration conf = HbaseConfiguration.create();

步骤 2:实例化 HTable 类

您有一个名为 HTable 的类,它是 HBase 中 Table 的实现。此类用于与单个 HBase 表进行通信。在实例化此类时,它接受配置对象和表名作为参数。您可以按如下所示实例化 HTable 类。

HTable hTable = new HTable(conf, tableName);

步骤 3:实例化 Get 类

您可以使用 HTable 类的 get() 方法从 HBase 表中检索数据。此方法从给定行中提取单元格。它需要 Get 类对象作为参数。按如下所示创建它。

Get get = new Get(toBytes("row1"));

步骤 4:读取数据

检索数据时,您可以通过 id 获取单行,或通过一组行 id 获取一组行,或扫描整个表或行子集。

您可以使用 Get 类中的 add 方法变体检索 HBase 表数据。

要从特定列族中获取特定列,请使用以下方法。

get.addFamily(personal) 

要获取特定列族中的所有列,请使用以下方法。

get.addColumn(personal, name)

步骤 5:获取结果

通过将 Get 类实例传递给 HTable 类的 get 方法获取结果。此方法返回 Result 类对象,该对象保存所请求的结果。下面给出了 get() 方法的用法。

Result result = table.get(g);

步骤 6:从结果实例读取值

Result 类提供 getValue() 方法从其实例读取值。如下所示使用它从 Result 实例中读取值。

byte [] value = result.getValue(Bytes.toBytes("personal"),Bytes.toBytes("name"));
byte [] value1 = result.getValue(Bytes.toBytes("personal"),Bytes.toBytes("city"));

下面给出了从 HBase 表读取值的完整程序。

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.client.Get;
import org.apache.hadoop.hbase.client.HTable;
import org.apache.hadoop.hbase.client.Result;
import org.apache.hadoop.hbase.util.Bytes;

public class RetriveData{

   public static void main(String[] args) throws IOException, Exception{
   
    // 实例化 Configuration 类
    Configuration config = HBaseConfiguration.create();
    
    // 实例化 HTable 类
    HTable table = new HTable(config, "emp");
    
    // 实例化 Get 类
    Get g = new Get(Bytes.toBytes("row1"));
    
    // 读取数据
    Result result = table.get(g);
    
    // 从 Result 类对象读取值
    byte [] value = result.getValue(Bytes.toBytes("personal"),Bytes.toBytes("name"));
    
    byte [] value1 = result.getValue(Bytes.toBytes("personal"),Bytes.toBytes("city"));
    
    // 打印值
    String name = Bytes.toString(value);
    String city = Bytes.toString(value1);
    
    System.out.println("name: " + name + " city: " + city);
   }
}

编译并执行上述程序,如下所示。

$javac RetriveData.java
$java RetriveData

输出应如下所示:

name: Raju city: Delhi