HBase - Describe 和 Alter

describe

此命令返回表的描述。其语法如下:

hbase> describe 'table name'

下面给出了对 emp 表执行 describe 命令的输出。

hbase(main):006:0> describe 'emp'
   DESCRIPTION
      ENABLED
      
'emp', {NAME ⇒ 'READONLY', DATA_BLOCK_ENCODING ⇒ 'NONE', BLOOMFILTER
⇒ 'ROW', REPLICATION_SCOPE ⇒ '0', COMPRESSION ⇒ 'NONE', VERSIONS ⇒
'1', TTL true

⇒ 'FOREVER', MIN_VERSIONS ⇒ '0', KEEP_DELETED_CELLS ⇒ 'false',
BLOCKSIZE ⇒ '65536', IN_MEMORY ⇒ 'false', BLOCKCACHE ⇒ 'true'}, {NAME
⇒ 'personal

data', DATA_BLOCK_ENCODING ⇒ 'NONE', BLOOMFILTER ⇒ 'ROW',
REPLICATION_SCOPE ⇒ '0', VERSIONS ⇒ '5', COMPRESSION ⇒ 'NONE',
MIN_VERSIONS ⇒ '0', TTL

⇒ 'FOREVER', KEEP_DELETED_CELLS ⇒ 'false', BLOCKSIZE ⇒ '65536',
IN_MEMORY ⇒ 'false', BLOCKCACHE ⇒ 'true'}, {NAME ⇒ 'professional
data', DATA_BLO

CK_ENCODING ⇒ 'NONE', BLOOMFILTER ⇒ 'ROW', REPLICATION_SCOPE ⇒ '0',
VERSIONS ⇒ '1', COMPRESSION ⇒ 'NONE', MIN_VERSIONS ⇒ '0', TTL ⇒
'FOREVER', K

EEP_DELETED_CELLS ⇒ 'false', BLOCKSIZE ⇒ '65536', IN_MEMORY ⇒
'false', BLOCKCACHE ⇒ 'true'}, {NAME ⇒ 'table_att_unset',
DATA_BLOCK_ENCODING ⇒ 'NO 

NE', BLOOMFILTER ⇒ 'ROW', REPLICATION_SCOPE ⇒ '0', COMPRESSION ⇒
'NONE', VERSIONS ⇒ '1', TTL ⇒ 'FOREVER', MIN_VERSIONS ⇒ '0',
KEEP_DELETED_CELLS

⇒ 'false', BLOCKSIZE ⇒ '6

alter

Alter 是用于对现有表进行更改的命令。使用此命令,您可以更改列族的最大单元格数、设置和删除表范围运算符以及从表中删除列族。

更改列族的最大单元格数

下面给出了更改列族的最大单元格数的语法。

hbase> alter 't1', NAME ⇒ 'f1', VERSIONS ⇒ 5

在下面的示例中,最大单元格数设置为 5。

hbase(main):003:0> alter 'emp', NAME ⇒ 'personal data', VERSIONS ⇒ 5
Updating all regions with the new schema...
0/1 regions updated.
1/1 regions updated.
Done.
0 row(s) in 2.3050 seconds

表范围运算符

使用 alter,您可以设置和删除表范围运算符,例如 MAX_FILESIZE、READONLY、MEMSTORE_FLUSHSIZE、DEFERRED_LOG_FLUSH 等。

设置只读

下面给出了使表只读的语法。

hbase>alter 't1', READONLY(option)

在下面的示例中,我们已将 emp 表设置为只读。

hbase(main):006:0> alter 'emp', READONLY
Updating all regions with the new schema...
0/1 regions updated.
1/1 regions updated.
Done.
0 row(s) in 2.2140 seconds

删除表范围运算符

我们还可以删除表范围运算符。下面给出了从 emp 表中删除"MAX_FILESIZE"的语法。

hbase> alter 't1', METHOD ⇒ 'table_att_unset', NAME ⇒ 'MAX_FILESIZE'

删除列族

使用 alter,您还可以删除列族。下面给出了使用 alter 删除列族的语法。

hbase> alter ' table name ', 'delete' ⇒ ' column family ' 

下面给出了从 'emp' 表中删除列族的示例。

假设 HBase 中有一个名为 employee 的表。它包含以下数据:

hbase(main):006:0> scan 'employee'

   ROW                   COLUMN+CELL

row1 column = personal:city, timestamp = 1418193767, value = hyderabad

row1 column = personal:name, timestamp = 1418193806767, value = raju

row1 column = professional:designation, timestamp = 1418193767, value = manager

row1 column = professional:salary, timestamp = 1418193806767, value = 50000

1 row(s) in 0.0160 seconds 

现在让我们使用 alter 命令删除名为 professional 的列族。

hbase(main):007:0> alter 'employee','delete'⇒'professional'
Updating all regions with the new schema...
0/1 regions updated.
1/1 regions updated.
Done.
0 row(s) in 2.2380 seconds 

现在验证更改后的表中的数据。观察到列族"professional"已不复存在,因为我们已将其删除。

hbase(main):003:0> scan 'employee'
   ROW             COLUMN + CELL
row1 column = personal:city, timestamp = 14181936767, value = hyderabad

row1 column = personal:name, timestamp = 1418193806767, value = raju

1 row(s) in 0.0830 seconds

使用 Java API 添加列族

您可以使用 HBAseAdmin 类的方法 addColumn() 向表添加列族。按照以下步骤向表添加列族。

步骤 1

实例化 HBaseAdmin 类。

// 实例化配置对象
Configuration conf = HBaseConfiguration.create();

// 实例化 HBaseAdmin 类
HBaseAdmin admin = new HBaseAdmin(conf);

步骤 2

addColumn() 方法需要表名和 HColumnDescriptor 类的对象。因此,实例化 HColumnDescriptor 类。 HColumnDescriptor 的构造函数反过来需要添加一个列族名称。这里我们向现有的"employee"表添加一个名为"contactDetails"的列族。

// 实例化 columnDescriptor 对象

HColumnDescriptor columnDescriptor = new
HColumnDescriptor("contactDetails");

步骤 3

使用 addColumn 方法添加列族。将表名称和 HColumnDescriptor 类对象作为参数传递给此方法。

// 添加列族
admin.addColumn("employee", new HColumnDescriptor("columnDescriptor"));

下面给出了向现有表添加列族的完整程序。

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.HColumnDescriptor;
import org.apache.hadoop.hbase.MasterNotRunningException;
import org.apache.hadoop.hbase.client.HBaseAdmin;

public class AddColoumn{

   public static void main(String args[]) throws MasterNotRunningException, IOException{

        // 实例化配置类。
        Configuration conf = HBaseConfiguration.create();
        
        // 实例化 HBaseAdmin 类。
        HBaseAdmin admin = new HBaseAdmin(conf);
        
        // 实例化 columnDescriptor 类
        HColumnDescriptor columnDescriptor = new HColumnDescriptor("contactDetails");
        
        // 添加列族
        admin.addColumn("employee", columnDescriptor);
        System.out.println("coloumn Added");
   }
}

编译并执行上述程序,如下所示。

$javac AddColumn.java
$java AddColumn

仅当您在" .bashrc "中设置了类路径时,上述编译才有效。如果没有,请按照下面给出的步骤编译您的 .java 文件。

//如果"/home/home/hadoop/hbase "是您的 Hbase 主文件夹。

$javac -cp /home/hadoop/hbase/lib/*: Demo.java

如果一切顺利,它将产生以下输出:

column Added

使用 Java API 删除列系列

您可以使用 HBAseAdmin 类的方法 deleteColumn() 从表中删除列系列。按照以下步骤向表中添加列族。

步骤 1

实例化 HBaseAdmin 类。

// 实例化配置对象
Configuration conf = HBaseConfiguration.create();

// 实例化 HBaseAdmin 类
HBaseAdmin admin = new HBaseAdmin(conf);

步骤 2

使用 deleteColumn() 方法添加列族。将表名和列族名称作为参数传递给此方法。

// 删除列族
admin.deleteColumn("employee", "contactDetails");

下面给出了从现有表中删除列族的完整程序。

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.MasterNotRunningException;
import org.apache.hadoop.hbase.client.HBaseAdmin;

public class DeleteColoumn{

   public static void main(String args[]) throws MasterNotRunningException, IOException{

        // 实例化配置类。
        Configuration conf = HBaseConfiguration.create();
        
        // 实例化 HBaseAdmin 类。
        HBaseAdmin admin = new HBaseAdmin(conf);
        
        // 删除列族
        admin.deleteColumn("employee","contactDetails");
        System.out.println("coloumn removed");
   }
}

编译并执行上述程序,如下所示。

$javac DeleteColumn.java
$java DeleteColumn

输出应如下所示:

column deleted