AVRO - 通过生成类进行反序列化
如前所述,可以通过生成与模式对应的类或使用解析器库将 Avro 模式读入程序。本章介绍如何通过生成类读取模式,以及如何使用 Avro 反序列化数据。
通过生成类进行反序列化
序列化数据存储在文件 emp.avro 中。您可以使用 Avro 对其进行反序列化和读取。
按照下面给出的步骤对文件中的序列化数据进行反序列化。
步骤 1
使用 SpecificDatumReader 类创建 DatumReader 接口的对象。
DatumReader<emp>empDatumReader = new SpecificDatumReader<emp>(emp.class);
步骤 2
为 emp 类实例化 DataFileReader。此类从文件中读取序列化数据。它需要 Dataumeader 对象和序列化数据所在文件的路径作为构造函数的参数。
DataFileReader<emp> dataFileReader = new DataFileReader(new File("/path/to/emp.avro"), empDatumReader);
步骤 3
使用 DataFileReader 的方法打印反序列化的数据。
如果 Reader 中有任何元素,hasNext() 方法将返回布尔值。
DataFileReader 的 next() 方法返回 Reader 中的数据。
while(dataFileReader.hasNext()){ em=dataFileReader.next(em); System.out.println(em); }
示例 – 通过生成类进行反序列化
以下完整程序展示了如何使用 Avro 对文件中的数据进行反序列化。
import java.io.File; import java.io.IOException; import org.apache.avro.file.DataFileReader; import org.apache.avro.io.DatumReader; import org.apache.avro.specific.SpecificDatumReader; public class Deserialize { public static void main(String args[]) throws IOException{ //反序列化对象 DatumReader<emp> empDatumReader = new SpecificDatumReader<emp>(emp.class); //实例化 DataFileReader DataFileReader<emp> dataFileReader = new DataFileReader<emp>(new File("/home/Hadoop/Avro_Work/with_code_genfile/emp.avro"), empDatumReader); emp em=null; while(dataFileReader.hasNext()){ em=dataFileReader.next(em); System.out.println(em); } } }
浏览放置生成代码的目录。在本例中,位于 home/Hadoop/Avro_work/with_code_gen。
$ cd home/Hadoop/Avro_work/with_code_gen/
现在,将上述程序复制并保存在名为 DeSerialize.java 的文件中。编译并执行它,如下所示 −
$ javac Deserialize.java $ java Deserialize
输出
{"name": "omar", "id": 1, "salary": 30000, "age": 21, "address": "Hyderabad"} {"name": "ram", "id": 2, "salary": 40000, "age": 30, "address": "Hyderabad"} {"name": "robbin", "id": 3, "salary": 35000, "age": 25, "address": "Hyderabad"}