Teradata - FastLoad
FastLoad 实用程序用于将数据加载到空表中。由于它不使用临时日志,因此可以快速加载数据。即使目标表是 MULTISET 表,它也不会加载重复的行。
限制
目标表不应具有二级索引、连接索引和外键引用。
FastLoad 的工作原理
FastLoad 分两个阶段执行。
阶段 1
解析引擎从输入文件中读取记录并将块发送到每个 AMP。
每个 AMP 存储记录块。
然后 AMP 对每个记录进行哈希处理并将其重新分配给正确的 AMP。
在第 1 阶段结束时,每个 AMP 都有其行,但它们不在行哈希序列中。
阶段2
当 FastLoad 收到 END LOADING 语句时,第 2 阶段开始。
每个 AMP 对行哈希上的记录进行排序并将其写入磁盘。
目标表上的锁被释放,错误表被删除。
示例
创建一个包含以下记录的文本文件,并将文件命名为 employee.txt。
101,Mike,James,1980-01-05,2010-03-01,1 102,Robert,Williams,1983-03-05,2010-09-01,1 103,Peter,Paul,1983-04-01,2009-02-12,2 104,Alex,Stuart,1984-11-06,2014-01-01,2 105,Robert,James,1984-12-01,2015-03-09,3
以下是将上述文件加载到 Employee_Stg 表中的 FastLoad 脚本示例。
LOGON 192.168.1.102/dbc,dbc; DATABASE tduser; BEGIN LOADING tduser.Employee_Stg ERRORFILES Employee_ET, Employee_UV CHECKPOINT 10; SET RECORD VARTEXT ","; DEFINE in_EmployeeNo (VARCHAR(10)), in_FirstName (VARCHAR(30)), in_LastName (VARCHAR(30)), in_BirthDate (VARCHAR(10)), in_JoinedDate (VARCHAR(10)), in_DepartmentNo (VARCHAR(02)), FILE = employee.txt; INSERT INTO Employee_Stg ( EmployeeNo, FirstName, LastName, BirthDate, JoinedDate, DepartmentNo ) VALUES ( :in_EmployeeNo, :in_FirstName, :in_LastName, :in_BirthDate (FORMAT 'YYYY-MM-DD'), :in_JoinedDate (FORMAT 'YYYY-MM-DD'), :in_DepartmentNo ); END LOADING; LOGOFF;
执行 FastLoad 脚本
一旦创建输入文件 employee.txt 并将 FastLoad 脚本命名为 EmployeeLoad.fl,您就可以在 UNIX 和 Windows 中使用以下命令运行 FastLoad 脚本。
FastLoad < EmployeeLoad.fl;
一旦执行上述命令,FastLoad 脚本将运行并生成日志。在日志中,您可以看到 FastLoad 处理的记录数和状态代码。
**** 03:19:14 END LOADING COMPLETE Total Records Read = 5 Total Error Table 1 = 0 ---- Table has been dropped Total Error Table 2 = 0 ---- Table has been dropped Total Inserts Applied = 5 Total Duplicate Rows = 0 Start: Fri Jan 8 03:19:13 2016 End : Fri Jan 8 03:19:14 2016 **** 03:19:14 Application Phase statistics: Elapsed time: 00:00:01 (in hh:mm:ss) 0008 LOGOFF; **** 03:19:15 Logging off all sessions
FastLoad 术语
以下是 FastLoad 脚本中使用的常用术语列表。
LOGON − 登录 Teradata 并启动一个或多个会话。
DATABASE − 设置默认数据库。
BEGIN LOADING − 标识要加载的表。
ERRORFILES − 标识需要创建/更新的 2 个错误表。
CHECKPOINT − 定义何时进行检查点操作。
SET RECORD −指定输入文件格式是格式化、二进制、文本还是未格式化。
DEFINE − 定义输入文件布局。
FILE − 指定输入文件的名称和路径。
INSERT − 将输入文件中的记录插入目标表。
END LOADING − 启动 FastLoad 的第 2 阶段。将记录分发到目标表中。
LOGOFF − 结束所有会话并终止 FastLoad。