Hive使用Parquet文件格式(1.00) 2015-04-14 23:00

说明

Parquet文件格式会在文件信息头部中记录元数据信息。

使用方法

使用beeline连接hive:

1
2
3
4
/* 创建Hive表,使用Parquet文件格式 */
CREATE TABLE student(id INT,name STRING) STORED AS PARQUETFILE;
/* 插入数据 */
INSERT OVERWRITE TABLE student SELECT room,city FROM house;
  • 注意事项

如果源文件格式本身不是Parquet格式,不能使用LOAD DATA命令为student表加载数据

查看HDFS上的文件

查看HDFS上的文件,可以看到文件格式不是普通的文本格式:
/user/hive/warehouse/student/000000_0

Tags: #Hive    Post on Hadoop