建表
https://www.jianshu.com/p/4f60f3c923fe
0 CREATE TABLE
https://blog.csdn.net/Thomson617/article/details/86153924
1 | CREATE EXTERNAL TABLE dim_sku_info ( |
1 EXTERNAL
关键字可以让用户创建一个外部表,默认是内部表
2 字段的数据类型
https://blog.csdn.net/weixin_46941961/article/details/108551512
https://blog.csdn.net/weixin_43215250/article/details/90034169
集合数据类型:Array、Map和Struct
1.分区
https://www.jianshu.com/p/5dbbaea8ff41
PARTITIONED BY (dt
string)
0 分类
静态分区SP(static partition)
动态分区DP(dynamic partition)
静态分区与动态分区的主要区别在于静态分区是手动指定,而动态分区是通过数据来进行判断。
1 静态分区
1 | --建表 |
2 动态分区
注意分区字段dt数据来源于date_format(create_time,’yyyy-MM-dd’)
和静态分区比较,建表的时候没区别,加载数据有区别
1 | --建表 |
2 LOCATION
LOCATION ‘/warehouse/gmall/ods/ods_log’
指定数据在hdfs上的存储位置
3 ROW FORMAT
https://www.imooc.com/article/12213
https://blog.csdn.net/S_Running_snail/article/details/84258162
指定数据切分格式
ROW FORMAT DELIMITED FIELDS TERMINATED BY ‘\t’
4 STORED AS
https://blog.csdn.net/ZZQHELLO2018/article/details/106175887
指定存储方式
行式存储:TEXTFILE 、SEQUENCEFILE 列式存储: ORC、PARQUET
5 TBLPROPERTIES
https://blog.csdn.net/yangguosb/article/details/83651073
TBLPROPERTIES是表的一些属性,HIVE内置了一部分属性,使用者也可以在创建表时进行自定义;
TBLPROPERTIES (“parquet.compression”=”lzo”);