Hive数据
处理Hive中的数据倾斜的方法
目录1 groupby(大表分组-局部聚合+全局聚合)2 join(大中表Join - 加salt + 小表膨胀)3 双大表Join - 抽样取倾斜key+BroadJoin4 小结1 groupby(大表分组-局部聚合+全局聚合)[详细]
2024-10-30 08:57 分类:数据库-
Hive数据导出详解
目录一、数据导出是什么?二、六大帮派1.insert2.Hadoop命令导出到本地3.Hive shell命令导出4.export导出到HDFS上5.Sqoop导出6.清除表中的数据(Truncate)——删库跑路总结一、数据导出是什么?[详细]
2023-04-15 08:57 分类:数据库