当前位置: 首页 > article >正文

hive表格统计信息不准确

问题描述

有个hive分区表,orc存储格式,有个分区,查询 select count(1) from table where dt='yyyyMMdd' 结果是0, 但查询 select * from table where dt='yyyyMMdd'又能查到数据,去hdfs对应目录下查看,也能看到有数据文件

解决

执行如下sql

ANALYZE TABLE db.table1 PARTITION(dt='20240908') COMPUTE STATISTICS

然后,重新查询count(1),结果恢复正确

参考

https://blog.51cto.com/u_16213353/7719891
https://imperio-wxm.github.io/2019/02/21/Hive-Table-Statistics/


http://www.kler.cn/a/299251.html

相关文章:

  • ISP面试准备2
  • HarmonyOS---应用测试概述
  • Linux 上安装 PostgreSQL
  • 初学者指南:掌握 Vue 路由(Router)
  • Redis协议与异步方式
  • HTML5( HTML5 、CSS3) 第一天
  • pytest 生成allure测试报告
  • PHP函数如何接收回调参数?
  • LCD彩条显示——FPGA学习笔记10
  • 在Spring中,相同类型不同ID的bean,与相同ID多次获取bean的区别和联系
  • 高光谱图像处理,使其适用于深度学习任务
  • 鸿蒙轻内核M核源码分析系列十五 CPU使用率CPUP
  • Ajax和XMLHttpRequest之间的关系
  • 数据集 CrowdPose 多人姿态估计 深度学习 >> DataBall
  • vue2 二次封装el-tooltip
  • 基于STC12C5A60S2单片机的LED汉字显示系统的设计
  • HTML5中`<span>`标签深入解析
  • MySQL高可用配置及故障切换
  • 餐饮酒店旅游服务网站整站模板打包下载
  • 基于Logistic-Map混沌序列的数字信息加解密算法matlab仿真,支持对文字,灰度图,彩色图,语音进行加解密