Hive SQL查询汇总分析
目录
SQL查询汇总分析
成绩查询
查询编号为“02”的课程的总成绩
查询参加考试的学生个数
分组查询
查询各科成绩最高和最低的分
查询每门课程有多少学生参加了考试(有考试成绩)
查询男生、女生人数
分组结果的条件
查询平均成绩大于60分的学生的学号和平均成绩
查询至少选修四门课程的学生学号
查询同姓(假设每个学生姓名的第一个字为姓)的学生名单并统计同姓人数大于2的姓
查询每门课程的平均成绩,结果按平均成绩升序排序,平均成绩相同时,按课程号降序排列
统计参加考试人数大于等于15的学科
查询结果排序 & 分组指定条件
查询学生的总成绩并按照总成绩降序排序
按照如下格式显示学生的语文、数学、英语三科成绩,没有成绩的输出为0,按照学生的有效平均成绩降序显示
查询一共参加三门课程且其中一门为语文课程的学生的id和姓名
SQL查询汇总分析
环境准备看如下链接
环境准备https://blog.csdn.net/qq_45115959/article/details/142057624?spm=1001.2014.3001.5501
成绩查询
查询编号为“02”的课程的总成绩
hive>
select
course_id,
sum(score) score_sum
from score_info
where course_id='02'
group by course_id;
结果
course_id | score_sum |
---|---|
02 | 1133 |
查询参加考试的学生个数
思路: 对成绩表中的学号做去重并count
hive>
select
count(distinct stu_id) stu_num
from score_info;
结果
stu_num |
---|
19 |
分组查询
查询各科成绩最高和最低的分
思路: 按照学科分组并使用max和min。
hive>
select
course_id,
max(score) max_score,
min(score) min_score
from score_info
group by course_id;
结果
course_id | max_score | min_score |
---|---|---|
01 | 94 | 38 |
02 | 93 | 34 |
03 | 99 | 32 |
04 | 100 | 34 |
05 | 87 | 59 |
查询每门课程有多少学生参加了考试(有考试成绩)
hive>
select
course_id,
count(stu_id) stu_num
from score_info
group by course_id;
结果
course_id | stu_num |
---|---|
01 | 19 |
02 | 19 |
03 | 19 |
04 | 12 |
05 | 5 |
查询男生、女生人数
hive>
select
sex,
count(stu_id) count
from student_info
group by sex;
结果
sex | count |
---|---|
女 | 9 |
男 | 11 |
分组结果的条件
查询平均成绩大于60分的学生的学号和平均成绩
思路分析
- 平均成绩:展开来说就是计算每个学生的平均成绩。
- 这里涉及到“每个”就是要分组了。
- 平均成绩大于60分,就是对分组结果指定条件。
- 首先要分组求出每个学生的平均成绩,筛选高于60分的,并反查出这批学生,统计出这些学生总的平均成绩。
HQL实操
hive>
select
stu_id,
avg(score) score_avg
from score_info
group by stu_id
having score_avg > 60;
</