当前位置: 首页 > article >正文

Hive从入门到运用

hive简介

hive的设计思想(本质是一个翻译器)

上传安装包

解压,查看

运行hive(一定要启动hadoop,是有依赖关系的。)

测试启动方法,和建表

文件创建很上传到hdfs,直接上传到hive表的目录上去

创建一个文件,并在文件内写入数据。最后上传到hdfs

注意上传目录可以使用hive的目录

这样hive就有了这个文件

测试hive的查询

hive导入数据(load data 语句)

除了select * 以外其余的语句都会变成mapreduce。执行。

hive的表(内部表/外部表)

像我们自己用语句建立的表,存放在/user/hive/warehouse/**表,如此算是内部表。

例如下创建一个外部表

创建文件,做数据填充,检查数据

内部表和外部表的区别,内部表删除会直接删除,数据也会直接删除,但是外部表删除后只是把原数据库的的地址删除掉,但是hdfs的数据是不会删除的。

关联查询

结果如下

元数据库配置

这个元数据库是hive自带的,名字叫做derby数据库。只能单实例运行,如下

为了解决如果已经有客户端链接,就不能再次链接的问题,所以我们要求修改原数据库的配置

配置如下,进入conf文件夹,添加文件hive-site.xml

配置文件填充如下:切记将mysql的驱动配置一个到/lib下,否则mysql无法启动。

重启hive,将数据源改变为mysql。

看都看了,点个关注呗!


http://www.kler.cn/a/563887.html

相关文章:

  • win11本地部署deepseek大模型(安装ollama+docker+open-webui)最终实现自己的项目可通过API调用投喂数据后的模型
  • 关于order by的sql注入实验
  • 若依框架集成阿里云OSS
  • ElasticSearch13-8.x操作
  • MySQL(面试题 - 同类型归纳面试题)
  • Linux 常用命令大全及详解
  • 性能测试丨微信小程序性能优化指南
  • DeepSeek掘金——蒸馏DeepSeek-R1到自己的模型
  • VMware虚拟机Mac版安装Win10系统
  • 仿12306购票系统(3)
  • CF 90A.Cableway(Java实现)
  • python接入串口数据
  • 地理数据可视化:飞线说明(笔记)
  • 【MATLAB中的图像数据结构】
  • 企业知识库搭建:14款开源与免费系统选择
  • 电商项目-秒杀系统(一)秒杀业务分析
  • MySQL——创建与管理视图
  • 基于 Python 开发分布式任务调度系统案例剖析
  • 《深度学习实战》第2集-补充:卷积神经网络(CNN)与图像分类 实战代码解析和改进
  • 基于CNN的FashionMNIST数据集识别2——模型训练