当前位置: 首页 > article >正文

Hive 安装

目录

Hive 安装

 Hive 安装地址

 Hive 安装部署

安装 Hive

 启动并使用 Hive


Hive 安装

 Hive 安装地址

1)Hive 官网地址

Apache Hiveicon-default.png?t=N7T8http://hive.apache.org/

2)文档查看地址

GettingStarted - Apache Hive - Apache Software Foundationicon-default.png?t=N7T8https://cwiki.apache.org/confluence/display/Hive/GettingStarted

3)下载地址

Index of /dist/hiveicon-default.png?t=N7T8http://archive.apache.org/dist/hive/

4)GitHub 地址

https://github.com/apache/hiveicon-default.png?t=N7T8https://github.com/apache/hive

 Hive 安装部署

安装 Hive

  1. apache-hive-3.1.3-bin.tar.gz 上传到 Linux 的 /opt/software 目录下

  2. 解压 apache-hive-3.1.3-bin.tar.gz/opt/module/ 目录下面

    [lzl@hadoop12 software]$ tar -zxvf /opt/software/apache-hive-3.1.3-bin.tar.gz -C /opt/module/
  3. 修改 apache-hive-3.1.3-bin.tar.gz 的名称为 hive

    [lzl@hadoop12 software]$ mv /opt/module/apache-hive-3.1.3-bin/ /opt/module/hive
  4. 修改 /etc/profile.d/my_env.sh,添加环境变量

    [lzl@hadoop12 software]$ sudo vim /etc/profile.d/my_env.sh

    (1)添加内容

    # HIVE_HOME
    export HIVE_HOME=/opt/module/hive
    export PATH=$PATH:$HIVE_HOME/bin

    (2)source 一下

    [lzl@hadoop12 hive]$ source /etc/profile.d/my_env.sh
  5. 初始化元数据库(默认是 Derby 数据库)

    [lzl@hadoop12 hive]$ bin/schematool -dbType derby -initSchema

 启动并使用 Hive

  1. 启动 Hive

    [lzl@hadoop12 hive]$ bin/hive
  2. 使用 Hive

    hive> show databases;
    hive> show tables;
    hive> create table stu(id int, name string);
    hive> insert into stu values(1,"ss");
    hive> select * from stu;

    观察 HDFS 的路径 /user/hive/warehouse/stu,体会 Hive 与 Hadoop 之间的关系。

    • Hive 中的表在 Hadoop 中是目录;
    • Hive 中的数据在 Hadoop 中是文件。
  3. 在 XShell 窗口中开启另一个窗口开启 Hive,在 /tmp/lzl 目录下监控 hive.log 文件

    [lzl@hadoop12 lzl]$ tail -f hive.log
    Caused by: ERROR XSDB6: Another instance of Derby may have already booted the database /opt/module/hive/metastore_db.
    
    at org.apache.derby.iapi.error.StandardException.newException(Unknown Source)
    at org.apache.derby.iapi.error.StandardException.newException(Unknown Source)
    at org.apache.derby.impl.store.raw.data.BaseDataFileFactory.privGetJBMSLockOnDB(Unknown Source)
    at org.apache.derby.impl.store.raw.data.BaseDataFileFactory.run(Unknown Source)
    ...

    原因在于 Hive 默认使用的元数据库为 Derby。Derby 数据库的特点是同一时间只允许一个客户端访问。如果多个 Hive 客户端同时访问,就会报错。由于在企业开发中,都是多人协作开发,需要多客户端同时访问 Hive,怎么解决呢?我们可以将 Hive 的元数据改为用 MySQL 存储,MySQL 支持多客户端同时访问。

  4. 首先退出 Hive 客户端。然后在 Hive 的安装目录下将 derby.logmetastore_db 删除,顺便将 HDFS 上目录删除

    hive> quit;
    [lzl@hadoop12 hive]$ rm -rf derby.log metastore_db
    [lzl@hadoop12 hive]$ hadoop fs -rm -r /user
  5. 删除 HDFS 中 /user/hive/warehouse/stu 中的数据

 


http://www.kler.cn/a/292062.html

相关文章:

  • 【动手学电机驱动】 STM32-FOC(7)MCSDK Pilot 上位机控制与调试
  • 2024140读书笔记|《作家榜名著:生如夏花·泰戈尔经典诗选》——你从世界的生命的溪流浮泛而下,终于停泊在我的心头
  • git本地分支推送到远程和远程pull到本地
  • 【0x001C】HCI_Write_Page_Scan_Activity详解
  • 【第三课】Rust变量与数据类型(二)
  • CSS Modules中的 :global
  • 如何选到好的宠物空气净化器,用哪款宠物空气净化器比较好?
  • 【C++】list底层的模拟实现
  • 10 先序遍历创建二叉树
  • PHP一站式解决方案高级房产系统小程序源码
  • WebSocket的详细介绍(打开你对WebSocket的认识)
  • 【openwrt-21.02】T750 openwrt MT7916 WPS PBC功能实现
  • 关于cookie和session的直观讲解(二)
  • 基于 Konva 实现Web PPT 编辑器(二)
  • 二维高斯函数的两种形式
  • iOS——weak修饰符的学习补充
  • flutter和android原生 界面显示的原理是什么,有什么异同。
  • 利用Python脚本批量管理Linux服务器部署服务
  • html+css网页设计 合十文化2个页面
  • c++ 定义函数
  • 为什么要有mybatis?——mybatis
  • Gitlab删除本地标签和分支
  • 使用 RabbitMQ 和 Go 构建异步订单处理系统
  • Apple “Glowtime”活动:iPhone 16、Apple Intelligence亮相
  • SQL进阶技巧:给定数字的频率查询中位数 | 中位值计算问题
  • vscode 20 个实用插件