当前位置: 首页 > article >正文

【大数据学习 | Spark-SQL】SparkSession对象

之前使用的操作对象有三个

  • sparkContext主要是为了rdd编程而产生的一个操作对象。
  • sqlContext主要是为了sparksql的编程而产生的。
  • hiveContext主要是操作hive的对象。

归一化的对象

sparkSession对象融合了sc,sqlSc,hsc三种为一个整体。

package com.hainiu.spark

import org.apache.spark.sql.SparkSession

object TestSession {
  def main(args: Array[String]): Unit = {
    val session = SparkSession.builder()
      .enableHiveSupport() //hive
      .master("local[*]").appName("test").getOrCreate()
    //session --> sc.sqlsc.hivesc
    //sparkContext
    val sc = session.sparkContext
    session //sqlSc
    import session.implicits._
    val df = sc.textFile("file:///headless/workspace/spark/data/a.txt")
      .map(t => {
        val strs = t.split(" ")
        (strs(0), strs(1), strs(2), strs(3))
      }).toDF("id", "name", "age", "gender")
    df.show()
    df.createTempView("student")
    session.sql("select * from student").show()

    session.sql(
      """
        |select count(1) from stu
        |""".stripMargin)
      .show()
  }
}

SparkSession转化为sparkContext:

SparkContext     <-----     SparkSession.sparkContext

SparkSession就是sqlContext,不需要转化。


http://www.kler.cn/a/412336.html

相关文章:

  • Java 中的 Lambda 表达式和 JDK 21 新特性详解
  • Spring框架使用xml方式配置ThreadPoolTaskExecutor线程池,并且自定义线程工厂
  • K8s的水平自动扩容和缩容HPA
  • Pytorch微调深度学习模型
  • 数据结构(Java版)第二期:包装类和泛型
  • [模版总结] - 树的基本算法4 -最近公共祖先 LCA
  • 从ETL到DataOps:WhaleStudio替代Informatica,实现信创化升级
  • 计算机网络 实验八 应用层相关协议分析
  • 【NOIP普及组】表达式求值
  • 学习threejs,设置envMap环境贴图创建反光效果
  • Qt程序发布及打包成exe安装包
  • 微信小程序首页搜索框的实现教程
  • idea_常用设置
  • RSA算法和AES算法,哪种更安全
  • 电脑自动关机时间如何定?Wise Auto Shutdown 设置关机教程
  • C++网络编程:select IO多路复用及TCP服务器开发
  • 三格电子—EtherNet IP转Modbus RTU网关
  • Docker安装及常用命令
  • 信息安全实验--密码学实验工具:CrypTool
  • Rust学习(九):密码生成器
  • QT:生成二维码 QRCode
  • AIGC学习笔记(7)——AI大模型开发工程师
  • LeetCode题练习与总结:第三大的数--414
  • 【设计模式】【行为型模式(Behavioral Patterns)】之责任链模式(Chain of Responsibility Pattern)
  • 极狐GitLab 17.6 正式发布几十项与 DevSecOps 相关的功能【二】
  • 【力扣】125. 验证回文串