当前位置: 首页 > article >正文

【Spark基础】-- RDD 转 Dataframe 的三种方式

一、环境说明

Oracle JDK 11

Scala 2.12.17

Apache Spark 3.1.1

Apache Hadoop 3.1.0

二、RDD 转 Dataframe 的方法

1、通过 StructType 创建 Dataframe(强烈推荐使用这种方法

  /**
   * 方法一:通过 StructType 创建 Dataframe
   * @param spark SparkSession
   * @param rdd 输入
   * @return 输出
   */
  private def func1(spark:SparkSession, rdd:RDD[(Int, String, Int, String, String)]):DataFrame ={
    LOG.warn("------> (1) 构建 structSchema")
    val structSchema: StructType = StructType(
      List(
        StructField("id", IntegerType, true),
        StructField("name", StringType, true),
        StructField("age", IntegerType, true),
        StructField("address", StringType, true),
        StructField("phoneNumber", StringType, false)
      )
    )
    LOG.warn("------>  (2)创建 DF&

http://www.kler.cn/a/149048.html

相关文章:

  • ubuntu-desktop-24.04上手指南(更新阿里源、安装ssh、安装chrome、设置固定IP、安装搜狗输入法)
  • 新版 idea 编写 idea 插件时,启动出现 ClassNotFound
  • qt QKeySequence详解
  • Linux 系统管理和监控命令---- auditctl命令
  • 【云计算解决方案面试整理】1-2云计算基础概念及云计算技术原理
  • -1大于4?负数与无符号整数类型:size_t的比较问题(strlen)
  • 231128 刷题日报
  • 【精选】Spring整合MyBatis,Junit 及Spring 事务Spring AOP面向切面详解
  • Qt问题 QString 和 void* 相互转化
  • Kafka 保证消息消费全局顺序性
  • Flask教程入门
  • Android 13.0 修改系统默认设备类型的平板电脑类型为设备类型
  • MySQL索引优化实战一
  • 万户协同办公平台ezoffice SendFileCheckTemplateEdit.jsp接口存在SQL注入漏洞 附POC
  • SpringBoot项目整合Redis,Rabbitmq发送、消费、存储邮件
  • 代码随想录算法训练营 ---第四十九天
  • 在Visual Studio Code中安装加速TypeScript程序开发的插件
  • Git工作流和Commit规范
  • 12:kotlin类和对象 -- 继承
  • C语言第三十六弹--实现转移表的多种方法
  • redis基本数据结构
  • FFA 2023|字节跳动 7 项议题入选
  • 计算机基础知识57
  • Ubuntu 上使能 SELinux
  • 王者小游戏
  • 【好用的个人工具】在Docker环境下部署Simple mind map思维导图工具