当前位置: 首页 > article >正文

RDD触发算子:一些常用的触发算子(count、foreach、saveAsTextFile、first)

文章目录

    • 1、count算子
      • 功能
      • 语法
    • 2、foreach算子
      • 功能
      • 语法
    • 3、saveAsTextFile算子
      • 功能
      • 语法
    • 4、first算子
      • 功能
      • 语法
      • 举例


1、count算子

功能

统计RDD集合中元素的个数,返回一个int值

语法

def count(self) -> int

2、foreach算子

功能

对RDD中每个元素调用一次参数中的函数,没有返回值【与map场景上的区别】

语法

def map(self , f: T -> U ) -> None

3、saveAsTextFile算子

功能

用于将RDD的数据保存到外部文件系统中

语法

def saveAsTextFile(self , path ) -> None

4、first算子

功能

返回RDD集合中的第一个元素【RDD有多个分区,返回的是第一个分区的第一个元素】

语法

def first(self) -> T

举例

如何构造sc对象并创建RDD 参考文章:
【Spark中创建RDD的两种方式】Spark中如何获取sc对象、以及创建RDD的两种方式

rdd1 = sc.parallelize([1,2,3,4,5,6,7,8,9],numSlices=3)
print(rdd1.first()) # 输出结果为 1

http://www.kler.cn/a/402920.html

相关文章:

  • 使用 Elastic 收集 Windows 遥测数据:ETW Filebeat 输入简介
  • 修改一下达梦disql 提示符
  • 【H2O2|全栈】JS进阶知识(八)ES6(4)
  • UVM 验证方法学之interface学习系列文章(七)高级 《bind 操作》(4)级联
  • Java编程,配置mongoUri连接mongodb时,需对特殊字符进行转义
  • 计算字符串的MD5
  • Linux 常用命令大全
  • 7 设计模式原则之合成复用原则
  • LabVIEW三针自动校准系统
  • java:简单小练习,面积
  • (Linux)搭建静态网站——基于http/https协议的静态网站
  • Redis的特性
  • 《Django 5 By Example》阅读笔记:p679-p765
  • 【TDOA最小二乘解算】两步最小二乘迭代的TDOA解算方法,适用于二维平面、自适应锚点(附MATLAB代码)
  • 【行之有效】实证软件工程研究方法
  • [241119] .NET 9.0.0 正式发布 | D2 Emerge 收购 CodeProject,拓展软件开发社区影响力
  • 基于 MUSA 的大语言模型推理和服务框架vLLM
  • 湘潭大学软件工程算法设计与分析考试复习笔记(四)
  • 【数据结构-表达式解析】力扣227. 基本计算器 II
  • SpringBoot中的restTemplate请求存在乱码问题的解决
  • 从熟练Python到入门学习C++(record 1)
  • 【数据结构OJ】【图论】图综合练习--拓扑排序
  • java八股-SpringCloud微服务-Eureka理论
  • Ubuntu 26.04 LTS 大升级:Qt 6 成为未来新引擎
  • 【Vue】Vue3.0(二十五)Vue3.0中的具名插槽 的概念和使用场景
  • 基于Qt智能物流管理系统的开发与应用