当前位置: 首页 > article >正文

Flink DataStream API 编程指南

(对于Flink的开发,建议使用Java,Scala的支持未来会被移除)

DataStream是什么

DataStream API得名于DataStream这个Java类,可以将它们视为可以包含重复项的不可变数据集合。该数据可以是有限的,也可以是无限的,用于处理它们的API是相同的。

DataStream在用法上和普通的Java集合类似,但在一些关键方面有很大的不同。它们是不可变的,这意味着一旦创建了它们,就不能添加或删除元素。你可以在上面执行各种transformations操作。

通过在Flink程序中添加数据源,可以创建初始的DataStream。然后你可以由此派生出新的流,并使用map、filter等API方法将它们组合起来。

剖析Flink程序整体过程

Flink程序就是对DataStream的各种转换(transformations)的过程,每个程序由相同的基本部分组成:

  1. 获取执行环境
  2. 加载/创建初始数据
  3. 指定此数据的转换
  4. 指定将计算结果的存放位置
  5. 触发程序执行

下面以java api的方式来说明以上过程:

1)获取执行环境

可以通过 StreamExecutionEnvironment 的方法来获得:


http://www.kler.cn/a/445757.html

相关文章:

  • #Java篇:非常火热的Spring Boot典型项目结构
  • OpenCV 学习记录:首篇
  • static_cast与dynamic_cast的区别
  • 基于蓝牙通信的手机遥控智能灯(论文+源码)
  • 透析Svchost.EXE进程清除木马的最大后门
  • 【算法练习】尺取法
  • pinglunhuifu 页面
  • 使用NodeJs 实现图片转PPT
  • 【实用技能】如何在 SQL Server 中处理 Null 或空值?
  • 基于Spring Boot的高校实验室预约系统
  • 【Unity3D】实现可视化链式结构数据(节点数据)
  • R-CNN算法详解及代码复现
  • 【快速上手Docker 简单配置方法】
  • Java项目--仿RabbitMQ的消息队列--统一硬盘操作
  • RabbitMQ实现网络分区
  • 深度学习推理速度优化指南
  • 《C++版本的“前世今生”与独特魅力》
  • 厦门凯酷全科技有限公司短视频带货可靠吗?
  • 手机便签哪个好用?手机桌面便签app下载推荐
  • SYD881X RTC定时器事件在调用timeAppClockSet后会出现比较大的延迟