当前位置: 首页 > article >正文

spark读取csv文件

测试spark读取本地和hdfs文件

from pyspark.sql import SparkSession

spark = SparkSession.builder \
    .appName("Example PySpark Script") \
    .getOrCreate()

# 读取本地csv文件
df = spark.read.csv("/Users/xiaokkk/Desktop/local_projects/spark/intents.csv", header=True, inferSchema=True)
# 显示前几行数据
df.show(5)
# 读取HDFS的csv文件
df = spark.read.csv("hdfs://127.0.0.1:9001/data/intents.csv", header=True, inferSchema=True)
df.show(5)


http://www.kler.cn/a/301163.html

相关文章:

  • Windows docker下载minio出现“Using default tag: latestError response from daemon”
  • html 图片转svg 并使用svg路径来裁剪html元素
  • vue实现展示并下载后端返回的图片流
  • RDIFramework.NET CS敏捷开发框架 V6.1发布(.NET6+、Framework双引擎、全网唯一)
  • 第 17 章 - Go语言 上下文( Context )
  • 蓝桥杯介绍
  • 云计算第四阶段----CLOUD 01-03
  • MySQL:视图【详解】
  • socket通讯原理及例程(详解)
  • Spring Framework系统框架
  • 函数栈帧的小知识理解
  • GEE :利用MODIS土地分类数据监测指定区域2001-2024年农作物的时序面积
  • 用HTML写一个动态的的电子相册实战详细案例
  • 论文阅读翻译之Deep reinforcement learning from human preferences
  • 分布式风电电池储能系统
  • ucx 编译安装检验方式备忘
  • 大模型笔记02--基于fastgpt和oneapi构建大模型应用平台
  • Axure高效打造大屏可视化BI数据展示
  • 主成分分析(Principal Component Analysis,PCA)—无监督学习方法
  • 深度神经网络DNN、RNN、RCNN及多种机器学习金融交易策略研究|附数据代码
  • 模拟k的次方和从0-n次方
  • 最好磁吸充电宝是哪个牌子?目前公认好用磁吸充电宝排行榜!
  • 1658.将x减到0的最小操作数
  • 宠物空气净化器哪个好?希喂、352、有哈宠物空气净化器测评分享
  • 什么是死锁?怎么预防?如何解决?
  • 如何在群晖NAS中安装HA平台并实现异地控制智能家居设备实战教程