当前位置: 首页 > article >正文

spark读取csv文件

测试spark读取本地和hdfs文件

from pyspark.sql import SparkSession

spark = SparkSession.builder \
    .appName("Example PySpark Script") \
    .getOrCreate()

# 读取本地csv文件
df = spark.read.csv("/Users/xiaokkk/Desktop/local_projects/spark/intents.csv", header=True, inferSchema=True)
# 显示前几行数据
df.show(5)
# 读取HDFS的csv文件
df = spark.read.csv("hdfs://127.0.0.1:9001/data/intents.csv", header=True, inferSchema=True)
df.show(5)


http://www.kler.cn/a/301163.html

相关文章:

  • Vue2+OpenLayers给标点Feature添加信息窗体(提供Gitee源码)
  • 高级运维:shell练习2
  • 探索学习 Python 的有效方式方法
  • js:根据后端返回数据的最大值进行计算然后设置这个最大值为百分之百,其他的值除这个最大值
  • java人脸识别
  • 【python基础——异常BUG】
  • 云计算第四阶段----CLOUD 01-03
  • MySQL:视图【详解】
  • socket通讯原理及例程(详解)
  • Spring Framework系统框架
  • 函数栈帧的小知识理解
  • GEE :利用MODIS土地分类数据监测指定区域2001-2024年农作物的时序面积
  • 用HTML写一个动态的的电子相册实战详细案例
  • 论文阅读翻译之Deep reinforcement learning from human preferences
  • 分布式风电电池储能系统
  • ucx 编译安装检验方式备忘
  • 大模型笔记02--基于fastgpt和oneapi构建大模型应用平台
  • Axure高效打造大屏可视化BI数据展示
  • 主成分分析(Principal Component Analysis,PCA)—无监督学习方法
  • 深度神经网络DNN、RNN、RCNN及多种机器学习金融交易策略研究|附数据代码
  • 模拟k的次方和从0-n次方
  • 最好磁吸充电宝是哪个牌子?目前公认好用磁吸充电宝排行榜!
  • 1658.将x减到0的最小操作数
  • 宠物空气净化器哪个好?希喂、352、有哈宠物空气净化器测评分享
  • 什么是死锁?怎么预防?如何解决?
  • 如何在群晖NAS中安装HA平台并实现异地控制智能家居设备实战教程