当前位置: 首页 > article >正文

Microsoft Fabric - 尝试一下Delta Table

1. 简单介绍

Microsoft Fabirc中的Delta table是一种适用于Spark的关系存储层,是一种基于Parquet文件的Table。这边尝试一下在Microsoft Fabric Delta table。

2.具体说明

2.1 创建Lakehouse

1) 点击workspace中的New item

        

2) 点击Lakehouse选项,创建一个Lakehouse

        

         

3) 创建一个subfolder并导入OlympicsMetalsData.csv文件

        

 2.2 创建Notebook

 1) 点击New notebook 菜单项创建一个notebook

        

2) 显示一下OlympicsMetalsData.csv文件的数据

        

df = spark.read.format("csv").option("header","true").load("Files/OlympicsData/OlympcisMetalsData.csv")
display(df)

2.3 创建一个托管的Table

        

df.write.format("delta").saveAsTable("managed_olympicsmetalsdata")

发现Lakehouse确实有一个table managed_olympicsmetalsdata 生成

        

2.4 创建一个External table

点击Files文件夹右边的...,选择Copy ABFS path

        

下面是在Notebook中执行的语句, 其中[your copied ABFS path]是copy出来的ABFS path,

df.write.format("delta").saveAsTable("external_olympicsmetalsdata", path="[your copied ABFS path]/external_olympicsmetalsdata")

执行创建external table的语句,刷新Lakehouse的Tables和Files文件夹,发现Lakehouse的有对应的external table(external_olympicsmetalsdata)产生,同时也产生了一个文件夹external_olympicsmetalsdata,文件夹下面是数据文件

        

        

2.5 Drop Table

执行下面的SQL语句,删除前两步骤中创建的托管和external table

        

2.6 托管和external Table的不同

刷新Lakehouse的Tables文件夹,发现之前创建的两个table已经被drop了

        

但是external table external_olympicsmetalsdata对应的外部数据文件还存在

        

依然可以通过外部的数据文件进行Delta table的创建,如下图

        

刷新Lakehouse,发现delta table有创建好

        

同时执行查询delta table的语句,也可以把奥运会的数据查询出来

        

3.总结

本文简单记录了一下在Microsoft Fabric Spark中使用Delta Table的一些过程,Microsoft Fabric的内容体系非常庞大,同时新的feature更新得也很快,还需继续向Microsoft Fabric专家们学习一下。

本文如果哪里有错误,麻烦告之,谢谢谢谢!


http://www.kler.cn/a/415405.html

相关文章:

  • DM达梦管理工具拖出空白区块,无法关闭
  • MappingJackson2HttpMessageConverter
  • 代码随想录第十一天|栈与队列part02--150.逆波兰表达式求值、239.滑动窗口最大值、347.前k个高频元素、栈与队列总结篇
  • 华为E9000刀箱(HWE9000V2)服务器硬件监控指标解读
  • websocket前后端长连接之java部分
  • 详解登录MySQL时出现SSL connection error: unknown error number错误
  • 【VUE3】npm : 无法加载文件 D:\Program\nodejs\node_global\npm.ps1,因为在此系统上禁止运行脚本。
  • 设计模式之抽象工厂 C# 范例
  • 力扣637. 二叉树的层平均值
  • 公开整理-中国省级人工智能专利统计数据(2010-2022年)
  • Android Studio安装TalkX AI编程助手
  • 单例模式(Singleton Pattern):深入解析与应用场景
  • ASUS/华硕天选5Pro酷睿版 FX607J 原厂Win11 23H2系统 工厂文件 带ASUS Recovery恢复
  • 使用Apache HttpClient发起一个GET HTTP请求
  • C++(模板)
  • 新增工作台模块,任务中心支持一键重跑,MeterSphere开源持续测试工具v3.5版本发布
  • 线段树讲解
  • 宠物领养技术:SpringBoot框架应用
  • 一个简洁的ajax注册登录找回密码切换的前端页面
  • 原生js上传图片
  • Spring 返回JSON
  • Rust个人认为将抢占C和C++市场,逐渐成为主流的开发语言
  • Hackathon靶机系列Hackathon2
  • 求助:selenium.common.exceptions.SessionNotCreatedException: x x x
  • 【小白学机器学习41】如何从正态分布的总体中去抽样? 获得指定正态分布的样本的2种方法
  • 存储结构及关系(一)