当前位置：首页 > article >正文

Iceberg与SparkSQL查询操作整合

article 2025/1/10 11:30:04

spark操作iceberg之前先要配置spark catalogs，详情参考Iceberg与Spark整合环境配置。

Iceberg使用Apache Spark的DataSourceV2 API来实现数据源和catalog。

查询的时候表要按照：catalog.数据库.表名的格式

SELECT * FROM prod.db.table; -- catalog: prod, namespace: db, table: table

元数据表(如历史和快照)可以使用Iceberg表名作为命名空间。
例如，要从文件的元数据表中读取prod.db.table:

SELECT * FROM prod.db.table.files;

SQL查询的方式就和普通数据库没什么区别，只要把数据库.表名，前面加上一个catalog即可。

val df = spark.table("prod.db.table")

也可以通过DataFrameReader接口查询&#

【HTTP】URL的基本概念和构成

Unity Lua方向的面试真题详解

Go语言概述

HOT 100（七）栈、堆、贪心算法

游戏工作室搬砖多开怎么做

一篇文章了解Pytest单元测试框架

openai最新模型o1全面解读

HarmonyOS Next鸿蒙NDK使用示例

Rust 数据类型

使用HTML

1.1 计算机网络基本概述