Apache Zeppelin:一个基于Web的大数据可视化分析平台
今天给大家推荐一下 Apache Zeppelin,它是一个基于 Web 的交互式数据接入、数据分析、数据可视化以及协作文档 Notebook,类似于 Jupyter Notebook。
Apache Zeppelin 支持使用 SQL、Java、Scala、Python、R 等编程语言进行数据处理和分析,同时集成了 Apache Spark(内置)、Apache Flink、Apache Kylin、BigQuery、Cassandra、Elasticsearch、HBase、Apache Hive、MongoDB、Neo4j、Groovy、Markdown 以及 Shell 等平台和语言的数据处理功能。
Apache Zeppelin 支持各种数据图表和动态表单。
多个用户可以协作并分享 Notebook:
安装
Apache Zeppelin 基于 Java 开发,支持跨平台。官方支持和测试的平台环境如下:
- OpenJDK 1.8 (151+) 或者 Oracle JDK 1.8 (151+)
- Ubuntu 18.04、Ubuntu 20.04、Mac OSX
首先,点击官方下载页面:
安装包分为两种:包含所有语言解释器的安装包和默认只包含 Spark、Python、Markdown 以及 Shell 解释器的安装包。
选择其中一个 zip 文件下载之后解压就完成了安装,然后输入以下命令启动 Apache Zeppelin:
-- Unix/Linux
bin/zeppelin-daemon.sh start
-- Windows
bin/zeppelin.cmd
然后在浏览器中输入 http://localhost:8080 打开首页:
Apache Zeppelin 安装目录下的 notebook 子目录中提供了几个学习的示例,可以作为入门参考。
另外,Apache Zeppelin 还支持源码安装和 docker 镜像。