开启智能 BI 新纪元:生成式 AI 工具的探索与实践
目录
前言
智能 BI 的演变以及生成式 AI 的作用
环境准备
1、进入环境
2、制作分析视图
3、初始化配置
进行QuickSight Q 操作
1、初始化配置-设置 QuickSight 账户
2、启用 Amazon Q in QuickSight
3、创建 Topic
(一)创建数据集
(二)创建主题(Topic)
4、生成式 BI
(一)创建数据集
(二)发现构建的可视化的入口点
(三)使用 Q 构建视图
(四)添加更多视图效果
(五)使用 Q 构建计算并在可视化中使用它
(六)使用 Q 修改视图效果
(七)链接 Topic
(八)发布仪表盘
(九)问答和执行摘要
(十)创建 Data Story
(十一)编辑数据故事
(十二)发布数据故事 (可选)
资源清理操作
结束语
前言
在数据驱动的商业决策时代,商业智能(BI)工具已成为企业获取洞察力、优化运营和制定战略的关键。随着人工智能技术的不断进步,生成式 AI 正在革新 BI 领域的传统做法。本文将探讨如何使用生成式 AI 工具来探索智能 BI 的新境界,帮助企业从数据中获得更深入的洞察力。随着生成式人工智能的兴起,传统的 BI 报表功能已经无法满足用户对于自动化和智能化的需求,Amazon Q in QuickSight 使用生成式商业智能功能来加速决策,从而提高业务生产力。借助 Amazon Q 中全新的控制面板创作功能,业务分析师可以使用自然语言提示在几秒钟内构建、发现和分享有意义的见解。Amazon Q 通过执行摘要、全新的情境感知数据问答体验和可自定义的交互式数据故事,让企业用户更容易理解数据,从而帮助企业用户根据洞察做出决策。那么本文就来详细分享一下关于生成式 AI 正在革新 BI 领域的传统做法。
智能 BI 的演变以及生成式 AI 的作用
先来了解一下智能BI的演变,具体如下所示:
- 传统 BI 工具的局限:众所周知,传统 BI 工具依赖于数据仓库、报表和静态仪表板来提供业务洞察,虽然这些工具在数据展示方面发挥了作用,但它们通常需要手动设置查询和仪表板,且难以处理非结构化数据和实时分析需求。
- 智能 BI 的兴起:人工智能的高速发展,智能 BI 工具通过集成机器学习和人工智能技术,提供了更高级的数据分析、预测建模和自然语言查询等功能,这些工具能够自动化数据探索过程,提供更快速、更深入的业务洞察。
再来聊聊生成式 AI 在智能 BI 中的作用,具体如下所示:
- 数据探索自动化:生成式 AI 工具能够自动探索大量数据,识别模式和趋势,并生成可操作的洞察,用户无需深入了解复杂的数据模型或编写复杂的查询即可获得有价值的信息。
- 自然语言查询:利用生成式 AI,用户可以通过自然语言与 BI 工具交互,就像与人类对话一样提问并获取答案,这大大降低了使用 BI 工具的技术门槛,使非技术用户也能轻松进行数据分析。
- 预测分析和推荐:生成式 AI 工具可以预测市场趋势、消费者行为等,并提供基于数据的推荐,这对于制定战略决策、优化营销活动和改善客户体验等方面具有重要价值。
环境准备
1、进入环境
点击 “开始实验” 按钮,即可扫码进入实验环境,需要注意的是:测试账号有效期仅为一天,过期后系统将自动回收清理,请不要上传重要数据。
同时,点击 “立即注册” AWS Console - Signup按钮即可免费注册属于你的亚马逊云科技海外区账号,开启个性化的系统构建之旅,进一步探索更广泛、更深入的云服务领域并保留实验中构建的系统应用,尽情享受云上构建的无限可能!
如果我们在自己的亚马逊云科技账户上进行实验,请务必在实验完成后根据清理资源板块部分的说明删除和关闭所有实验资源,以避免产生不必要的费用。
注册成功之后,可以扫码登陆,具体如下图所示:
然后需要填写邮箱,如果你之前没有填写过邮箱,则需要填写一下邮箱,并勾选隐私协议,点击前往实验,及可进入实验室,具体如下图所示:
2、制作分析视图
由于QuickSight 分析 UI 经过重新设计,更易于学习和使用,所以本文示例需要使用最新版本的 QuickSight UI,这里将使用此处提供的数据集 SaaS-Sales.csv 文件:
Download SaaS-Sales.csv https://ws-assets-prod-iad-r-iad-ed304a55c2ca1aee.s3.us-east-1.amazonaws.com/cd8ebba2-2ef8-431a-8f72-ca7f6761713d/datasets/SaaS-Sales.csv
Alternate download links
Download SaaS-Sales.csv (EU) https://ws-assets-prod-iad-r-fra-b129423e91500967.s3.eu-central-1.amazonaws.com/cd8ebba2-2ef8-431a-8f72-ca7f6761713d/datasets/SaaS-Sales.csv
Download SaaS-Sales.csv (AP) https://ws-assets-prod-iad-r-bom-431207042d319a2d.s3.ap-south-1.amazonaws.com/cd8ebba2-2ef8-431a-8f72-ca7f6761713d/datasets/SaaS-Sales.csv
下面的数据集代表一家虚构 SaaS(软件即服务)公司的销售数据,该公司向其他企业(B2B)销售销售和营销软件,其中,每行数据为一笔交易/订单,具体如下表格所示:
Modules | ~预计完成时间 (分钟) |
初始化配置 | |
制作第一个仪表盘 | 20 |
增强仪表盘功能 | 20 |
添加交互性 | 20 |
数据集 | 15 |
计算字段 | 15 |
数据安全 | 15 |
机器学习 | 20 |
3、初始化配置
需要先设置 QuickSight,具体操作步骤如下:
(1)在新的浏览器标签页中启动 [亚马逊云控制台] https://console.aws.amazon.com/,搜索 QuickSight 并启动它。
(2)在 QuickSight 页面,单击 Sign up for QuickSight 按钮,打开 QuickSight 注册页面。
(3)输入 Email for account notifications 请务必选择一个与整个用户库相关且适用的名称,输入电子邮件作为通知电子邮件。
(4)其他均默认,将鼠标滚动到页面的底部,将 Add Pixel-Perfect Reports 前的复选框去掉,如有需要,可稍后从 QuickSight 管理控制台打开此功能。
(5)单击 Finish 按钮。(注意:设置账户可能需要 15-30 秒)
(6)点击 Go to Amazon QuickSight 按钮,直接进入 QuickSight 控制台,具体如下所示:
在 Sign up for QuickSight 页面,可能看到会有如下图的提示,我们可以忽略即可:
接下来就是制作仪表盘,通过创建数据集、重命名 Analysis、按月显示销售额、为折线图添加预测、直观了解每季度的销售情况、添加建议洞察、按行业查看销售情况、添加从行业到客户的下钻功能、创建透视表(Pivot Table)、格式化透视表(Pivot Table)、添加过滤条件、添加过滤器操作、添加仪表盘标题、重命名标题、发布仪表盘、发送电子邮件报告、Open the Email Report等步骤来完成整个流程,由于篇幅原因这里不在逐一赘述,如有不懂的地方可以参看亚马逊云科技的官方文档:亚马逊云科技开发者社区
进行QuickSight Q 操作
1、初始化配置-设置 QuickSight 账户
(1)启动亚马逊云科技控制台 https://console.aws.amazon.com/,搜索 QuickSight 并打开。
(2)在 Let's get started(让我们开始)页面上,单击 注册 QUICKSIGHT 按钮。
(3)在 Contact information(联系信息)部分中,输入邮件即可。
(4)选择所需的身份验证方法和 QuickSight 区域。QuickSight 区域选择决定了你所有免费 SPICE 容量的分配位置。此选择还决定了你的 QuickSight 用户和组将在哪里进行管理(最接近所选区域的配备管理身份的区域将用作身份区域)。
(5)输入 QuickSight 帐户名称。 请确保选择一个与你整个用户池相关且适用的名称。
(6)向下滚动,取消选中分页报告 可选附加组件,然后单击 完成 按钮。(设置帐户可能需要 15-30 秒)
(7)帐户创建完成后,单击 进入 QUICKSIGHT 按钮。你现在将被带到 QuickSight 控制台。
2、启用 Amazon Q in QuickSight
(1)启动 QuickSight。
(2)从用户菜单中单击 管理 QuickSight,需要注意的是,只有管理员用户才能看到此选项。
(3)在管理控制台中,从左侧面板单击 管理定价 以查看 Q 订阅的当前状态,如果订阅处于活动状态,请跳过下一步。
(4)Q 订阅由 Pro 用户和 Q 主题的创建驱动,可以通过将你当前的用户升级到 ADMIN_PRO 角色来触发此操作,这需要通过更新用户 API 调用来完成。从 CloudShell 运行以下命令,替换占位符,具体如下所示:
aws quicksight update-user --aws-account-id <AwsAccountId> --namespace default --role ADMIN_PRO --user-name <UserName> --email <Email> --region us-east-1
注意Manage pricing(管理定价)页面可能需要长达一小时的时间才能反映此变更,所以我们不用等待这一变更完成。
(5)从 顶部栏 单击 QuickSight 图标 退出管理控制台,我们能够在几分钟内看到 NEW TOPIC(新主题)和 NEW DATA STORY(新数据故事)按钮出现在 主题 和 数据故事 中。
3、创建 Topic
通过 Q,引入了一种新的资产类型--主题(Topic), 通过 Topic可以调入数据集,使用用户友好的字段名称、更多同义词、过滤器、命名实体和语义信息进一步丰富数据集,并让 Q 可以回答问题,这里使用一些示例数据创建一个主题。
(一)创建数据集
(1) Download SaaS-Sales.csv https://ws-assets-prod-iad-r-iad-ed304a55c2ca1aee.s3.us-east-1.amazonaws.com/cd8ebba2-2ef8-431a-8f72-ca7f6761713d/datasets/SaaS-Sales.csv
Alternate download links
Download SaaS-Sales.csv (EU) https://ws-assets-prod-iad-r-fra-b129423e91500967.s3.eu-central-1.amazonaws.com/cd8ebba2-2ef8-431a-8f72-ca7f6761713d/datasets/SaaS-Sales.csv
Download SaaS-Sales.csv (AP) https://ws-assets-prod-iad-r-bom-431207042d319a2d.s3.ap-south-1.amazonaws.com/cd8ebba2-2ef8-431a-8f72-ca7f6761713d/datasets/SaaS-Sales.csv
(2)在 QuickSight 中,从数据集 视图,单击 新建数据集 按钮。
(3)选择 上传文件 选项,并从本地选择 SaaS-Sales.csv 文件。
(4)单击 编辑设置和准备数据 按钮。
(5)单击保存并发布(SAVE & PUBLISH) 按钮。
(6)单击 QuickSight 图标退出数据集编辑界面。
(二)创建主题(Topic)
(1)从 Topic(主题)视图中,单击 NEW TOPIC(新建主题) 按钮。
(2)输入名称为
SaaS-Sales
将描述粘贴为
使用此主题提出有关软件销售的问题
然后单击 继续 按钮。需要注意的是,主题用户将会看到此描述。
(3)在 选择数据集 弹出窗口中,从数据集列表中选择 SaaS-Sales,然后单击 继续 按钮。
(4)Q 需要对数据进行索引并设置字段配置,作为主题创建的一部分。这可能需要几分钟时间。状态列显示了此任务的进度。
4、生成式 BI
Q 现在可让我们从仪表盘生成执行摘要,并使用自然语言构建和编辑视图效果、创建计算和创建故事。 具有 Author Pro 和 Admin Pro角色用户可获得所有这些功能。Reader Pro 用户可以生成执行摘要和创建故事。 让我们探索这些 GenBI 功能。
(一)创建数据集
(1)[Download SaaS-Sales.csv] https://ws-assets-prod-iad-r-iad-ed304a55c2ca1aee.s3.us-east-1.amazonaws.com/cd8ebba2-2ef8-431a-8f72-ca7f6761713d/datasets/SaaS-Sales.csv
Alternate download links
[Download SaaS-Sales.csv (EU)] https://ws-assets-prod-iad-r-fra-b129423e91500967.s3.eu-central-1.amazonaws.com/cd8ebba2-2ef8-431a-8f72-ca7f6761713d/datasets/SaaS-Sales.csv
[Download SaaS-Sales.csv (AP)] https://ws-assets-prod-iad-r-bom-431207042d319a2d.s3.ap-south-1.amazonaws.com/cd8ebba2-2ef8-431a-8f72-ca7f6761713d/datasets/SaaS-Sales.csv
(2)在 QuickSight 中,从 Datasets(数据集)视图,点击 New dataset(新建数据集)按钮。
(3)选择 Upload a file(上传文件)选项,并从本地选择SaaS-Sales.csv文件。
(4)点击Edit settings and prepare data(编辑设置并准备数据)按钮。
(5)点击 SAVE & PUBLISH(保存并发布)按钮。
(6)点击 QuickSight 图标退出数据集编辑界面。
(二)发现构建的可视化的入口点
然后从 SaaS-Sales 数据集创建一个新的分析,看看是否能发现所有三个 构建可视化 入口点。如果之前没有创建过分析,请查看以下步骤:
(1)从 Datasets(数据集)视图中,点击 SaaS-Sales 以打开其详情页面。
(2)点击 USE IN ANALYSIS(在分析中使用)按钮。
(3)创建一个交互式表单。
(4)将分析重命名为
GenBI analysis
(5)看看你是否能发现三个构建可视化的入口点。
(三)使用 Q 构建视图
Q 可让我们在创建分析后立即使用自然语言提示创建视图效果,即 - 无需创建主题并将其链接到分析。链接新/现有主题将使 Q 为你提供更精确的结果。具体步骤如下所示:
(1)可选 - 删除自动生成的签名可视化。
(2)可选 - 将显示模式从ACTUAL SIZE(实际大小)改为FIT TO WIDTH(适合宽度)。
(3)构建可视化:
Plot sales over time at month grain. Color by segment. Plot this as a line chart.
(4)验证生成的可视化效果是否满意,然后点击 ADD TO ANALYSIS(添加到分析)按钮。
(四)添加更多视图效果
接下来使用以下提示来创建并添加更多视图效果以供分析,具体如下所示:
(1)创建视图 :
Plot sales by product and segment. Plot this as a vertical stacked bar colored by segment.
(2)创建视图 :
Show total Sales and total Quantity by year, Region, Segment, Product and Customer as a table.
(五)使用 Q 构建计算并在可视化中使用它
(1)从主左侧面板中点击 + CALCULATED FIELD。
(2)将名称和描述输入为
Average unit sale price
(3)构建该计算,插入并保存。数据集中有销售额和数量字段,应该能够构建计算公式为平均值({销售额}/{数量})。如果无法得到此结果,可以尝试以下替代提示:
Average per unit sales price Average sales price per quantity
(4)构建可视化:
Plot average unit sale price by year as a vertical bar chart. Color by product.
(5)验证生成的可视化,然后点击 ADD TO ANALYSIS(添加到分析)按钮。
(六)使用 Q 修改视图效果
尝试以下编辑,看看 Q 如何帮助快速更改视图效果,具体如下所示:
(1)点击第一个折线图的可视化菜单中的 Q 图标,启动编辑可视化面板。
(2)编辑可视化:
Turn off title and grid lines.
注意,标题和网格线已从可视化中删除。
(3)复制折线图。
(4)编辑可视化(新复制的折线图):
Color by product.
(5)编辑可视化(Table):
Mark rows with quantity greater than 10 in orange and quantity greater than 20 in dark green.
(七)链接 Topic
Q 只需查看数据集的元数据(如字段名称和类型)即可帮助我们完成上述所有任务。但是在此入门模式下,Q 没有关于实际数据元素的信息可供快速参考,因此会告诉我们,它无法回答有关特定类别名称等的问题,可以通过将主题链接到分析来启用 Q 来处理此类问题,具体如下所示:
(1)创建一个新工作表并删除其中的 Autograph 可视化。
(2)点击 Build Visual(构建可视化),然后输入:
Sales for Contact
在这里暂停一下,然后可以看到 Q 给出联系人名称(contact name)作为自动完成建议。输入 matcher 并 构建。我们在 Contact 后继续输入 matcher 并点击构建。Q 响应说无法回答这个确切的问题,因为它找不到 Contactmatcher 的数据。
(3)从顶部菜单栏,单击 Build visual(构建可视化)旁边的省略号。
(4)启用 Link topic for Build Visual and Q&A(链接构建可视化和 Q&A 主题)切换。
(5)选择之前创建的 SaaS-Sales 主题。如果直接尝试这个模块而尚未创建主题,可以从下拉列表中单击 创建主题 选项,在下一个界面中输入主题名称,Q 将在后台启动主题创建。
(6)单击 APPLY CHANGES(应用更改)并关闭 Topic linking(主题链接)页面。
(7)再次点击 Build Visual(构建可视化)::
Sales for Contact
在这里暂停,这时可以观察到 Q 提供 ContactMatcher 作为选项。输入 matcher 并点击 Build(构建) / 从建议列表中选择。
(8)ADD TO ANALYSIS(添加到分析)并 检查过滤器面板 以验证 Q 确实为 ContactMatcher 产品过滤了数据。
(9)删除 该 工作表。
(八)发布仪表盘
让我们看看仪表盘发布流程中可用的新选项,以便仪表盘消费者可以使用 GenBI 功能。
(1)从顶部菜单栏单击 PUBLISH(发布)按钮。
(2)输入名称为
GenBI dashboard
(3)注意新的发布选项,可用于允许在仪表盘上共享数据故事、执行摘要和 Q&A。
(4)发布仪表盘。
(九)问答和执行摘要
通过将主题与分析链接起来并在发布仪表盘时允许问答,我们能够让用户在 QuickSight 控制台中查看仪表盘时直接从顶部菜单栏访问问答(而不是必须从其主题视图中找到相关主题)。主题也需要与用户共享,以便他们能够看到入口点并使用它。执行摘要功能可生成仪表盘的高级摘要。当我们想将关键要点包含在其他文档或电子邮件中时,这很有用,具体如下所示:
(1)单击顶部菜单栏中的询问有关 SaaS-Sales 的问题按钮。注意它如何将你带到 Q 面板,并选择了相关的主题,然后关闭 Q 面板。
(2)从顶部菜单栏单击 Build(构建)按钮,然后选择 Executive summary(执行摘要)。查看 Q 生成的摘要,并注意有一个选项可以复制完整的摘要。
(十)创建 Data Story
假设要创建一个演示文稿,介绍如何提高来年的销售额,我们可以让 QuickSight 根据你对故事内容的高级描述和我们添加的视图效果为我们生成数据故事,而不必从头开始,可以根据需要验证、调整/添加其他信息,并发布给其他用户。
(1)单击 Build(构建)按钮,然后选择 Data story(数据故事)。
(2)将此提示复制到:
Generate a short presentation on how we can improve our sales in the coming year. Provide info on the products and industries to focus on for same.
(3)单击 添加可视化效果 按钮,并从我们的仪表盘中选择所有 5 个可视化效果。
(4)构建Q 每次生成的故事都会有所不同。
(十一)编辑数据故事
数据故事界面非常直观且易于使用,我们可以像在本地文档编辑器中一样进行现场编辑,还可以选择让 Q 缩短、延长某个部分或将其更改为项目符号。具体可以尝试以下操作:
(1)更改 [名称(name)] 占位符。
(2)选择一个文本部分,并单击浮动菜单上的 Q 图标来访问更改选项。尝试一下。
(3)尝试从浮动菜单中加粗一个部分,并应用高亮颜色。
(4)添加一个块,尝试添加图像、文本、列等。
(5)尝试移动块并删除它。
(6)尝试更改主题。
(7)继续探索以熟悉界面。
(十二)发布数据故事 (可选)
在完成对数据故事的编辑之后,我们可以发布数据故事并与他人分享。已发布的版本将显示所包含视图效果的快照,当我们稍后返回数据故事时,如果基础数据已更改,视图效果将自动更改,并且系统将提示发布更改,我们之前与之分享故事的其他人仍将看到旧的视图效果快照,直到发布更改(如果需要),具体如下所示:
(1)将数据故事的名称更改为
GenBI Sample Data Story
(2)从顶部菜单栏单击共享按钮。
(3)可选 - 搜索并选择一个专业用户。
(4)单击发布和共享按钮。
(5)查看已发布的故事 - 文件 > 查看已发布的故事
资源清理操作
在操作本文的示例实验完成之后,请及时清理实验资源,避免产生额外的费用,需要清理 QuickSight,具体的资源清理方法如下所示:
(1)点击打开帐号销毁 https://us-east-1.quicksight.aws.amazon.com/sn/console/unsubscribe
(2)关闭“帐户终止保护(Account termination protection)”。
(3)请输入屏幕上显示的确认的文字 “确认(Confirm)” 。
(4)点击 Delete account,这样就删除了 QuickSight 的订阅。
结束语
通过上文的介绍,不难看出生成式 AI 工具正在为智能 BI 领域带来革命性的变化,尤其是通过自动化数据探索、提供自然语言查询和增强预测分析能力,这些工具使企业能够从数据中获得更深入、更快速的洞察力。本文示例也给大家展示了如何使用 QuickSight 来构建 BI 报表,如何使用自然语言的方式提出问题并快速生成数据洞察,借助GEN BI的能力,快速生成其数据故事的初稿。随着生成式 AI 技术的不断进步,会看到更多创新的智能 BI 应用,这些应用将进一步简化数据分析流程,提供更直观的洞察,并帮助企业在竞争激烈的市场中保持领先。最后,让我们共同体验这场技术的盛宴,一起成长,一起探索更广阔的科技天地。不再等待,立即开启你的云上探索之旅吧!