创建您的第一个仪表盘
本节重点介绍面向最终用户的文档,这些最终用户将使用 Superset 进行数据分析和探索工作流程(数据分析师、业务分析师、数据科学家等)。除了本网站之外,Preset.io 在 docs.preset.io 上维护着一套更新的最终用户文档。
本教程面向希望在 Superset 中创建图表和仪表盘的用户。我们将向您展示如何将 Superset 连接到新数据库,以及如何配置该数据库中的表以进行分析。您还将探索已公开的数据,并将可视化添加到仪表盘,以便您了解端到端用户体验。
连接到新数据库
Superset 本身没有存储层来存储您的数据,而是与您现有的支持 SQL 的数据库或数据存储配对。
首先,我们需要将连接凭据添加到您的数据库,以便能够查询和可视化来自该数据库的数据。如果您通过 Docker compose 在本地使用 Superset,则可以跳过此步骤,因为 Superset 中包含并预先配置了一个名为 examples 的 Postgres 数据库供您使用。
在右上角的 + 菜单中,选择数据,然后选择连接数据库选项
然后在弹出的模态框中选择您的数据库类型
选择数据库后,您可以在此窗口中配置许多高级选项,或者为了本演练的目的,您可以单击所有这些字段下方的链接
单击该链接后,您只需要指定两件事(数据库名称和 SQLAlchemy URI)
如表单下方文本中所述,您应该参考 SQLAlchemy 文档,了解有关 创建新的连接 URI 的信息,以用于您的目标数据库。
单击 测试连接 按钮以确认端到端工作正常。如果连接看起来不错,请通过单击模态窗口右下角的 连接 按钮保存配置
恭喜,您刚刚在 Superset 中添加了一个新的数据源!
注册新表
配置数据源后,您可以选择要在 Superset 中公开以进行查询的特定表(在 Superset 中称为 数据集)。
导航到 数据 ‣ 数据集,然后选择右上角的 + 数据集 按钮。
您应该会看到一个模态窗口弹出。使用出现的下拉菜单选择您的 数据库、模式和 表。在以下示例中,我们注册了 examples 数据库中的 cleaned_sales_data 表。
最后,单击右下角的 添加 按钮。您现在应该在数据集列表中看到您的数据集。
自定义列属性
注册数据集后,您可以配置列属性,以确定如何在探索工作流程中处理该列
- 该列是时间性的吗?(它应该用于时间序列图表中的切片和切块吗?)
- 该列是否可过滤?
- 该列是维度的吗?
- 如果它是一个日期时间列,Superset 应该如何解析日期时间格式?(使用 ISO-8601 字符串模式)
Superset 语义层
Superset 具有一个薄语义层,它为分析师提供了许多生活质量改进。Superset 语义层可以存储 2 种类型的计算数据
- 虚拟指标:您可以编写 SQL 查询,这些查询将从多个列中聚合值(例如
SUM(recovered) / SUM(confirmed)
),并将它们作为列提供(例如recovery_rate
),以便在探索中进行可视化。聚合函数是允许的,并且鼓励用于指标。
您也可以在该视图中为您的团队认证指标。
- 虚拟计算列:您可以编写 SQL 查询,这些查询将自定义特定列的外观和行为(例如
CAST(recovery_rate) as float
)。聚合函数不允许在计算列中使用。
在探索视图中创建图表
Superset 有 2 个主要接口用于探索数据
- 探索:无代码可视化构建器。选择您的数据集,选择图表,自定义外观,然后发布。
- SQL Lab:用于清理、联接和准备数据以用于探索工作流程的 SQL IDE
我们现在将重点介绍探索视图以创建图表。要从 数据集 选项卡启动探索工作流程,请先单击将为您的图表提供支持的数据集的名称。
您现在将看到一个强大的工作流程,用于探索数据并迭代图表。
- 左侧的 数据集 视图包含列和指标列表,这些列表的范围限定为当前选择的数据集。
- 图表区域下方的 数据 预览还为您提供了有用的数据上下文。
- 使用 数据 选项卡和 自定义 选项卡,您可以更改可视化类型,选择时间列,选择要分组的指标,以及自定义图表的视觉效果。
使用下拉菜单自定义图表时,请务必单击 运行 按钮以获得视觉反馈。
在以下屏幕截图中,我们制作了一个分组时间序列条形图,以通过单击下拉菜单中的选项来可视化按产品线划分的季度销售数据。
创建切片和仪表盘
要保存图表,请先单击 保存 按钮。您可以选择
- 保存图表并将其添加到现有仪表盘
- 保存图表并将其添加到新仪表盘
在以下屏幕截图中,我们将图表保存到一个新的“Superset Duper Sales Dashboard”中
要发布,请单击 保存并转到仪表盘。
在后台,Superset 将创建一个切片,并在其薄数据层(查询、图表类型、所选选项、名称等)中存储创建图表所需的所有信息。
要调整图表大小,请先单击右上角的编辑仪表盘按钮。
然后,单击并拖动图表的右下角,直到图表布局捕捉到您喜欢的底层网格上的位置。
单击 保存 以保存更改。
恭喜!您已成功在 Superset 中链接、分析和可视化数据。还有许多其他表配置和可视化选项,因此请开始探索并创建您自己的切片和仪表盘
ֿ
管理对仪表盘的访问权限
对仪表盘的访问权限通过所有者(对仪表盘具有编辑权限的用户)进行管理
非所有者用户的访问权限可以通过两种不同的方式进行管理
- 数据集权限 - 如果您将相关角色权限添加到数据集,它将自动授予对使用这些已授权数据集的所有仪表盘的隐式访问权限
- 仪表盘角色 - 如果您启用 DASHBOARD_RBAC 功能标志,那么您将能够管理哪些角色可以访问仪表盘
- 授予角色对仪表盘的访问权限将绕过数据集级别检查。拥有仪表盘访问权限隐式授予对仪表盘中所有特色图表的读取访问权限,从而也授予对所有关联数据集的读取访问权限。
- 如果仪表盘未指定任何角色,则将应用常规 数据集权限。
自定义仪表盘
以下 URL 参数可用于修改仪表盘的呈现方式
standalone
:0
(默认):仪表盘按正常方式显示1
:隐藏顶部导航2
:隐藏顶部导航 + 标题3
:隐藏顶部导航 + 标题 + 顶级选项卡
show_filters
:0
:在没有过滤器栏的情况下呈现仪表盘1
(默认):如果启用了本机过滤器,则在有过滤器栏的情况下呈现仪表盘
expand_filters
:- (默认):如果存在本机过滤器,则在过滤器栏展开的情况下呈现仪表盘
0
:在过滤器栏折叠的情况下呈现仪表盘1
:在过滤器栏展开的情况下呈现仪表盘
例如,在运行本地开发构建时,以下操作将禁用顶部导航并删除过滤器栏:http://localhost:8088/superset/dashboard/my-dashboard/?standalone=1&show_filters=0