11---
2- title : COVID-19 数据仪表盘
2+ title : 为 COVID-19 数据构建仪表盘(Dashboard)
33---
44import StepsWrap from '@site/src /components/StepsWrap';
55import StepContent from '@site/src /components/Steps/step-content';
66
7- 在本教程中,我们将加载、分析并创建一个名为“来自纽约时报的 Covid-19 数据”的数据集的仪表盘。该数据集包含每日更新的关于美国 Covid-19 病例、死亡和其他相关统计数据的信息。它提供了对疫情在美国全国、州和县各级影响的全面了解,提供了对 2022 年全年各个地区 Covid-19 情况的详细见解 。
7+ 在本教程中,我们将加载、分析名为“ Covid-19 Data from New York Times”的数据集,并为其创建仪表盘(Dashboard)。该数据集包含美国全境每日更新的 Covid-19 病例、死亡及相关统计信息,可全面展示 2022 年全年疫情在全国、州、县各级的影响与细节 。
88
9- | 字段 | 描述 |
10- | ---------- | ----- ----------------------------------------------|
11- | date | 报告的累计 Covid-19 数据的日期。 |
12- | county | 数据条目的县名称。 |
13- | state | 数据条目的州名称。 |
14- | fips | 与位置关联的 FIPS 代码。 |
15- | cases | 确诊 Covid-19 病例的累计数量。 |
16- | deaths | 因 Covid-19 导致的累计死亡人数。 |
9+ | 字段 | 描述 |
10+ | ---------| ----------------------------------------------|
11+ | date | 报告的 Covid-19 累计数据日期。 |
12+ | county | 该条数据对应的县名称。 |
13+ | state | 该条数据对应的州名称。 |
14+ | fips | 与该地点关联的 FIPS 代码。 |
15+ | cases | Covid-19 确诊病例的累计数量。 |
16+ | deaths | 因 Covid-19 导致的累计死亡人数。 |
1717
1818### 步骤 1:准备数据
1919
20- 数据集“来自纽约时报的 Covid-19 数据”是一个内置的示例数据集,您只需点击几下即可加载 。目标表会自动创建,因此您无需提前创建它 。
20+ 数据集“Covid-19 Data from New York Times”为内置示例,只需几次点击即可加载 。目标表会自动创建,无需提前手动建表 。
2121
2222<StepsWrap >
2323<StepContent number =" 1 " >
2424
2525### 加载数据集
2626
27- 1 . 在 Databend Cloud 中,点击 ** 概览** 页面上的 ** 加载数据 ** 按钮。
28- 2 . 在打开的页面上 ,选择** 新表 ** 单选按钮,然后从 ** 加载示例数据 ** 下拉菜单中选择 ** Covid-19 Data from New York Times.CSV** :
27+ 1 . 在 Databend Cloud 的 ** 概览** 页面点击 ** Load Data ** 按钮。
28+ 2 . 在打开的页面中 ,选择 ** A new table ** 单选按钮,然后在 ** Load sample data ** 下拉菜单中选择 ** Covid-19 Data from New York Times.CSV** :
2929
3030![ Alt text] ( @site/static/public/img/cloud/dashboard-1.png )
3131
32- 3 . 在下一页上,选择一个数据库并为要创建的目标表设置一个名称 。
32+ 3 . 在下一页面选择数据库,并为即将创建的目标表命名 。
3333
3434![ Alt text] ( @site/static/public/img/cloud/dashboard-2.png )
3535
36- 4 . 点击** 确认 ** 。Databend Cloud 开始创建目标表并加载数据集。 此过程可能需要几秒钟。
36+ 4 . 点击 ** Confirm ** 。Databend Cloud 开始创建目标表并加载数据集, 此过程可能需要几秒钟。
3737
3838</StepContent >
3939
@@ -42,23 +42,23 @@ import StepContent from '@site/src/components/Steps/step-content';
4242
4343### 处理 NULL 值
4444
45- 在进行分析工作之前,建议检查表中是否存在 NULL 值和重复值,因为它们可能会影响结果 。
45+ 分析前建议检查表中的 NULL 与重复值,以免影响结果 。
4646
47- 1 . 创建一个工作表,并使用以下 SQL 语句检查表中是否存在 NULL 值:
47+ 1 . 新建工作区,使用以下 SQL 检查是否存在 NULL 值:
4848
4949``` sql
5050SELECT COUNT (* )
5151FROM covid_19_us_2022_3812
52- WHERE date IS NULL OR country IS NULL OR state IS NULL OR flip IS NULL OR cases IS NULL OR deaths IS NULL ;
52+ WHERE date IS NULL OR country IS NULL OR state IS NULL OR fips IS NULL OR cases IS NULL OR deaths IS NULL ;
5353```
5454
55- 此 SQL 语句返回 ` 41571 ` ,表示包含至少一个 NULL 值的行数 。
55+ 该语句返回 ` 41571 ` ,表示有 41571 行存在至少一个 NULL 值 。
5656
57- 2 . 从表中删除包含至少一个 NULL 值的行 :
57+ 2 . 删除这些含 NULL 的行 :
5858
5959``` sql
6060DELETE FROM covid_19_us_2022_3812
61- WHERE date IS NULL OR country IS NULL OR state IS NULL OR flip IS NULL OR cases IS NULL OR deaths IS NULL ;
61+ WHERE date IS NULL OR country IS NULL OR state IS NULL OR fips IS NULL OR cases IS NULL OR deaths IS NULL ;
6262```
6363
6464</StepContent >
@@ -68,39 +68,39 @@ WHERE date IS NULL OR country IS NULL OR state IS NULL OR flip IS NULL OR cases
6868
6969### 处理重复值
7070
71- 1 . 在同一个工作表中,使用以下 SQL 语句检查表中是否存在重复值 :
71+ 1 . 在同一工作区使用以下 SQL 检查重复行 :
7272
7373``` sql
74- SELECT date , country, state, flip , cases, deaths, COUNT (* )
74+ SELECT date , country, state, fips , cases, deaths, COUNT (* )
7575FROM covid_19_us_2022_3812
76- GROUP BY date , country, state, flip , cases, deaths
76+ GROUP BY date , country, state, fips , cases, deaths
7777HAVING COUNT (* ) > 1 ;
7878```
7979
80- 此 SQL 语句返回 ` 0 ` ,表示表中没有重复的行,现在可以进行数据分析了 。
80+ 该语句返回 ` 0 ` ,表示无重复行,数据已可用于分析 。
8181
8282</StepContent >
8383</StepsWrap >
8484
85- ### 步骤 2:使用查询结果创建图表
85+ ### 步骤 2:用查询结果创建图表
8686
87- 在这一步中,我们将运行四个查询来从数据中提取见解, 并通过记分卡、饼图、条形图和折线图来可视化结果 。** 请为每个查询创建一个单独的工作表 ** 。
87+ 我们将运行四条查询以获取洞察, 并通过记分卡、饼图、柱状图和折线图进行可视化 。** 请为每条查询单独创建工作区 ** 。
8888
8989<StepsWrap >
9090<StepContent number =" 1 " >
9191
92- ### 2022 年美国总死亡人数
92+ ### 2022 年美国死亡总数
9393
94- 1 . 在工作表中运行以下 SQL 语句 :
94+ 1 . 在工作区运行以下 SQL:
9595
9696``` sql
97- -- Calculate the total number of deaths in the US on December 31, 2022
97+ -- 计算 2022 年 12 月 31 日美国累计死亡数
9898SELECT SUM (deaths)
9999FROM covid_19_us_2022_3812
100100WHERE date = ' 2022-12-31' ;
101101```
102102
103- 2 . 使用查询结果在工作表中创建一个记分卡 :
103+ 2 . 利用查询结果在工作区内创建记分卡 :
104104
105105![ Alt text] ( @site/static/public/img/cloud/dashboard-3.gif )
106106
@@ -109,37 +109,37 @@ WHERE date = '2022-12-31';
109109<StepContent number =" 2 " >
110110
111111
112- ### 2022 年各州总死亡人数
112+ ### 2022 年各州死亡总数
113113
114- 1 . 在工作表中运行以下 SQL 语句 :
114+ 1 . 在工作区运行以下 SQL:
115115
116116``` sql
117- -- Calculate the total number of deaths by state on December 31, 2022
117+ -- 计算 2022 年 12 月 31 日各州累计死亡数
118118SELECT state, SUM (deaths)
119119FROM covid_19_us_2022_3812
120120WHERE date = ' 2022-12-31'
121121GROUP BY state;
122122```
123123
124- 2 . 使用查询结果在工作表中创建一个饼图 :
124+ 2 . 利用查询结果在工作区内创建饼图 :
125125
126126![ Alt text] ( @site/static/public/img/cloud/dashboard-4.gif )
127127
128128</StepContent >
129129
130130<StepContent number =" 3 " >
131131
132- ### 维尔京群岛的病例和死亡人数
132+ ### 维尔京群岛病例与死亡
133133
134- 1 . 在工作表中运行以下 SQL 语句 :
134+ 1 . 在工作区运行以下 SQL:
135135
136136``` sql
137- -- Retrieve all data for the state of Virgin Islands on December 31, 2022
137+ -- 获取 2022 年 12 月 31 日维尔京群岛的全部数据
138138SELECT * FROM covid_19_us_2022_3812
139139WHERE date = ' 2022-12-31' AND state = ' Virgin Islands' ;
140140```
141141
142- 2 . 使用查询结果在工作表中创建一个条形图 :
142+ 2 . 利用查询结果在工作区内创建柱状图 :
143143
144144![ Alt text] ( @site/static/public/img/cloud/dashboard-5.gif )
145145
@@ -148,12 +148,12 @@ WHERE date = '2022-12-31' AND state = 'Virgin Islands';
148148<StepContent number =" 4 " >
149149
150150
151- ### 圣约翰每月累计病例和死亡人数
151+ ### 圣约翰每月累计病例与死亡
152152
153- 1 . 在工作表中运行以下 SQL 语句 :
153+ 1 . 在工作区运行以下 SQL:
154154
155155``` sql
156- -- Retrieve data for St. John at the end of each month
156+ -- 获取圣约翰每月末的数据
157157SELECT * FROM covid_19_us_2022_3812
158158WHERE
159159 (date = ' 2022-01-31'
@@ -171,7 +171,7 @@ WHERE
171171 AND country = ' St. John' ORDER BY date ;
172172```
173173
174- 2 . 使用查询结果在工作表中创建一个折线图 :
174+ 2 . 利用查询结果在工作区内创建折线图 :
175175
176176![ Alt text] ( @site/static/public/img/cloud/dashboard-6.gif )
177177
@@ -180,8 +180,8 @@ WHERE
180180
181181### 步骤 3:将图表添加到仪表盘
182182
183- 1 . 在 Databend Cloud 中,在 ** 仪表盘 ** > ** 新建仪表盘 ** 上创建一个仪表盘,然后点击仪表盘上的 ** 添加图表 ** 。
183+ 1 . 在 Databend Cloud 通过 ** Dashboards ** > ** New Dashboard ** 创建仪表盘,然后点击 ** Add Chart ** 。
184184
185- 2 . 将左侧的图表拖放到仪表盘上。您可以根据需要调整图表的大小或重新定位 。
185+ 2 . 将左侧图表拖至仪表盘,可自由调整大小与位置 。
186186
187187![ Alt text] ( @site/static/public/img/cloud/dashboard-7.gif )
0 commit comments