Excel系列教程:合并查询。
大家好,今天来学习power query中的合并查询功能。在介绍合并查询之前先来看这样两份表格。
·第一份是这样一张销售信息表,它包含月份、销售部门、产品类别、单价和数量六个字段。仔细观察这一张表的产品类别和单价三列,可以发现产品类别和单价是存在一一对应的关系的。a对应的就是甲类别,单价就是五元;b对应的是乙类别,单价是十元;c对应的是丙类别,单价是二十元。
·再来看第二份表格,第二份表是由两张表格组成的。第一张表包含着月份、销售部门、产品和数量四个字段;第二张表包含产品类别和单价三个字段。这三个字段就是刚才表一中一一对应的三个字段。
→第一张表称之为事实表,它的每一行数据都会包含完整的字段信息。
→第二种表称之为关系表,它是通过其中某一个或者多个字段建立起多张表的联系。
事实表和关系表是数据库中的两个表的概念,而在数据库中存储信息往往会使用关系表。这里有两个原因。
→第一个原因,关系表比事实表更容易维护。假如要更改某一个产品的单价,在关系表中只需要更改这一处,而在事实表中需要对每一个产品a的单价都进行修改。
→第二个原因,不管是事实表还是关系表,存储的信息内容是一样的,没有哪个表会比另外一个表多出哪怕一条信息。但是在存储相同信息内容的前提下,关系表会比事实表节省出很多存储的空间。
假如数据信息有几十万条甚至上百万条,产品类别和单价这一部分将会出现大量的重复数据,而在关系表中只需要这三行就行了。这也是为什么在数据库的存储中会使用关系表的原因。在使用关系表去做数据的统计分析的时候就需要使用到今天介绍的合并查询功能。
下面在power query界面中去演示一下合并查询功能是如何使用的。合并查询在主页选项卡下组合功能组中,跟之前介绍的追加查询一样,合并查询也有两个按钮,分别是合并查询和将查询合并为新查询。
合并查询是在原表上进行操作,而新查询的是新建一个表。比如现在想要将产品的类别和单价合并查询到这张表上,点击合并新查询,选择产品信息表,建立关联的列就是产品列,需要选择第一张表的产品列以及第二张表的产品列连接种类。这里有六种方式。
在这一期的视频中只会使用左外部这第一种模糊匹配,默认不勾选就可以了,然后点击确定。这样就会多出一列产品信息表这一列。多出来的这一列是以表格的形式记录的,它就是根据当前行产品在产品信息表中去筛选出所有符合产品的行,然后做一张表格添加到后面。
此时可以点击产品信息表右边的扩展按钮,选择展开,然后勾选类别和单价这一列,不需要勾选产品,因为产品前面已经有了,然后取消使用原始列作为前缀的勾选,点击确定。这就相当于Excel中使用VLOOKUP函数去查找匹配。
·除了使用单列的条件去查找,还可以使用多个条件去查找。比如这里有产品价目表,这张表格不同的月份会有不同的单价,可以通过多个条件进行匹配,再使用合并查询作为新查询。
·第二张表选择产品价目表,此时的条件是月份和产品两个条件,需要使用ctrl键多选这两个字段。在第二张表中同样要选择这两个字段,但是需要注意的是选择的顺序要跟第一张表保持一致。第二张表同样选择月份和产品,顺序在字段的后面会有个数字,就表示选择的顺序,然后点击确定。
·再将这个表格展开,只需要勾选单价这一列,然后点击确定,这样就能根据月份和产品两个条件查询出对应的单价。
合并查询功能除了做查询,还可以做数据的汇总。比如想要将所有产品的销售数量进行统计,就可以使用合并查询功能,这次直接在原表上进行操作。第二张表选择销售信息表,同样选择产品列,点击确定。这次筛选出来的表格就会多行的数据,产品a就是所有包含产品a的数据,产品b就是所有包含产品b的数据。
·然后点击展开,这次选择聚合,然后勾选数量的总和,点击确定,这样就能将所有产品的数量做一个汇总。再比如部门产品的汇总,合并查询,选择销售信息表,查询的条件是部门和产品两列。在第二张表中同样要选择这两列,点击确定,然后展开,可以对数量进行求和,也可以对某些字段进行计数。就是统计有多少条信息,这里勾选数量总和,点击确定。这样就能将每一个部门,每一个产品销售了多少进行统计,空就代表二部门b产品没有任何的销售记录。
以上就是power query中合并查询功能的操作方法,你都学会了吗?下一期视频再来介绍合并查询的六种连接方式,下期视频再见。
Copyright © 2024 妖气游戏网 www.17u1u.com All Rights Reserved