概述
Power Query优势
1.企业的业务都是并发关联的,如果仅用EXCEL处理,复制粘贴工作量巨大不说,还会频发人为的数据错漏。Power Q可以
提取整合多数据源数据。面上我们能叫出名字的数据源,比如各种关系型数据库、Excel文件、txt格式及cvs格式等文本文件、甚至Web页面、Hadoop的HDFS等,都在其支持范围内。
2.突破Excel表格的数据限制,可快速处理几百万甚至上千万行的数据。如果有限制也是计算机性能跟不上(8G内存的机器,数据处理量最好不要超过2G)。
3.直接通过菜单栏选项卡操作即享用丰富的数据处理分析功能。
4.可通过M函数灵活创建自定义数据处理及计算规则。
600多个M函数集,非excel一般函数能比。
5.创建好的数据处理流程可以无限次利用,大幅增加工作效率,少加班。
数据获取
导数据(即数据加载)的几个注意点:
- 数据加载分两种情况:仅创建连接 或 表,前者更节省空间,但默认规则是“表”。
如果已经按照创建连接的方式加载了数据,还可以通过在界面右侧的“工作簿查询”,找到表,点击右键,会出现“加载到…",即可更改。
- 不要××使用excel-数据选项卡下的“获取外部数据”,这个跟power query没有关系;正确的方式是从“新建查询”导入数据。
数据加工
横向合并数据(工具名叫合并查询)
类似一个excel里面Vlookup的操作。
两个概念:主表-要合并完成的表;副表-参与合并的表
合并的前提:主表和副表有相同的字段(字段名不一样没关系),主表和副表关键字段的值能够对应得上。最好没有重复值。
如果有重复值,连接后得总行数为关键字段值重复出现次数得乘积。
纵向合并数据(工具名叫追加查询)
就是给数据添加行记录的意思
- 将有相同字段名的字段纵向合并到一起;
- 将不同字段名的字段追加在最后;
- 彼此配不上的字段统统标记值为null。
excel判断第一行是标题还是数值的时候有自己的运行逻辑,如果被判断为数值,导入数据之后会自动加如标题行,显示为column 1,2,3…,此时就需要手工调整,进入到power query查询编辑器之后,找到上方工具栏有“将第一行用作标题”,即可修正。
最后
以上就是高挑大神为你收集整理的Power Query学习笔记-数据获取与加工数据获取数据加工的全部内容,希望文章能够帮你解决Power Query学习笔记-数据获取与加工数据获取数据加工所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复