在实习期间第一次接触到了Microsoft Query、PowerPivot,通过在图书馆查阅资料,找到了由张文霖等编著的这本《谁说菜鸟不会数据分析(工具篇)》,感觉非常有用,根据本书,对在GE实习过程中用到的工具(Microsoft Query、PowerPivot)做一个简单的介绍。水晶仪表和VBA暂时还没有用到过,需要的时候可以查阅该书籍进一步了解。微软Power BI系列组件包括四大成员(Power Query、 Power Pivot、 Power View和Power Map)
##数据处理
- Microsoft Query
Microsoft Query是用于将数据从外部数据源检索到其他Microsoft Office应用(特别是Microsoft Excel)中的一种程序。通过使用Microsoft Query可以从企业的数据库和文件中检索数据,而不必再Excel中重新输入需要分析的数据。也可以在每次更新数据库时,自动通过源数据库中的数据来更新Excel报表和汇总数据。
采用Microsoft Query进行处理分析的几种情况:
1.计算机没有安装其他数据库软件
2.数据处理量相对较小,数据量在Excel可容纳的范围内
3.无需进行数据处理,或者数据处理操作较为简单
4.初学者学习SQL语句 - 数据库
数据库(Database)是按照数据结构来组织、存储和管理数据的仓库。它利用数据库中的各种对象,记录、处理和分析各种数据。 - Excel数据透视表
数据透视表的作用:
1.能够改变数据表的行、列布局
2.能够快速汇总大量数据
3.能够基于原数据表创建数据分组,并对分组进行汇总统计
注释:
1.行:拖放到行中的数据字段中的每个数据项将占据透视表的一行
2.列:拖放到列中的数据字段中的每个数据项将占据透视表的一列,行和列确定一个二维表格
3.页:拖放到页中的字段,Excel将按该字段的数据项对透视表进行分页
4.数据:进行技术或汇总的字段名称
##数据分析
- PowerPivot
PowerPivot,简称PP。PowerPivot是微软在Excel 2010中新增的一个插件工具。在PowerPivot中,Excel的行、列限制已被取消,这样我们能方便地操作更大型的数据。
PowerPivot的功能:
1.整合多数据源:PP可以从几乎任意地方导入任意数据源中的数据,包括Web服务、文本文件、关系数据库等数据源
2.处理海量数据:可以轻松组织、连接和操作大型数据集中的表,处理大型数据集(通常几百万行)时所体现的性能就像处理几百行的一样
3.操作界面简洁:通过使用固有的Excel 2010功能(例如数据透视表、数据透视图、切片器等),以交互方式浏览、分析和创建报表,只要我们熟悉Excel,就可以使用PowerPivot
4.实现信息共享:PowerPivot for SharePoint可以共享整个团队的工作部薄或将其发布到Web
##数据可视化
- 水晶易表
水晶易表(SAP Crystal Dashboard Design)是根据数据展现需求,在建立好的Excel数据报表或模型的基础上,结合相应的数据展现部件,通过鼠标简单的拖曳及数据关联和设置,将沉闷的数据结果生动、清晰、直观地展现出来。
##报告自动化
- VBA
VBA(Visual Basic For Application)是一种通用的自动化语言,它可以使Excel中常用的 操作步骤自动化,还可以创建自定义的解决方案。
在Excel中使用VBA有以下几个优点:
1.使固定、重复的任务程序自动化,提高工作效率
2.可进行复杂的数据处理和分析
3.可自定义Excel函数、工具栏、菜单和界面
4.可连接到多种数据库,并进行相应数据库操作