Excel是目前最基础、也是应用最广的数据分析工具,百万行级别以下最好用的数据分析工具,没有之一,不接受反驳!熟练使用Excel,能够解决数据分析中80%的问题,而且非常灵活、快速和高效,所以Excel作为数据分析师必备的基本技能,重要性不言而喻。
很多想入行数据分析的小伙伴学习Excel没有经过系统的指引与训练,而往往是来自于各种东拼西凑的知识,感觉自己很懂Excel,所以简历上就非常自信地写上了“精通Excel”这样不知天高地厚的字眼,面试一问起来才发现自己的纯真和无知。是的,当你还觉得Excel很low很简单的时候,说明你还没有被它震撼和教育过,越是精通Excel的大神越会觉得它的强大和自己的无知。
那么想入行数据分析的同学来说,怎么快速高效地掌握Excel这个数据分析的利器呢?根据笔者多年来的工作经验,作为数据分析师,提升Excel水平可以按照这样的学习路径:
1)基本操作包括数据的简单处理汇总、图表制作等,属于Excel基础知识,一般大家都能正常使用。
2)熟练掌握常用的函数后,你就可以做简单的数据统计、分析和数据可视化等工作了。
3)为了进一步从不同维度对关心的指标进行上卷、下钻分析,还需要非常熟练地掌握数据透视表,这也是Excel最为强大、使用最为频繁的功能。
4)为了实现复杂的业务分析,解决不同数据源、海量数据的分析问题,我们就需要掌握PowerQuery和PowerPivot,PowerQuery负责整合多重来源数据,并进行数据转换,PowerPivot对整合后的规范化数据进行高效率的透视分析,几百万上千万行数据均不在话下。
5)当然,这个时候可能还不够,因为平时还有很多任务是需要每天手动处理的,所以PowerBI横空出世了,PowerBI融合了PowerQuery和PowerPivot的功能,你可以利用PowerBI制作好你想要监控的核心报表,以后只要更新数据源,报表就能自动化生成,再也不用每天重复地复制粘贴做表格了!
01、数据透视表到底能干啥?
随着互联网的飞速发展,大数据时代的来临,用户需要处理的数据体量越来越大,数据也越来越复杂,如何高效地完成统计分析,洞察数据之间的关联,将繁杂的数据转化为有价值的业务信息,而这其中不得不提的就是数据透视表这把利器。数据透视表是 Excel 中一个强大的数据处理分析工具,通过数据透视表可以对大量的明细数据进行快速分类汇总,并且可以根据用户的业务需求,快速变换分析维度来查看统计结果。建好数据透视表后,可以对数据透视表重新布局,以便从不同的角度查看数据,从不同的角度分析数据背后的业务信息,而这些操作只需要用鼠标拖拖拽拽就可以实现。
数据透视表的名称来源于它具有“透视”数据的能力,因为数据透视表不仅综合了数据分类汇总、排序、筛选以及组合等数据分析方法的优点,而且汇总的方式更灵活多变,一张“数据透视表”仅靠鼠标拖拉拽各个指标,即可变换出各种报表。同时数据透视表也是解决 Excel 函数公式速度“瓶颈”的重要手段之一。总之,合理运用数据透视表进行计算与分析,能使许多复杂的问题简单化并且极大地提高工作效率。
既然数据透视表这么给力,那咱们必须明确在什么时候才需要用到这个工具。如果你要对海量的数据进行多条件统计,从而快速提取最有价值的信息,并且还需要随时改变分析角度或计算方法,那么使用数据透视表将是最佳选择之一。一般情况下,如下的数据分析要求都非常适合使用数据透视表来解决。
1)对庞大的数据库进行多条件统计,而使用函数公式统计出结果的速度非常慢。
2)需要对得到的统计数据进行行列变化,随时切换数据的统计维度,迅速得到新的数据,以满足不同的要求。
3)需要在得到的统计数据中找出某一字段的一系列相关数据。
4)需要将得到的统计数据与原始数据源保持实时更新。
5)需要在得到的统计数据中找出数据内部的各种关系并满足分组的要求。
6)需要将得到的统计数据用图形的方式表现出来,并且可以筛选控制哪些数值可以用图表来表示。
02、创建数据透视表
下面这张图为某品牌在各电商平台2018~2020年各月的销售明细流水账。
面对成百上千行的明细数据,需要按时间、分平台来汇总访客数、销售量和销售额等数据,使用数据透视表,只需简单的操作就可以完成这项工作。我们可以按照以下步骤创建一个数据透视表。
步骤1):在下图所示的销售明细流水账中选中任意一个单元格(如 C6),在【插入】选项卡中单击【数据透视表】按钮 ,弹出【创建数据透视表】对话框。
步骤2) :保持【创建数据透视表】对话框内默认的设置不变,单击【确定】按钮后即可在新工作表中创建一张空白数据透视表。数据透视表的显示区域如下所示,对数据透视表的布局进行介绍。
1)筛选区:可按指定条件过滤筛选数据进行汇总统计。
2)行标签:该区域的字段会按照上下排列显示。
3)列标签:该区域的字段会按照左右排列显示。
4)数值区:将要统计的数据列放在该栏目内就行,可选各种汇总统计方式,如计数、求和、平均等。
步骤3):为了计算每个月所有平台的销量,在【数据透视表字段】窗格中依次将“日期”和“销售数量”字段的复选框拖入到【数据透视表字段】窗格的【行】区域和【值】区域,就会生成如图所示的数据透视表。
步骤4):在【数据透视表字段】窗格中选择“平台”字段并且按住鼠标左键不放,将其拖:拽至【列】区域中,最终完成的数据透视表如图所示。
步骤5):更改值汇总方式,系统默认的汇总方式是求和,如果我们需要对字段进行计数/求平均值,就需要更改值的汇总方式,如下图所示。
03、计算同比、环比、百分比
如果你觉得上面就是透视表的全部功能了,那可就大错特错了,数据透视表之所以强大是因为它可以进行各种灵活的运算,不仅能够求和、计数,还能够方便地计算各种占比和同比、环比。
数据透视表中最常用的2个功能是“值汇总方式”和“值显示方式”,一听到这两个功能可能有点懵。值汇总方式就是指汇总的方法,比如是求和还是计数,这个用的非常多也比较好理解。值显示方式,就是在一样的汇总方法基础上,要使用怎么样的计算方式、怎么来显示这些数据(听不懂,请说人话……),下面就通过2个例子来说明使用场景。
栗子1
计算各个平台的销量占总销量的比例。首先按照“平台”对“销售数量”进行“求和”汇总,可以计算出各个平台的销量,但是并不是我们想要的占总销量的比例,再把“销售数量”拖到数值区,右键“值字段设置”-“值显示方式”选择“列汇总的百分比”,就相当于是多做了一步:值/列总计,每一列的项相加总计是100%,可以看某平台的销量占整体销量的比例,我们把命名为“销量占比”;类似的,如果选择“行汇总的百分比”,就相当于是多做了一步:值/行总计,每一行的项相加总计是100%,这里就不再赘述。
栗子2
如果想要看所有平台各月的销量情况,并进行环比、同比分析,以分析销量的增长情况。这个时候就需要更改“值显示方式”来计算环比和同比。和栗子1类似,首先按照“日期”对“销售数量”进行“求和”汇总,可以计算出各个月的销量,那如何计算环比、同比呢?首先有个前提,我们需要保证前面的数据是按连续月递增汇总的,即每月都有数据,且月份递增。把“销售数量”拖到数值区,右键“值字段设置”-“值显示方式”,选择“差异”,基本字段选择“日期”,基本项选为“上一个”,就得出了每月值与上月值的差值,即“环比增长”,如果值显示方式选择“差异百分比”,就得出了每月值与上月值的差异百分比,也就是“环比增长率”啦!
栗子3
类似的,把“销售数量”拖到数值区,右键“值字段设置”-“值显示方式”,选择“差异”,基本字段选择“年”,注意同比是指去年同期,所以这里的基本字段是“年”,基本项选为“上一个”,就得出了每月值与去年同月的差值,即“同比增长”,如果值显示方式选择“差异百分比”,就得出了每月值与去年同月值的差异百分比,也就是“同比增长率”。如下图所示。
04、分组统计
有些时候,我们需要在透视表的基础上再进行分组汇总进行特定的统计。例如,淘宝和天猫都属于淘系,我们想看一下淘系和非陶系平台的销量占比,下面我们来计算一下。
在上面计算销量占比的数据的基础上,左键选取需要合并为一组的行,右键点击“组合”。
在弹出的窗口中,修改分组名,将“数据组1”更改为“淘系”,将“京东”组改为“非淘系”,这样就得到了淘系和非淘系平台分别有多少销量以及占比,如下图所示。
还有一种常用的分组,我们经常需要在年、季、月、日期不同的时间粒度上统计,需要对日期进行分组,强大的Excel已经设计好了日期的分组功能,只要将日期列的数据设置为“日期”格式,将日期拖入到行/列标签区后,会自动生成日、月、季、年分组。
05、计算字段
前面的步骤,只能算是数据透视表的基础操作。因为整个过程并没有用到透视表的高级功能【计算字段】。计算字段是个什么东东?想象一下,如果上面这个销售记录表中,有 10 万行的数据,我们如果想计算不同平台商品平均售价=销售金额/销售数量,如果添加一个【辅助列】,就会多出 10 万行的数据,计算量也会随之暴增。而【计算字段】可以在不用【添加辅助列】的情况下,高效快速地来完成平均售价的计算。下面我们来看看具体的操作。
1、首先,按照前面的操作,先插入一个空白的数据透视表。再把“平台”拖入到行标签区,把“销售数量”、“销售金额”2个字段拖入到“值”区域,可以看到,目前这个透视表里是没有“平均售价”的。
2、接下来,是添加【计算字段】。
1) 选择透视表中的任意单元格。
2) 在【分析】选项卡中,单击【字段、项目和集】。
3)在弹出的对话框中,设置【字段】的名称为“平均售价”。然后在下面的字段列表中,选择不同的字段名称,添加计算公式“=销售金额/销售数量”。
设置完成之后,点击“确定”在数据透视表中就可以看到一个新的字段“平均售价”了。
这样,我们就在没有添加辅助列的情况下,完成了“平均售价”的统计了。
06、数据透视表小技巧
数据分析常用的透视表的功能基本上就是这么多,大约能够覆盖我们80%的分析工作,另外还有一些常用的小技巧,熟练掌握的话可以极大地提升我们的分析效率,下面就为大家一一介绍。
数据透视表切片器
切片器其实是一个翻译的坑,它和筛选器的功能是一模一样的,可以对我们源数据的各个字段进行筛选,从而灵活地完成不同条件下的统计需求。选中透视表,然后点击“分析”选项卡中“插入切片器”按钮,即可生成一个切片器,切片器可以单选和多选,如需多选,需要按住Ctrl键再用鼠标即可,点击切片器右上角的“取消筛选”按钮,即可取消筛选。例如,我们创建一个“平台”字段的切片器,方便我们查看某个平台的数据。
数据透视表布局
创建数据透视表后,数据会默认以“压缩形式”展示,如下图所示。
如果你想让列分开,就需要调整数据透视表的报表布局。选取数据透视表 – 在顶部找到“设计”选项卡 – 再打开报表布局下拉菜单,会看到5种不同的布局方式:
1) 压缩式布局:如本文开始所示。
2)大纲式布局:标题分列显示。汇总显示在每项的上方。
3)表格式布局:标题分列显示。汇总显示在每项的下方
4) 重复所有项目标签:可以填充相同的内容。大家注意下图和上图的区别。
5) 不重复所有项目标签:取消重复。是4的逆操作。
固定数字和表格格式
在数据透视表中,好不容易设置的数字格式,以及列宽,在刷新后全部恢复了原状,设置的格式全部消失。怎么才能固定格式呢?在数据透视表上右键 – 数据透视表选项 – 布局和格式 – 去掉“更新时自动调整列宽”,勾选“更新时保留单元格格式”,这样下次在更新数据的时候列宽和数据格式就不会改变了。
数据透视表刷新
当明细表更新数据后,以该明细表制的数据透视表也需要刷新才可以显示新的汇总数据。在数据透视表上的左键菜单上,点“刷新”即可完成数据刷新,如果excel文件中有很多数据透视表,可以点击“全部刷新”按钮。如下图所示。
但是如果明细表中行或列数发生了变化,数据透视表一般是不会自动调整数据源的,而需要手工去调整数据源的数据范围。方法是:选取数据透视表 – 最顶端数据透视表选项 – 更改数据源 – 重新选取范围。
数据透视表美化
新创建的数据透视表,就是一个无任何美化效果的表格。虽然数据已经处理好,但是为了让别人更好更快地理解,我们可以给数据透视表进行一定的美化。例如,我们可以在数据透视表的基础上插入数据透视图,并插入切片器对数据透视图进行筛选,对切片器进行适度的美化,改变成按钮的形式,点击不同的按钮就可以显示不同年份各平台的销量情况。
以上就是数据分析工具—Excel数据透视表部分的内容,部分数据分析工具请翻看历史文章,更多数据分析工具的文章持续更新中,敬请期待,如果觉得不错,也欢迎分享、点赞和点在看哈~