数据分析师宝典
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.3 数据分析的五个步骤

数据分析主要包含五个既相互独立又相互联系的步骤。它们分别是收集数据、处理数据、分析数据、展示数据、撰写数据分析报告。

1.3.1 收集数据

数据的收集是指按照确定的框架,有目的地收集相关数据的过程。这里所涉及的数据包括直接数据与间接数据,直接数据是指可直接获得的数据,例如某家店的名字、衣服的颜色、人的相貌等。

间接数据则是指加工处理之后得到的数据。其数据来源主要包括以下四个方面。

1.数据库

每个企业都会建立自己的数据库来存放公司的业务数据。数据库本身就是一个庞大的数据资源,可以有效利用。

2.权威机构的数据报告

权威机构公布的数据报告能够作为一个十分可靠的数据来源,例如《中国统计年鉴》《世界经济年鉴》等。

3.搜索引擎

随着互联网的发展,搜索引擎中收藏的数据越来越多,企业可以从中快速找到需要的数据。例如当前国内最大的搜索引擎百度,其收藏的数据涵盖面极广。谷歌也拥有着十分出色的数据储存量。

4.市场调查

以上三种方法收集数据的时间虽然较为短暂,但搜集的数据与用户匹配度不高,因此想要更加充分了解用户的想法和需求,就需要通过市场调查的方法获取数据。进行市场调查的过程中,数据分析师需要有目的地、系统地收集数据,并做好相应的记录,最后整理出一份较为完整的市场调查报告,从而为市场预测和经营决策提供依据。

不过,市场调查所需要的费用较高,而且耗时较长,在选用这种渠道时,需要谨慎。

1.3.2 处理数据

数据处理是指对收集到的数据进行加工,将其转化为适合数据分析形式的过程。这就要求数据分析师能够从大量杂乱无章的数据中,抽取出有实际价值的数据。数据处理的方法包括数据筛选、数据转化、数据计算等。如图1-10所示。

1.数据筛选

数据筛选就是对数据进行一个初步的判断,将一些无用的数据剔除。例如,收集手机的信息:价格为2999元,手机后盖颜色为白色,手机很漂亮,很多人买了该手机。这些信息中“很多人买了该手机”就属于无用信息,可以删除。

图1-10 数据处理的方法

2.数据转化

数据转化是指将一些不容易分析的数据转化成容易分析的数据。比如,1台A电脑价值5823元,比同类型的B电脑价格高出954元。这些数据就可以转化成:A电脑比B电脑的价格高出近20%。

3.数据计算

数据计算是指在对数据进行处理的过程中将一些复杂的数据处理成较为简单的表述形式,例如上面提到的A电脑与B电脑的价格对比,就是采用了数据计算的方法。

从以上的方法中我们可以看出,数据处理并不是一项简单的工作,它在整个数据分析的过程中所占的时间比例较大,甚至在一定程度上影响着后续步骤的质量。

1.3.3 分析数据

分析数据是指通过适当的分析方法与工具,对处理过的数据进行分析,将有价值的信息摘取出来,形成一些较为完整的结论。

这就需要数据分析师掌握前文中提及的各种数据分析工具,同时还要熟练运用各种数据分析方法。一般而言,初入数据分析行业的“小白”只需要熟练掌握微软Office软件中自带的Excel即可,如果想要进行高级的数据分析就需要较为专业的、更高级的工具等。

讲到这里,相信很多读者开始出现概念混淆的情况了,分析数据与数据分析的区别在哪里呢?为了便于大家区分概念,这里我就为大家简单梳理一下分析数据与数据分析的区别。

1.目的不同

数据分析是为了得出某个有用的结论,从而为企业提供决策依据。而分析数据只是为了让企业能够更为高效地获取数据背后的含义。因此这两点属于从属关系,分析数据属于数据分析的一个“子集”。

2.方法不同

数据分析主要通过五个步骤得出最终的结论,并将其展现到企业与用户面前。而分析数据则通过一系列的工具挖掘数据背后的含义。

通过以上两点简单的总结,我希望能够帮助各位数据分析师更容易弄清楚数据分析与分析数据的差异。

1.3.4 展示数据

通过上述步骤,深藏于数据内部的联系与规律就会逐渐浮现,那么到底该通过何种方式来展现这些联系与规律,让人一目了然呢?这就需要借助图表的力量。

众所周知,数据大多数时候都是通过图表展示的,因为图表能让大多数人对数据不那么厌烦。常用的数据图有饼图、柱形图、条形图、折线图、气泡图、散点图、雷达图等。这些图经过进一步的加工,就可以变成更为直观有效的图形。例如,金字塔图、矩阵图、漏斗图、帕雷托图等。

接下来为大家介绍制作图表的五个步骤:

第一步,确定主题。

第二步,确定图表。

第三步,挑选数据制作图表。

第四步,检查是否能够较为真实地展现数据。

第五步,检查是否符合主题观点。

大多数情况下,人们更愿意接受图形,因为它能更加直接、更加有效地表达观点。一般而言,能用图形解释问题时就不用表格,能用表格解释问题时就不用文字。

1.3.5 撰写数据分析报告

数据分析报告实际上就是对数据分析过程的总结与展示。数据分析报告能够清晰、完整地将数据分析的起因、过程、结果与建议展示出来,供企业参考。所以,数据分析报告是利用科学的分析实现对数据的挖掘,为企业的下一步决策提供依据,降低企业运营风险,提高企业竞争力。

一份较为出色的数据分析报告,首先需要一个出色的分析框架,并且应做到图文结合、层次清晰、条理分明、让读者产生阅读兴趣、便于读者理解报告内容,并能引导读者产生对数据分析报告的思考。

此外,一份较为出色的数据报告需要有较为明确的结论,不然这份报告就失去了意义,前几个步骤的功夫就白白浪费了。同时,数据报告还需要给出一定的建议,来帮助决策者解决问题。

本书第8章会详细介绍该如何撰写数据分析报告,这里先为大家简单介绍一下数据分析报告的组成。

1.标题

标题是一份报告的核心,是全篇最重要的部分。一个好的标题能让读者在看到报告的一瞬间就产生阅读的欲望;同时,也能让读者迅速理解这篇数据分析报告的主旨。在这里为大家介绍一个小技巧:有时可以在标题中加入部分关键性的结论词语,以增加吸引力。

例如,现在有一份关于数据分析师薪酬方面的报告,你可以:

(1)直接在标题中展示报告的结论,例如“数据分析师在AI到来的时代中就业率直线上升”。

(2)提出研究问题,例如“数据分析师的未来规划在何处”。

(3)中规中矩地展示研究的主题,例如“数据分析师的薪酬研究”。

2.目录

目录体现了整个数据分析报告的结构。

3.前言

前言部分需要注意以下六点:

(1)写出这次分析报告的目的和背景。

(2)略微阐述存在的问题。

(3)介绍报告实际解决什么问题。

(4)介绍报告运用了哪些分析思路、分析方法和模型。

(5)写出总结性的结论。

(6)标示清楚每一份数据的来源。

4.正文

正文包含着最后的总结结论与建议,一般需要注意以下四点:

(1)逻辑性强

数据的分析与论证要严谨合理,逻辑性强。

(2)结构清晰

分析报告的结构需要简单明了,符合常识。

(3)结论明确

数据分析的结论一定是从数据中得出的,要切合数据分析的主题。选择的分析结论一定是和主题相关性最强的,否则容易打乱读者的思路。

(4)可视化

一图胜千言。在数据分析报告中应当多使用图表,减少多余的解释。