一次完整的数据分析流程包括哪些环节?
正文约1200字
预计阅读时间4分钟
在大数据驱动的互联网时代,数据尤为重要,企业对数据分析越发重视,有接近六成的企业在大数据领域的投入将持续增加,营销分析、客户分析和内部运营管理是企业大数据应用场景最广泛的三个领域。
另外金融、医疗、商业、交通、公安、政府服务等是大数据运用得较多的行业,大数据应用在实现智能决策、提高运行效率和风险管理能力等方面具有较明显的效果。
我们今天就谈谈数据分析的一般流程是什么。我将一次完整的数据分析流程分为七个环节,包括定义问题、收集整理信息、选取分析方法、数据提取整理、分析结果及结论、实施及建议措施、实施效果评估及报告整理。
首先,要搞清问题的实质,准确、完整、真实地表达问题。其次,弄清楚为什么要解决这个问题?最后,解决这个问题的意义何在?是必须解决还是无关紧要,或是需要马上解决还是不太着急。
搜集、整理关于要解决问题的历史资料、类似情况和现状,例如从现有的报表数据中就能够看到当前问题点的数据情况或者一段时间的趋势。数据获取主要可以分为外部数据和内部数据两类。外部数据:
1、公开的数据网站上查询,比如对于战略分析师,在研究进入某个地区或某个国家的策略时,往往就需要获取对应地区、国家的数据。分享几个外部信息获取源:国家数据、中国统计信息网、github。2、第二种获取外部数据的方法就是爬虫。内部数据:以互联网行业为例,用户行为的数据是通过埋点的形式上报获取,最终储存在数据库中,作为数据分析师,需要用sql去把数据提取出来。
分析涉及到的主要维度,为后面提取数据需求作准备。选取的分析软件以及分析方法(统计学相关方法)。常见的分析方法包括:描述性分析、推断性分析等。关于统计学的分析方法可以参考之前我发布过的文章,里面有详细介绍。 干货 | 统计学派的18种经典数据分析方法(上)
根据分析内容以及分析方法,提出分析所需的数据需求。对于反馈回来的数据,需要进行部分加工,以便更能反应所要分析的问题。
根据分析的结果,得出一些当前问题产生的一些结论。这里注意分析的方法以及维度,结果的展示方式等。注意的一点是,图表不需要特别炫酷,要以能让阅读者快速清晰的理解为第一准则。结论需要求足够的数据做支撑。
针对数据分析结论,给出当前问题的解决建议措施。一方面从业务层面进行建议措施,另一方面,可以就问题点进行更深层次分析,给出数据挖掘层面的解决措施。需要注意的是,定义问题、分析数据及总结建议,才是数据分析师的核心价值所在,也是无数数据分析师仍在持续学习的原因。如果你还仅仅停留在工具操作者的层面,每天机械的跑数,一定要重视起数据分析能力的提升,否则,很容易被同样精通工具的新人所取代。
根据措施实施效果进行实际评估,将完成的分析过程,结果以及评估整理报告,为以后出现问题提供经验教训。对于本次没有完全解决的问题,进行说明。
关于数据分析的流程今天就分享到这里,之后会为大家详细讲解下数据分析方法论。