Skip to content

数据分析介绍

当我们谈论数据分析的时候,都在讲些什么呢?

这里我可以把数据分析分成三个重要的组成部分。

  1. 数据采集。它是数据分析的原材料,也是最“接地气”的部分,因为任何分析都要有数据源。
  2. 数据分析。就是针对现有的数据,进行专业的技术进行分析,并得到一份分析报告。
  3. 数据可视化。它可以说是数据领域中万金油的技能,可以让我们直观地了解到数据分析的结果。
  4. 数据挖掘。它最核心的部分,也是整个商业价值所在。之所以要进行数据分析,就是要找到其中的规律,来指导我们的业务,或者是给领导做出决策提供参考信息。因此 数据挖掘的核心是挖掘数据的商业价值,也就是我们所谈的商业智能 BI

image-20210720150556223

生活中的数据分析

无处不在的数据

生活中存在各式各样的数据,那么基于这些数据,我们又能做哪些分析呢?

最近几年大数据这个词是火的不行,确实随着社会科技水平的提高,我们使用电子设备的时间越来越长,现在数据的增长量真的非常非常快,这些数据来自各个领域,比如:

  • 社交:微信,微博,知乎,豆瓣什么的
  • 交通:出租车,公交车等类的数据,比如:滴滴出行
  • 金融:股票历史交易信息,公司财报,新闻媒体的态度等等
  • 医疗:在数据收集和存储上还有很长的路要走

典型的数据分析应用

  • 竞选预测:特朗普和拜登
  • 拥堵预测:交通出行,地图导航
  • 信誉评估:信用额度贷款等
  • 辅助诊断:医疗影像等方面,比如 :CT 图像中的肿瘤

数据分析的作用

数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。

数据分析的目的有多种,概括起来有三种:

  • 现状分析:告诉你过去发生了什么。 探索型数据分析
  • 原因分析:告诉你某一现状为什么发生。 验证型数据分析
  • 预测分析:预测未来会发生什么。 预测型数据分析

为什么需要数据分析能力?

举例:

  1. 通过数据分析,可以更好地了解用户画像,为企业做留存率、流失率等指标分析,进而精细化产品运营。
  2. 如果你关注比特币,数据分析可以帮助你预测比特币的走势。
  3. 面对生活中遇到的种种麻烦,数据分析也可以提供解决方案,比如信用卡反欺诈,自动屏蔽垃圾邮件等。

案例分析

故事内容这个故事发生于 20 世纪 90 年代的美国超市中,超市管理人员分析销售数据时发现了一个令人难于理解的现象:在某些特定的情况下,“啤酒”与“尿布”两件看上去毫无关系的商品会经常出现在同一个购物篮中,这种独特的销售现象引起了管理人员的注意,经过后续调查发现,这种现象出现在年轻的父亲身上。

故事起因在美国有婴儿的家庭中,一般是母亲在家中照看婴儿,年轻的父亲前去超市购买尿布。父亲在购买尿布的同时,往往会顺便为自己购买啤酒,这样就会出现啤酒与尿布这两件看上去不相干的商品经常会出现在同一个购物篮的现象。

如果这个年轻的父亲在卖场只能买到两件商品之一,则他很有可能会放弃购物而到另一家商店,直到可以一次同时买到啤酒与尿布为止。

超市发现了这一独特的现象,开始在卖场尝试将啤酒与尿布摆放在相同的区域,让年轻的父亲可以同时找到这两件商品,并很快地完成购物。

故事小结这个故事是因为有数据分析的结果支持才会获得成功并得到广泛传播,通过分析购物篮中的商品集合数据,找出商品之间的关联关系,发现客户的购买行为,从而获得更多的商品销售收入

附录

经典数据挖掘案例:https://www.sohu.com/a/243626833_99923499