当前位置:网站首页 > 统计学与数据分析 > 正文

【统计学知识案例实践】—数据分析实战案例_数据统计与分析案例

阅读之前看这里👉:博主是正在学习数据分析的一员,博客记录的是在学习过程中一些总结,也希望和大家一起进步,在记录之时,未免存在很多疏漏和不全,如有问题,还请私聊博主指正。
博客地址:天阑之蓝的博客,学习过程中不免有困难和迷茫,希望大家都能在这学习的过程中肯定自己,超越自己,最终创造自己。

统计学的知识,学了那么多,应该在实际问题去验证和解决,尽量在实际项目中去应用,要有输出的环境,否则学习只是学习,并不能检验真正的水平和意义。所以针对此,后续在网上找一些案例进行实操。

案例1

例1:某互联网公司希望激活数量可观的沉默用户,设计了3个方案,将所有沉默用户随机分布在规模相同的三个群中,将3套方案实施在这3个群体中,观察3个群体中每天成功唤醒的用户数量,下图是3个方案实施8天后的数据:

我们先假设这3个方案的用户激活数的均值是相等的。我们需要通过统计学的方法来验证这个假设是否正确,如果满足这个条件,则接受这个假设,说明这3个方案的效果是相同的,如果不满足一定的条件,就拒绝这个假设,说明这个3个方案激活效果是不一样的,那么才有接下来的深层分析。

这里我们对这3个方案的数据做了单因素方差分析:
STEP1:在EXCEL2019中工具栏中选择数据,然后选择数据分析
在这里插入图片描述
STEP2:选择单因素方差分析
在这里插入图片描述
STEP3:选择输入区域,这里默认输出到新工作表,也可以选定区域输出
在这里插入图片描述
选取下列数据
在这里插入图片描述
输出结果:
在这里插入图片描述
这样我们就得到了单因素方差分析的结果了。

分析
MS值得是均方和,F指的是F检验统计量的值,P-value值得是出现当前结果的概率,说明的是,在原假设成立的前提下,3个方案均值分别的1024、1073、1043的概率仅为0.045低于显著性概率0.05,如此小概率的事件在一次实验中发生是不可能的,因此要拒绝原假设也就说这3个方案所激活的沉默用户的均值是不相同的

那到底是哪个方案最优呢?在证明了3个方案的效果均值不同之后,最简单的方案就是看均值,均值最高的就是最优的方案,因此可以选择方案2

但是,我们都会知道,均值反应的是数据的集中趋势,数据还有波动性,如果方案2的均值最大,但是对应的方差很大,那依据均值来判断就不是那么可靠了。

如果要精确对比出哪个方案最优,还需要对这3个方案两两组合做T检验,目的是对比两个样本是否来自均值相等的总体,也就是告诉你两个样本的均值差别是不是显著的。
在这里插入图片描述

在这里我们选择EXCEL中t-检验,双样本等方差假设

在这里插入图片描述
通过T检验,我们得到了如下结果:
在这里插入图片描述

从输出结果来看,不仅有单侧t检验和双侧t检验结果:
t Stat:计算得出的t值;
P(T<=t)单尾与t单尾临界:已知显著水平下的单尾临界t值和P值;
P(T<=t)双尾与t双尾临界:已知显著水平下的双尾临界t值和P值;
合并方差:合并公式如下:

我们通过上图发现,方案1和方案2之间呈现出了显著性,可以判断方案2是优于方案1的,至于方案1和方案3,暂时没有足够的证据判断他们的优劣。在这里呢,可以继续用均值来做比较就会准确很多了。

案例2

在这里我们利用贝叶斯模型来做分析:预备知识《商务与经济统计》学习笔记(四)–贝叶斯定理之理解

  • 平台上的恶性商户比率为0.2%,记为 P ( E ) = 0.002 P(E) = 0.002 P(E)=0.002,那么 P (   E ) = 0.998 P(~E)=0.998
到此这篇【统计学知识案例实践】—数据分析实战案例_数据统计与分析案例的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章,希望大家都能在编程的领域有一番成就!

版权声明


相关文章:

  • 统计学常用的数据分析方法总结_统计学常用的数据分析方法总结2024-10-30 17:28:22
  • 统计学方法与数据分析学习笔记1_统计学方法与数据分析引论2024-10-30 17:28:22
  • 数据分析之统计知识总结_统计 数据分析2024-10-30 17:28:22
  • 数据分析的统计学基础_数据分析的统计学基础有哪些2024-10-30 17:28:22
  • 【数据分析】统计学基础及Python具体实现_python数据分析的统计学难吗2024-10-30 17:28:22
  • 数理统计在生物统计学中的数据分析方法_数理统计在生物统计学中的数据分析方法有2024-10-30 17:28:22
  • 数据分析基础:从统计学入手数据分析!_从零进阶!数据分析的统计基础2024-10-30 17:28:22
  • 【看完这篇就够了!!!通俗易懂】置信度理解(95%的置信度、置信区间)_置信度与置信区间2024-10-30 17:28:22
  • 我的数据分析师转型之路,从零到字节跳动数据分析师_数据分析师有用吗2024-10-30 17:28:22
  • 基于统计学的商务与经济数据分析知识_商务统计学课程2024-10-30 17:28:22
  • 全屏图片