知识库

Knowledge Base

浅析统计分析和机器学习的关系 发布者:创始人 发布时间:2022-09-05

    统计分析是什么呢?让我们先来看看百度对它的定义:

① 统计分析定义:指运用统计方法及与分析对象有关的知识,从定量定性的结合上进行的研究活动。

② 它是继统计设计、统计调查、统计整理之后的一项十分重要的工作,是在前几个阶段工作的基础上通过分析从而达到对研究对象更为深刻的认识。

③ 它又是在一定的选题下,集分析方案的设计、资料的搜集和整理而展开的研究活动。

 系统、完善的资料是统计分析的必要条件。

     上面这一段是来自百度百科的定义,那么你对统计分析又有着怎样的认知呢?


工业统计分析 - SPC  

     在制造业里,我们对统计分析最直观的认识来自 SPC 控制图。

▶ 一段关于 SPC 的简短历史:


▶ SPC 的含义:

     SPC:统计过程控制,取英文 Statistical Process Control 三字之字首简称为 SPC。


Statistical: 数据之搜集、 呈现 (图/表) 及分析。

Process: 指一系列作业活动,每一活动均是过程。

Control: 量测结果的控制。

▶ SPC 顾名思义就是『运用统计的方法来控制过程』

     对于制造现场的管理,品质保证是第一位的,可如何做到呢?要花多大的成本来做呢?是 100% 全检,还是抽检?

     SPC 就是在这个大环境下产生的,SPC 是利用分析样本资料(样本抽样),来判断过程是否处于可接受的状态,在必要时调整过程参数,以使过程平均值能符合目标值,并降低产品质量特性的变异。

     统计过程控制为预防性控制手法,它比事后检验更能提升产品质量。

▶ 统计过程控制图的意义

✔ SPC 的目的在于维持过程稳定,并经由持续降低质量的变异来改善过程能力。

 对过程进行控制是真正的目标,记住控制所有关键的 X。


▶ 统计过程控制的功用

 确定过程的统计控制界限,判断过程是否失控和过程是否有能力。

 为过程提供一个早期警报系统,及时监控过程的情况以防止废品的发生。

✔ 减少对常规检验的依赖性,定时的观察以及系统的测量方法替代了大量的检测和验证工作。


统计分析与机器学习的关系  

     一直以来,这两者的界限都很模糊,很多人的理解都是机器学习其实就是统计学的一种延伸。而针对两者的关系,也有着不同的看法:

看法一:参照数据的复杂度,简单的数据用统计分析,复杂的数据用机器学习。

看法二:统计学多是基于样本的研究,而机器学习借助大数据和算力,更倾向于全样本的研究。

看法三:基于解决问题而言,选择适合的分析工具,在过程中依据问题选择统计分析与机器学习相结合的方式。

你的看法属于哪一种呢?


     统计分析和机器学习,对于我而言是一致的,都是用数据来理解世界的一种方式,过去受限于采集数据本身的难度,人们用抽样的样本来解释看到的世界。

     而现如今随着物联网、信息化、移动化等技术的发展,采集数据的成本大幅度降低,得益于摩尔定律,数据的算力也大幅度提升,因此机器学习这种技术本身也有了更大的发挥空间。

     我们已经处在这样的一个大数据时代,数据赋予我们的含义也更为重大,《大数据时代:生活、工作与思维的大变革》一书的作者维克托·迈尔·舍恩伯格,如是说,“如果你是一个个人,你拒绝的话,可能会失去生命,如果是一个国家,拒绝大数据时代的话,可能失去这个国家的未来,失去一代人的未来。” 



结语  

     我是个实用主义者,今天我们讨论这个议题,并非是做学术研究,而是要回归初心,从数据应用的视角来探寻统计分析和机器学习。

     对于数据分析能力的演进进程,回归到业务提升的原点,适用就好,有效益就好!

数据分析能力的演进

     在这条路径中,我们需要看清所处的环境以及所面临的业务问题,再去选择最适合自己的方法!不必过于纠结是否用到了大数据,也不要被新名词蒙蔽了眼睛,只要回归初心,回到现场,就能找到对的答案!


图片

大咖作者

拾老师,艾聚达信息技术(苏州)有限公司资深顾问。LSS 黑带、TPM 专家,工信部专家库大数据领域入库专家;国家注册数据分析师、卓越数据分析师、国际卓越运营协会专家组成员;工业4.0 协会智能制造高级顾问。


关于艾聚达

      艾聚达是一家全球化智能工业硬件服务公司,基于人工智能 (AI) 技术,熟练运用海量算法模型,结合丰富的实战应用场景,为各企业提供智能检测(AOI)、智能设备、智能物联网、大数据分析等专业的人工智能技术软、硬件整合解决方案,助力企业全面数字化转型。