知识库

Knowledge Base

一文带你了解机器学习 发布者:创始人 发布时间:2022-09-05

01 机器学习 - 人工智能的核心

     先来看看百度对机器学习的定义:

◾ 机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。

◾ 专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能

     那机器学习是如何改善自身性能的呢?这里必须再引入一个名词“算法”。算法(Algorithm)是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制

a8acb9e8851540b99208adb9e7188bfb

◾ 机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经学习中改善具体算法的性能。

 机器学习是对能通过经验自动改进的计算机算法的研究。


简而言之:

机器学习使科学的发现过程自动化

7a19331b3c3cc054bf86bfbcbe1f85c2

02 机器学习的三要素

     让我们先来看一个常见的机器学习的案例:给计算机一些图片,告诉它哪些是猫,哪些不是猫,经过算法学习,计算机归纳出一个判定是否是猫的模型。

2ac840a23e4e91702ca412f586a578b3

     整个过程共分了五个步骤,从收集数据 - 数据预处理 - 算法学习 - 误差分析 - 模型产出,其中最重要的三要素:数据、算法、模型

数据构建机器学习的基础,所有的规律都是基于数据的研究。

算法是将其中所蕴含的数学问题进行求解的过程,解决如何用数据去求解模型,变成可以运行的程序。算法是机器学习的关键

模型是将实际问题数学结构化结果,模型是机器学习的核心

02a7dca59ca3a615343d40fadbf4e570

03 机器学习如何思考?

     “没有免费的午餐定理”是由美国斯坦福大学的 Wolpert 和 Macready 教授在 1997 年在优化领域中提出的, No Free Lunch Theorems(NFL),可以简单理解为:针对某一具体域内的所有优化问题 Q,经过 m 步迭代之后达到目标函数给定值的所有可能性的累加和是相等。用在机器学习中就是“针对某一域的所有问题,所有算法的期望性能是相同的”。

     在机器学习算法中的体现为在没有实际背景下, 没有一种算法比随机猜测的效果好。机器学习不可避免地含有投机的因素,误差是常有的事

     这里我们就要来谈谈误差,我们来看下面的这张图,很形象的描述了机器学习的对于误差的判定的两种类型:过拟合和欠拟合

6f2940a052a92d596c7cb96c2e8423f6


     误差是机器学习不可或缺的部分,恰恰也是通过误差在不断优化机器学习的算法,提升准度。

aaab913aa3ec787c80ced00f5da25934

     通过这样的模型的评估与选择的流程,通过误差的不断的优化,机器学习也可以越来越精准。


04 监督学习和非监督学习

     在机器学习的领域里面,最常见的两种方法就是监督学习和非监督学习。

     所谓监督学习,顾名思义,就是在被监督的情况下的学习,被什么监督呢,被明确的结果监督。即:这种算法需要有明确的输出结果类的数据。反之,非监督学习则无明确的结果类的数据。

  下图列举了几种常见的监督学习和非监督学习的算法,给大家做参考,有兴趣的小伙伴可以试着去了解下每种算法的不同。(这是一个烧脑的过程哦!)

b8915ec04efe2e049606b06883d3cf29

05 机器学习、人工智能和深度学习

     机器学习、人工智能和深度学习这三个词大家可能都不陌生,那么这三者之间有着怎样的关系呢?我们用一张图来说明。

ddf22e34b0e60a9678c928ef7fa16a07


06 结语


     作为人工智能极为关键的通用技术之一,机器学习越来越成为主流,尤其在大数据时代,机器学习正迎来爆发性增长。企业如何运用机器学习驱动自身发展是值得探索的一项重要课题。



大咖作者:

拾老师,艾聚达信息技术(苏州)有限公司资深顾问。LSS 黑带、TPM 专家,工信部专家库大数据领域入库专家;国家注册数据分析师、卓越数据分析师、国际卓越运营协会专家组成员;工业4.0 协会智能制造高级顾问。

艾聚达 Profet AI


     AI 数据分析技能的普及化,将为企业带来全面竞争力提升。艾聚达 Profet AI 是自动 AI 机器学习平台,通过无代码来实现机器学习。一天上手,一周落地,能够赋能企业 80% 关键人才实现自主 AI 分析。如需了解关于 Profet AI 的资讯,欢迎您致电 400-1093-688 与我们联系。