01 机器学习 - 人工智能的核心
先来看看百度对机器学习的定义:
◾ 机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。
◾ 专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
那机器学习是如何改善自身性能的呢?这里必须再引入一个名词“算法”。算法(Algorithm)是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制。
◾ 机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经学习中改善具体算法的性能。
◾ 机器学习是对能通过经验自动改进的计算机算法的研究。
简而言之:
机器学习使科学的发现过程自动化。
02 机器学习的三要素
让我们先来看一个常见的机器学习的案例:给计算机一些图片,告诉它哪些是猫,哪些不是猫,经过算法学习,计算机归纳出一个判定是否是猫的模型。
整个过程共分了五个步骤,从收集数据 - 数据预处理 - 算法学习 - 误差分析 - 模型产出,其中最重要的三要素:数据、算法、模型。
◾数据是构建机器学习的基础,所有的规律都是基于数据的研究。
◾算法是将其中所蕴含的数学问题进行求解的过程,解决如何用数据去求解模型,变成可以运行的程序。算法是机器学习的关键。
◾模型是将实际问题数学结构化结果,模型是机器学习的核心。
03 机器学习如何思考?
“没有免费的午餐定理”是由美国斯坦福大学的 Wolpert 和 Macready 教授在 1997 年在优化领域中提出的, No Free Lunch Theorems(NFL),可以简单理解为:针对某一具体域内的所有优化问题 Q,经过 m 步迭代之后达到目标函数给定值的所有可能性的累加和是相等。用在机器学习中就是“针对某一域的所有问题,所有算法的期望性能是相同的”。
在机器学习算法中的体现为在没有实际背景下, 没有一种算法比随机猜测的效果好。机器学习不可避免地含有投机的因素,误差是常有的事。
这里我们就要来谈谈误差,我们来看下面的这张图,很形象的描述了机器学习的对于误差的判定的两种类型:过拟合和欠拟合。
误差是机器学习不可或缺的部分,恰恰也是通过误差在不断优化机器学习的算法,提升准度。
通过这样的模型的评估与选择的流程,通过误差的不断的优化,机器学习也可以越来越精准。
04 监督学习和非监督学习
在机器学习的领域里面,最常见的两种方法就是监督学习和非监督学习。
所谓监督学习,顾名思义,就是在被监督的情况下的学习,被什么监督呢,被明确的结果监督。即:这种算法需要有明确的输出结果类的数据。反之,非监督学习则无明确的结果类的数据。
下图列举了几种常见的监督学习和非监督学习的算法,给大家做参考,有兴趣的小伙伴可以试着去了解下每种算法的不同。(这是一个烧脑的过程哦!)
05 机器学习、人工智能和深度学习
机器学习、人工智能和深度学习这三个词大家可能都不陌生,那么这三者之间有着怎样的关系呢?我们用一张图来说明。
06 结语
作为人工智能极为关键的通用技术之一,机器学习越来越成为主流,尤其在大数据时代,机器学习正迎来爆发性增长。企业如何运用机器学习驱动自身发展是值得探索的一项重要课题。
大咖作者:
拾老师,艾聚达信息技术(苏州)有限公司资深顾问。LSS 黑带、TPM 专家,工信部专家库大数据领域入库专家;国家注册数据分析师、卓越数据分析师、国际卓越运营协会专家组成员;工业4.0 协会智能制造高级顾问。
艾聚达 Profet AI
AI 数据分析技能的普及化,将为企业带来全面竞争力提升。艾聚达 Profet AI 是自动 AI 机器学习平台,通过无代码来实现机器学习。一天上手,一周落地,能够赋能企业 80% 关键人才实现自主 AI 分析。如需了解关于 Profet AI 的资讯,欢迎您致电 400-1093-688 与我们联系。
在线咨询
热线电话
400-1093-688
意向合作
关注公众号