news 2026/4/18 12:25:14

00.什么是机器学习?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
00.什么是机器学习?

什么是机器学习?
机器学习是人工智能 (AI)> 的一个子集,专注于能够“学习”训练数据模式并随后对新数据做出准确推断的算法。这种模式识别能力使机器学习模型能够在没有明确的、硬编码指令的情况下做出决策或预测。

机器学习 (ML) 是人工智能(AI)的一个分支,专注于使计算机和机器能够模仿人类的学习方式,自主执行任务,并通过体验和接触更多数据,不断提升其性能、预测能力和准确性。

机器学习与人工智能

尽管“机器学习”和“人工智能”经常互换使用,但它们并不完全同义。简而言之:所有机器学习都是 AI,但并非所有 AI 都是机器学习

在流行的想象中,“AI”通常与科幻小说联系在一起 — 通常是通过对更恰当地称为通用人工智能 (AGI) 的描述,例如《2001: A Space Odyssey》中的 HAL 9000 或《Ex Machina》中的 Ava — 或者最近的生成式AI。但“人工智能”是一个统称,指的是任何能够利用信息做出决策或预测而无需人类主动参与的程序。

最基本的 AI 模型是一系列 if-then-else 语句,其规则和逻辑由数据科学家明确编程。在最简单的层面上,即使是基本的恒温器也是一个基于规则的 AI 系统:当使用简单的规则进行编程时,例如

IF room_temperature < 67, THEN turn_on_heater

以及

IF room_temperature > 72, THEN turn_on_air_conditioner

恒温器能够自主决策,无需人工干预。在更复杂的层面上,由医学专家编程的庞大而复杂且基于规则的决策树可以分析症状、情况和合并症,以辅助诊断或预后。

与专家系统不同的是,机器学习的运行逻辑不是明确编程的,而是通过经验学习的。想想垃圾邮件过滤程序:基于规则的 AI 需要数据科学家手动设计准确、通用的垃圾邮件标准,而机器学习只需要选择正确的算法和足够的样本电子邮件数据集。在训练中,模型查看样本电子邮件并预测哪些是垃圾邮件;计算其预测误差,并调整算法以减少误差;系统会重复这个过程,直到模型准确无误为止。新训练的 ML 模型已经暗中学会了如何识别垃圾邮件。

随着 AI 系统要执行的任务变得越来越复杂,基于规则的模型也变得越来越脆弱:通常,无法明确定义模型必须考虑的每一个模式和变量。机器学习系统已成为人工智能的主导模式,因为数据自身的隐式学习模式本质上在灵活性、可扩展性和可访问性方面更为突出。

机器学习的工作原理

机器学习通过数学逻辑进行。因此,每个数据点的相关特征(或“功能”)必须以数字形式表示,以便数据本身可以输入到数学算法中,该算法将“学习”将给定的输入映射到所需的输出。

机器学习中的数据点通常以矢量形式表示,其中数据点向量嵌入的每个元素(或维度)对应于其特定功能的数值。对于本质上是数字的数据模态,例如财务数据或地理空间坐标,这一点相对简单。但许多数据模态,例如文本、图像、社交媒体图形数据或应用程序用户行为,本质上并不是数字,因此需要功能工程才能以 ML 就绪的方式表示。

在机器学习算法中选择使用哪些数据方面的过程(通常手动)称为功能选择。功能提取技术仅将数据精简到最相关、最有意义的维度。两者都是功能工程的子集,功能工程是一门更广泛的学科,用于预处理机器学习的原始数据。深度学习的一个显著特点是,它通常对原始数据进行运算,并自动执行大部分功能工程(或至少是功能提取)过程。尽管可解释性较差,但这使得深度学习比传统机器学习更可扩展。

机器学习模型参数和优化

举一个实际示例,思考一个简单的线性回归算法,该算法基于三个变量的加权组合来预测房屋销售价格:平方英尺、房屋年龄和卧室数量。每个房子都表示为具有 3 个维度的向量嵌入:[square footage, bedrooms, age]一栋有 30 年历史的房子、4 间卧室和 1900 平方英尺,可以表示为[1900, 4, 30](尽管出于数学目的,这些数字可能首先被缩放或规范化为更统一的范围)。

该算法是一个简单的数学函数:

价格 =(A * 平方英尺)+(B * 房间数)- (C * 使用年限)+ 基本价格

在此处, A , B and C 是模型参数:调整这些参数将调整模型对每个变量的权重。机器学习的目标是找到此类模型参数的最优值:换句话说,就是导致整体函数输出最准确的结果。虽然现实世界中的大多数机器学习实例都涉及更复杂的算法和更多的输入变量,但其原理仍然相同:优化算法的可调参数以获得更高的准确性。

机器学习的类型

所有机器学习方法都可以根据其训练目标的性质以及(通常但不总是)所需的训练数据类型,归类为三种不同的学习范式之一:监督学习、无监督学习或强化学习。

  • 监督学习训练模型来预测给定输入的“正确”输出。它适用于需要相对于某些外部“
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 3:33:50

04.机器学习中的线性代数?

什么是机器学习中的线性代数? 在机器学习 (ML) 中,线性代数涉及使用数学运算来表示和操作 ML 模型内的数据、参数和运算。它提供语言和工具来表达数据在模型中的流动方式以及模型的“学习”方式。 强大的现代机器学习和生成式 AI 的核心是由线性代数驱动的。无论是训练神经网…

作者头像 李华
网站建设 2026/4/18 8:48:30

混合开发模式是救星还是坑?3个案例揭秘节省40万成本的秘诀

亲爱的小伙伴们&#xff0c;今天咱们来聊一个让无数企业又爱又恨的话题——混合开发模式&#xff01;&#x1f4bb;&#x1f680; 你是不是也经常听到“混合开发能省40万成本”的说法&#xff0c;心里直犯嘀咕&#xff1a;这到底是真香警告&#xff0c;还是隐藏的深坑&#xff…

作者头像 李华
网站建设 2026/4/18 11:04:02

让创业更有后劲,长沙用金融铺就“成长跑道”

近几年&#xff0c;关于年轻人创业的讨论很多&#xff0c;但按照一线创业人提供的经验来看&#xff0c;比起最初一刻的选择&#xff0c;更难的是后面一长段时间的坚持&#xff1a;项目怎么从实验室走到市场&#xff1f;第一笔订单之后&#xff0c;第二批设备钱从哪里来&#xf…

作者头像 李华
网站建设 2026/4/18 8:38:28

SQL必会必知整理-13-联结表

13.1 联结联结是利用SQL的SELECT能执行的最重要的操作&#xff0c;很好地理解联结及其语法是学习SQL的一个极为重要的组成部分。13.1.1 关系表外键为某个表中的一列&#xff0c;它包含另一个表的主键值&#xff0c;定义了两个表之间的关系。这样做的好处如下&#xff1a;信息不…

作者头像 李华
网站建设 2026/4/18 8:03:20

jQuery EasyUI 树形菜单 - 树形菜单添加节点

下面直接给你最实用、最常见的树形菜单添加节点方法&#xff0c;jQuery EasyUI 的 tree 组件支持超级灵活的动态添加节点&#xff08;新增根节点、新增子节点、插入同级节点等&#xff09;&#xff0c;复制粘贴就能用&#xff0c;领导最爱的“动态部门树新增、菜单管理新增节点…

作者头像 李华
网站建设 2026/4/18 8:10:02

AI智能体的核心引擎:知识库构建全流程详解(建议收藏)

本文详细介绍了AI知识库作为智能体"认知大脑"的核心价值&#xff0c;阐述了其三层组成要素&#xff08;事实层、规则层、语义层&#xff09;及与智能体的交互逻辑。通过未来智安的实践案例&#xff0c;展示了AI知识库如何实现快速威胁定位、持续学习沉淀和人机协同优…

作者头像 李华