news 2026/4/18 13:17:25

AI核心知识60——大语言模型之NLP(简洁且通俗易懂版)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI核心知识60——大语言模型之NLP(简洁且通俗易懂版)

自然语言处理(Natural Language Processing,简称NLP)是人工智能(AI)皇冠上最璀璨的一颗明珠。

大语言模型 (LLM)的语境下,NLP 是“学科”与“工具”的关系:

  • NLP是学科(宏观领域):它研究的是“如何让计算机听懂人话,并像人一样说话”

  • LLM是工具(最新技术):它是目前 NLP 领域最强大、最先进的技术解决方案。

简单来说:NLP大模型的“祖师爷”和“应用场景”,而大模型是 NLP 发展了 70 年后进化出的“究极形态”。


1.🌉 核心任务:人机沟通的桥梁

计算机的母语是 0 和 1(二进制代码),人类的母语是 自然语言(中文、英文等)。

这两者是完全不同的。

NLP的作用就是充当“翻译官”,它包含两个核心方向:

A. 让电脑“听懂” —— NLU (自然语言理解)
  • 定义:Natural Language Understanding。

  • 任务:把人类复杂的语言变成机器能懂的结构化数据。

  • LLM之前的做法:分词、词性标注、提取关键词。

  • LLM的做法:把文字变成向量 (Embedding),计算语义关系,理解上下文和潜台词。

    • 例子:你说“我今天蓝瘦香菇”。传统 NLP 可能分析出“蓝色、瘦、香菇”;LLM 能理解你是“难受想哭”。

B. 让电脑“会说” —— NLG (自然语言生成)
  • 定义:Natural Language Generation。

  • 任务:把机器的数据变成人类能读懂的通顺句子。

  • LLM之前的做法:填空模板(你好,[姓名])、简单的拼凑。

  • LLM的做法:像人一样逐字预测,写诗、写代码、写小说。


2.📈 NLP 的进化史:为什么 LLM 是革命?

为了理解 NLP 在大模型里的地位,我们需要看一眼历史:

阶段技术代表特点像什么?
规则时代 (1950s-1990s)语法规则科学家手工写几万条语法规则教电脑。查字典的死板学生。如果不符合语法,电脑就报错。
统计时代 (1990s-2010s)RNN / LSTM让电脑算概率,“你好”后面大概率接“吗”。只会背概率的计算器。能翻译,但句子经常不通顺。
大模型时代 (2018-现在)Transformer (LLM)大力出奇迹。把人类所有书籍都读一遍,理解了语言的深层规律。博学多才的作家。不仅懂语法,还懂逻辑、懂世界知识。

以前的 NLP 是把任务拆开做的:翻译用翻译模型,聊天用聊天模型,分类用分类模型。

现在的 LLM (大模型):一个模型解决所有 NLP 任务。你既可以让它翻译,也可以让它写诗,它通吃。


3.🛠️ NLP 具体包括哪些“手艺”?

当我们使用 ChatGPT 时,其实是在同时调用 NLP 领域的几十种传统能力:

  1. 机器翻译(Machine Translation):中译英。

  2. 文本摘要 (Summarization):帮我总结这篇文章。

  3. 情感分析(Sentiment Analysis):这句话是夸我还是骂我?

  4. 命名实体识别(NER):帮我从这句话里把“人名”、“地名”、“公司名”挑出来。

  5. 问答系统 (QA):根据文档回答问题。

大模型出现之前,这些是分开的独立研究方向;在大模型出现后,它们都变成了 Prompt(提示词)的一个指令


总结

自然语言处理(NLP)就是“教计算机学语文”的科学。

在大语言模型中,NLP 是灵魂。没有 NLP 的理论基础(如 Tokenization, Embedding, Attention),就没有大模型;而大模型的出现,彻底重写了 NLP 这门学科,让它从“人工规则”变成了“智能涌现”。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 1:58:44

Open-AutoGLM手势识别性能飞跃(从卡顿到毫秒响应的底层优化)

第一章:Open-AutoGLM手势识别性能飞跃的背景与意义随着人机交互技术的快速发展,基于视觉的手势识别正逐步成为智能设备交互的核心方式之一。传统手势识别系统受限于模型推理效率与准确率之间的权衡,难以在边缘设备上实现实时、低延迟的响应。…

作者头像 李华
网站建设 2026/4/17 2:04:47

长按触发总失败?Open-AutoGLM底层逻辑深度解读,一文搞定

第一章:长按触发总失败?核心问题定位在移动端开发中,长按操作(Long Press)常用于触发上下文菜单、图片预览或快捷功能,但开发者常遇到“长按无响应”或“误触频繁”的问题。这类现象背后往往涉及事件监听机…

作者头像 李华
网站建设 2026/4/17 19:57:36

C#AI系列(7):从零开始LLM之Tokenizer实现

一、前言: token是什么 LLM只做一个事情,就是吃掉token吐出token,token是LLM(大语言模型)的基本元素。token与LLM的关系,相当于乐高积木与乐高工厂,我的世界方块与我的世界游戏。那么token到底是什么呢&am…

作者头像 李华
网站建设 2026/4/18 2:03:25

Excalidraw与Nuxt.js服务端渲染适配

Excalidraw 与 Nuxt.js 服务端渲染适配:从兼容性挑战到工程化落地 在现代 Web 应用开发中,可视化协作工具的集成需求正迅速增长。无论是技术团队绘制架构图、产品经理快速勾勒原型,还是教育场景中的实时白板演示,轻量级且富有表现…

作者头像 李华
网站建设 2026/4/18 3:31:09

Excalidraw与Docker容器化部署最佳实践

Excalidraw 与 Docker 容器化部署:从零搭建高可用白板系统 在远程协作日益成为常态的今天,如何让分布式团队像在同一间会议室里那样高效沟通?一张“虚拟白板”往往比十页文档更管用。Excalidraw 正是这样一款工具——它不追求精准刻板的线条&…

作者头像 李华
网站建设 2026/4/18 3:31:46

Excalidraw与ArgoCD持续交付集成

Excalidraw 与 ArgoCD 持续交付集成:让 GitOps 更“看得见” 在云原生时代,我们早已习惯用代码定义一切——基础设施即代码、配置即代码、策略即代码。但有一个环节始终滞后:架构设计和流程沟通仍停留在会议白板或零散的 PPT 中。当一个微服…

作者头像 李华