累计撰写 11 篇文章
累计创建 4 个分类
累计收到 0 条评论

AI常见概念一览表

概念介绍

概念	简/全称	介绍
大模型	LM（Large Model）	通过大规模数据训练、具备强大算力支撑、拥有庞大参数规模的人工智能模型。它能够处理复杂的任务，并且在学习和推理能力上有显著提升，是当前人工智能领域的研究热点和发展方向之一。
大语言模型	LLM（Large Language Model）	大模型（Large Model）的一种具体类型，特指基于海量文本数据训练、以自然语言处理为核心能力的人工智能模型。它是当前自然语言处理领域的前沿技术，具备理解、生成、推理和交互等复杂能力，也是 ChatGPT 等热门应用的底层技术基础。
提示词	Prompt	是指用户输入的文本指令或问题，其核心作用是引导模型按照特定需求生成响应。简单来说，Prompt 就是你告诉模型 “要做什么”“怎么做” 的语言描述。 prompt工程指南
Token	Token	Token 是大语言模型处理文本的基本单位，可能是单词或标点符号，模型的输入和输出都是按 Token 计算的，一般 Token 越多，成本越高、并且输出速度越慢。不同模型的计费都不太一样。 Token在线计算
蒸馏	Distillation	通常指的是知识蒸馏（Knowledge Distillation，KD），这是一种模型压缩和优化技术，核心思想是将复杂模型（称为 “教师模型”）学习到的知识迁移到更简单的模型（称为 “学生模型”）中，使学生模型在保持较高性能的同时更轻量、高效。
多模态	Multimodality	模态分为单模态和多模态，主要区别就是处理的数据类型不同。单模态只能处理单一数据类型的数据如文本。多模态则可以处理多种类型的数据如文本 + 图片 + 文档。
检索增强生成	RAG（Retrieval-Augmented Generation）	结合信息检索和生成模型的先进技术，广泛应用于自然语言处理（NLP）领域，特别是在问答系统、对话系统和文本生成中。它的核心思想是通过检索相关背景知识来提升生成内容的准确性、相关性和可靠性。
嵌入	Embedding	是一种将离散对象（如文本、图像、图结构等）转换为连续向量空间中的稠密向量（Dense Vector）的技术。其核心思想是通过数学映射，将高维、稀疏的原始数据转换为低维、稠密的特征表示，使数据的语义信息或结构信息能够在向量空间中被高效计算和建模。
智能体	Agent	是人工智能领域中的一个核心概念，是指能够感知环境、做出决策并采取行动以实现特定目标的自主实体。可以简单理解为会 “思考 + 行动” 的虚拟小助手，它的核心就像 “有脑子、能动手” 的小机器人，只不过不一定有真实身体，可能是软件程序形态。
思维链	Chain-of-Thought	在处理复杂问题时，模型直接给出答案可能缺乏逻辑性和可解释性。思维链技术通过让模型详细介绍中间步骤和推理过程，使人们能够理解模型是如何得出结论的，让整个推理过程更透明。
ReAct	Reasoning + Acting	AI 领域中的一种技术框架，旨在结合推理（Reasoning）和行动（Acting）的能力，帮助模型更高效地解决复杂任务。它通常用于增强大语言模型（LLM）或智能代理（Agent）在动态环境中的决策能力，尤其在需要多步推理和实时交互的场景中表现突出。
智能体工作流	Agentic Workflow	通过规划和编排，让智能体自由搭配功能，自动化实现各种复杂的任务。
模型上下文协议	MCP（Model Context Protocol）	是 Anthropic 发起的一个开源项目，是一种新兴标准，旨在简化 AI 模型与外部系统的交互方式，确保基于上下文的响应并实现与各种应用的无缝集成。创建 MCP 服务器
向量数据库	Vector Database	是一种专门用于存储、管理和检索向量数据的数据库系统。简单来说，它就像是一个 “向量图书馆”，能快速找到与某个向量最相似的其他向量，常用于人工智能、机器学习尤其是自然语言处理（NLP）和计算机视觉等领域。向量是一组数字组成的数组（如 `[0.1, 0.5, 0.8]`），可以理解为将现实世界的信息（文本、图像、视频等）转化为计算机能理解的 “数字指纹”。

如果觉得文章对你有用，请随意赞赏

Ai

AI常见概念一览表

http://abingyao.cn/archives/ai-conception-table

作者

阿炳耀

发布于

2025-05-16

更新于

2025-05-16

许可协议

CC BY 4.0

评论

弹