概念 | 简/全称 | 介绍 |
---|---|---|
大模型 | LM(Large Model) | 通过大规模数据训练、具备强大算力支撑、拥有庞大参数规模的人工智能模型。它能够处理复杂的任务,并且在学习和推理能力上有显著提升,是当前人工智能领域的研究热点和发展方向之一。 |
大语言模型 | LLM(Large Language Model) | 大模型(Large Model) 的一种具体类型,特指基于海量文本数据训练、以自然语言处理为核心能力的人工智能模型。它是当前自然语言处理领域的前沿技术,具备理解、生成、推理和交互等复杂能力,也是 ChatGPT 等热门应用的底层技术基础。 |
提示词 | Prompt | 是指用户输入的文本指令或问题,其核心作用是引导模型按照特定需求生成响应。简单来说,Prompt 就是你告诉模型 “要做什么”“怎么做” 的语言描述。 prompt工程指南 |
Token | Token | Token 是大语言模型处理文本的基本单位,可能是单词或标点符号,模型的输入和输出都是按 Token 计算的,一般 Token 越多,成本越高、并且输出速度越慢。不同模型的计费都不太一样。 Token在线计算 |
蒸馏 | Distillation | 通常指的是知识蒸馏(Knowledge Distillation,KD),这是一种模型压缩和优化技术,核心思想是将复杂模型(称为 “教师模型”)学习到的知识迁移到更简单的模型(称为 “学生模型”)中,使学生模型在保持较高性能的同时更轻量、高效。 |
多模态 | Multimodality | 模态分为单模态和多模态,主要区别就是处理的数据类型不同。 单模态只能处理单一数据类型的数据如文本。多模态则可以处理多种类型的数据如文本 + 图片 + 文档。 |
检索增强生成 | RAG(Retrieval-Augmented Generation) | 结合信息检索和生成模型的先进技术,广泛应用于自然语言处理(NLP)领域,特别是在问答系统、对话系统和文本生成中。它的核心思想是通过检索相关背景知识来提升生成内容的准确性、相关性和可靠性。 |
嵌入 | Embedding | 是一种将离散对象(如文本、图像、图结构等)转换为连续向量空间中的稠密向量(Dense Vector)的技术。其核心思想是通过数学映射,将高维、稀疏的原始数据转换为低维、稠密的特征表示,使数据的语义信息或结构信息能够在向量空间中被高效计算和建模。 |
智能体 | Agent | 是人工智能领域中的一个核心概念,是指能够感知环境、做出决策并采取行动以实现特定目标的自主实体。 可以简单理解为 会 “思考 + 行动” 的虚拟小助手,它的核心就像 “有脑子、能动手” 的小机器人,只不过不一定有真实身体,可能是软件程序形态。 |
思维链 | Chain-of-Thought | 在处理复杂问题时,模型直接给出答案可能缺乏逻辑性和可解释性。思维链技术通过让模型详细介绍中间步骤和推理过程,使人们能够理解模型是如何得出结论的,让整个推理过程更透明。 |
ReAct | Reasoning + Acting | AI 领域中的一种技术框架,旨在结合推理(Reasoning)和行动(Acting) 的能力,帮助模型更高效地解决复杂任务。它通常用于增强大语言模型(LLM)或智能代理(Agent)在动态环境中的决策能力,尤其在需要多步推理和实时交互的场景中表现突出。 |
智能体工作流 | Agentic Workflow | 通过规划和编排,让智能体自由搭配功能,自动化实现各种复杂的任务。 |
模型上下文协议 | MCP(Model Context Protocol) | 是 Anthropic 发起的一个开源项目,是一种新兴标准,旨在简化 AI 模型与外部系统的交互方式,确保基于上下文的响应并实现与各种应用的无缝集成。 创建 MCP 服务器 |
向量数据库 | Vector Database | 是一种专门用于存储、管理和检索向量数据的数据库系统。简单来说,它就像是一个 “向量图书馆”,能快速找到与某个向量最相似的其他向量,常用于人工智能、机器学习尤其是自然语言处理(NLP)和计算机视觉等领域。 向量是一组数字组成的数组(如 [0.1, 0.5, 0.8] ),可以理解为将现实世界的信息(文本、图像、视频等)转化为计算机能理解的 “数字指纹”。 |