概念简/全称介绍
大模型LM(Large Model)通过大规模数据训练、具备强大算力支撑、拥有庞大参数规模的人工智能模型。它能够处理复杂的任务,并且在学习和推理能力上有显著提升,是当前人工智能领域的研究热点和发展方向之一。
大语言模型LLM(Large Language Model)大模型(Large Model) 的一种具体类型,特指基于海量文本数据训练、以自然语言处理为核心能力的人工智能模型。它是当前自然语言处理领域的前沿技术,具备理解、生成、推理和交互等复杂能力,也是 ChatGPT 等热门应用的底层技术基础。
提示词Prompt是指用户输入的文本指令或问题,其核心作用是引导模型按照特定需求生成响应。简单来说,Prompt 就是你告诉模型 “要做什么”“怎么做” 的语言描述。
prompt工程指南
TokenTokenToken 是大语言模型处理文本的基本单位,可能是单词或标点符号,模型的输入和输出都是按 Token 计算的,一般 Token 越多,成本越高、并且输出速度越慢。不同模型的计费都不太一样。
Token在线计算
蒸馏Distillation通常指的是知识蒸馏(Knowledge Distillation,KD),这是一种模型压缩和优化技术,核心思想是将复杂模型(称为 “教师模型”)学习到的知识迁移到更简单的模型(称为 “学生模型”)中,使学生模型在保持较高性能的同时更轻量、高效。
多模态Multimodality模态分为单模态和多模态,主要区别就是处理的数据类型不同。
单模态只能处理单一数据类型的数据如文本。多模态则可以处理多种类型的数据如文本 + 图片 + 文档。
检索增强生成RAG(Retrieval-Augmented Generation)结合信息检索生成模型的先进技术,广泛应用于自然语言处理(NLP)领域,特别是在问答系统、对话系统和文本生成中。它的核心思想是通过检索相关背景知识来提升生成内容的准确性、相关性和可靠性。
嵌入Embedding是一种将离散对象(如文本、图像、图结构等)转换为连续向量空间中的稠密向量(Dense Vector)的技术。其核心思想是通过数学映射,将高维、稀疏的原始数据转换为低维、稠密的特征表示,使数据的语义信息或结构信息能够在向量空间中被高效计算和建模。
智能体Agent是人工智能领域中的一个核心概念,是指能够感知环境、做出决策并采取行动以实现特定目标的自主实体。
可以简单理解为 会 “思考 + 行动” 的虚拟小助手,它的核心就像 “有脑子、能动手” 的小机器人,只不过不一定有真实身体,可能是软件程序形态。
思维链Chain-of-Thought在处理复杂问题时,模型直接给出答案可能缺乏逻辑性和可解释性。思维链技术通过让模型详细介绍中间步骤和推理过程,使人们能够理解模型是如何得出结论的,让整个推理过程更透明。
ReActReasoning + ActingAI 领域中的一种技术框架,旨在结合推理(Reasoning)和行动(Acting) 的能力,帮助模型更高效地解决复杂任务。它通常用于增强大语言模型(LLM)或智能代理(Agent)在动态环境中的决策能力,尤其在需要多步推理和实时交互的场景中表现突出。
智能体工作流Agentic Workflow通过规划和编排,让智能体自由搭配功能,自动化实现各种复杂的任务。
模型上下文协议MCP(Model Context Protocol)是 Anthropic 发起的一个开源项目,是一种新兴标准,旨在简化 AI 模型与外部系统的交互方式,确保基于上下文的响应并实现与各种应用的无缝集成。
创建 MCP 服务器
向量数据库Vector Database是一种专门用于存储、管理和检索向量数据的数据库系统。简单来说,它就像是一个 “向量图书馆”,能快速找到与某个向量最相似的其他向量,常用于人工智能、机器学习尤其是自然语言处理(NLP)和计算机视觉等领域。
向量是一组数字组成的数组(如 [0.1, 0.5, 0.8]),可以理解为将现实世界的信息(文本、图像、视频等)转化为计算机能理解的 “数字指纹”