<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>RAG on Albert Intelligence</title><link>https://blog.hialbert.online/tags/rag/</link><description>Recent content in RAG on Albert Intelligence</description><generator>Hugo -- gohugo.io</generator><language>zh-CN</language><lastBuildDate>Thu, 14 May 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://blog.hialbert.online/tags/rag/index.xml" rel="self" type="application/rss+xml"/><item><title>从模型原理到 Agent 协同 · 我的 AI 技术栈 9 层学习架构</title><link>https://blog.hialbert.online/post/ai-tech-stack-9-layers/</link><pubDate>Thu, 14 May 2026 00:00:00 +0000</pubDate><guid>https://blog.hialbert.online/post/ai-tech-stack-9-layers/</guid><description>&lt;h1 id="从模型原理到-agent-协同--我的-ai-技术栈-9-层学习架构"&gt;从模型原理到 Agent 协同 · 我的 AI 技术栈 9 层学习架构
&lt;/h1&gt;
 &lt;blockquote&gt;
 &lt;p&gt;&lt;strong&gt;核心立场&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;做 AI 工程，不能只会调 API，也不能只懂论文。真正的能力是&lt;strong&gt;从模型原理到 Agent 协同的全栈贯通&lt;/strong&gt;。这是我的 9 层学习架构。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;hr&gt;
&lt;h2 id="总体架构"&gt;总体架构
&lt;/h2&gt;&lt;p&gt;把 AI 技术栈分成 &lt;strong&gt;9 层&lt;/strong&gt;：底层是 Python 工程与模型原理，往上是训练 / 推理 / MaaS / RAG，最顶层是 Agent 平台、IDE 与应用层。每一层都对应一组具体工具和实践产出。&lt;/p&gt;
&lt;pre tabindex="0"&gt;&lt;code&gt;┌────────────────────────────────────────────────────┐
│ L9 AI 应用层 Openclaw · Zeroclaw · Hermes │
├────────────────────────────────────────────────────┤
│ L8 AI IDE Claude Code · Antigravity │
├────────────────────────────────────────────────────┤
│ L7 Agent 平台 n8n · Dify · LangChain · AWS │
├────────────────────────────────────────────────────┤
│ L6 RAG 技术 LanceDB · 向量检索 · 树结构索引 │
├──────────────────────────┬─────────────────────────┤
│ L5a 推理平台 │ L5b MaaS 平台 │
│ vLLM · OLLama · LMStudio│ 百炼 · 华为 · 火山 · Gemini│
├──────────────────────────┴─────────────────────────┤
│ L4 模型训练 MiniMind · Lora · GPRO · ModelArts│
├────────────────────────────────────────────────────┤
│ L3 模型原理 Transformer · RLHF · Agent 原理 │
├────────────────────────────────────────────────────┤
│ L2 Python 工程 语法 · pandas · PyTorch │
├────────────────────────────────────────────────────┤
│ L1 操作系统/容器/云 Linux · Docker · 华为云·AWS │
└────────────────────────────────────────────────────┘
 ▲
 │
 地基越深，上层能盖越高
&lt;/code&gt;&lt;/pre&gt;
 &lt;blockquote&gt;
 &lt;p&gt;&lt;strong&gt;设计思路&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;上层&amp;quot;应用 / IDE / Agent 平台&amp;quot;是看得见的产出；中层&amp;quot;RAG / 推理 / MaaS / 训练&amp;quot;是核心能力；底层&amp;quot;模型原理 / Python&amp;quot;是地基。&lt;strong&gt;地基决定上层能盖多高。&lt;/strong&gt;&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;hr&gt;
&lt;h2 id="01--ai-应用层--4-个-agent-系统"&gt;§01 · AI 应用层 — 4 个 Agent 系统
&lt;/h2&gt;&lt;pre tabindex="0"&gt;&lt;code&gt; ┌──────────────────┐
 │ AI 应用层 │
 └─────────┬────────┘
 │
 ┌───────────┬────────┴────────┬────────────┐
 ▼ ▼ ▼ ▼
 ┌────────┐ ┌──────────┐ ┌────────────┐ ┌──────────┐
 │Openclaw│ │ Zeroclaw │ │ Hermes │ │ Generic │
 │ ★ 核心 │ │ 轻量 │ │ Agent │ │ Agent │
 └────┬───┘ └──────────┘ └─────┬──────┘ └────┬─────┘
 │ │ │
 ├─ 3 套环境部署 │ │
 │ Win / WSL / 华为云 │ │
 ├─ 多 Agent 协同 │ │
 │ Clawteam / Taskteam │ │
 ├─ A2A 协议 · Skills 开发 │ │
 ├─ 记忆插件 │ │
 │ memory-lancedb-pro │ │
 └─ Vibe Coding │ │
 → AIF-C01 1.0 │ │
 │ │
 ▼ ▼
 安全检查/自我进化 ACP 协议
 任务管理 对接 Obsidian
&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;&lt;strong&gt;Openclaw&lt;/strong&gt; 是我投入最深的 Agent 系统：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;部署环境&lt;/strong&gt;：本地 Windows · WSL Ubuntu Docker · 华为云开发者空间 Euler OS&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Channel 集成&lt;/strong&gt;：Telegram / WeChat / 飞书&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;高阶能力&lt;/strong&gt;：记忆插件 &lt;code&gt;memory-lancedb-pro&lt;/code&gt;、多 Agent 会话隔离、A2A 协议、Google 无头浏览器、Skills 开发管理、Secrets 安全加固&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;任务协同&lt;/strong&gt;：Clawteam 多任务管理 + Taskteam 主 / 子 Agent 协同&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;产出&lt;/strong&gt;：基于 Vibe Coding 完成 &lt;a class="link" href="https://hialberto.github.io/aws-aif-c01-study/index.html?t=1" target="_blank" rel="noopener"
 &gt;AWS-AIF-C01 考试应用 1.0&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;其余三个 Agent 系统：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;Zeroclaw&lt;/strong&gt;：WSL Docker + 华为云双环境验证&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Hermes Agent&lt;/strong&gt;：本地适配、安全检查、自我进化、任务管理&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Generic Agent&lt;/strong&gt;：通过 Claude Code 扩展 ACP 协议，对接 Obsidian Agent Client&lt;/li&gt;
&lt;/ul&gt;
&lt;hr&gt;
&lt;h2 id="02--ai-ide-工具链"&gt;§02 · AI IDE 工具链
&lt;/h2&gt;&lt;p&gt;7 个开发工具构成的多模工作流，主力是 Claude Code，辅以 Antigravity / OpenCode 进行差异化测试。&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;工具&lt;/th&gt;
 &lt;th&gt;角色&lt;/th&gt;
 &lt;th&gt;关键产出&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;Claude Code&lt;/strong&gt; ★&lt;/td&gt;
 &lt;td&gt;主力 IDE · Max 会员&lt;/td&gt;
 &lt;td&gt;~3 万行 &lt;a class="link" href="https://ai.hialbert.online" target="_blank" rel="noopener"
 &gt;主动学习 Wiki&lt;/a&gt; · Superpowers + GSD + Playwright&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;Antigravity&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;Vibe Coding 验证&lt;/td&gt;
 &lt;td&gt;AIF-C01 应用 2.0 · 前后端分离 · 华为云部署&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;OpenCode&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;Claude Code 平替&lt;/td&gt;
 &lt;td&gt;Oh My OpenCode + Superpowers + MiniMax AI Skills&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;Claw Code&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;ClaudeCode 反编译版&lt;/td&gt;
 &lt;td&gt;源码级研究&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;Qwen Code&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;阿里系测试&lt;/td&gt;
 &lt;td&gt;国产 IDE 对比&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;VSCode&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;云端虚机管理&lt;/td&gt;
 &lt;td&gt;远程开发 / 调试&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;Qoder&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;文档与部署&lt;/td&gt;
 &lt;td&gt;开发文档辅助工具&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;

 &lt;blockquote&gt;
 &lt;p&gt;&lt;strong&gt;多 IDE 策略&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;不是工具越多越好，而是&lt;strong&gt;用差异化 IDE 验证同一套方法论&lt;/strong&gt;。Claude Code 是主力，Antigravity 用于验证 Vibe Coding 在前后端分离架构上的可行性。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;hr&gt;
&lt;h2 id="03--ai-agent-平台--hub-矩阵"&gt;§03 · AI Agent 平台 — Hub 矩阵
&lt;/h2&gt;&lt;p&gt;6 个 Agent 平台覆盖&lt;strong&gt;开源工作流 → 云原生托管&lt;/strong&gt;全谱系。&lt;/p&gt;
&lt;pre tabindex="0"&gt;&lt;code&gt; ┌──────────────────┐
 │ Agent 平台矩阵 │
 └────────┬─────────┘
 │
 ┌──────────┬────────────┼────────────┬──────────┐
 ▼ ▼ ▼ ▼ ▼
 ┌───────┐ ┌──────┐ ┌─────────┐ ┌─────────┐ ┌──────────┐
 │ n8n │ │ Dify │ │ Skyloop │ │ Hello │ │ AWS │
 │ 本地 │ │华为云│ │ 土耳其 │ │ Agent │ │Agentcore │
 └───┬───┘ └──┬───┘ └────┬────┘ └─────────┘ └──────────┘
 │ │ │
 └────┬────┘ │
 ▼ ▼
 行业调研日报 多行业 Agent
 (合作伙伴演示)

 + LangChain &amp;amp; LangGraph (编程框架)
&lt;/code&gt;&lt;/pre&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;平台&lt;/th&gt;
 &lt;th&gt;部署位置&lt;/th&gt;
 &lt;th&gt;主要场景&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;n8n&lt;/td&gt;
 &lt;td&gt;本地电脑&lt;/td&gt;
 &lt;td&gt;Agent 节点式编排学习 · 行业调研日报系统&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Dify&lt;/td&gt;
 &lt;td&gt;华为云 Euler Docker&lt;/td&gt;
 &lt;td&gt;Fork GitHub Dify · 行业调研日报&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Skyloop&lt;/td&gt;
 &lt;td&gt;土耳其本地服务器&lt;/td&gt;
 &lt;td&gt;土耳其合作伙伴的多行业 Agent 演示&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;HelloAgent&lt;/td&gt;
 &lt;td&gt;本地部署&lt;/td&gt;
 &lt;td&gt;赛博社区游戏&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;LangChain &amp;amp; LangGraph&lt;/td&gt;
 &lt;td&gt;通用框架&lt;/td&gt;
 &lt;td&gt;多步任务建模&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;AWS Agentcore&lt;/td&gt;
 &lt;td&gt;AWS 云&lt;/td&gt;
 &lt;td&gt;云原生 Agent · 与 AIF-C01 协同&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;hr&gt;
&lt;h2 id="04--rag-技术-pipeline"&gt;§04 · RAG 技术 Pipeline
&lt;/h2&gt;&lt;p&gt;向量化检索的 4 步标准流程，已在 4 个项目中实践。&lt;/p&gt;
&lt;pre tabindex="0"&gt;&lt;code&gt; ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐
 │ 01 │ │ 02 │ │ 03 │ │ 04 │
 │ 原始数据 │───►│ 向量化 │───►│ LanceDB │───►│ 检索+生成│
 │ INGEST │ │ EMBED │ │ STORE │ │ RETRIEVE │
 └──────────┘ └──────────┘ └──────────┘ └──────────┘
 │ │ │ │
 文档 / 多模态 Qwen Embedding Agentic RAG RAG / LLM 增强
 多模态支持
&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;&lt;strong&gt;4 个 RAG 实践项目&lt;/strong&gt;：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;LanceDB 集成&lt;/strong&gt; —— 部署在 Openclaw 上的 Agentic RAG，向量数据库 + 多模态数据支持，对比研究 LanceDB-Pro 与 QMD 两种记忆管理方式&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;n8n 个人知识库&lt;/strong&gt; —— 基于 RAG 流程编排的私有知识检索系统&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Interview-Guild&lt;/strong&gt; —— Fork GitHub 项目，构建面试问题检索与管理应用&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;PageIndex 对比&lt;/strong&gt; —— Fork 项目，&lt;strong&gt;传统 RAG vs 树结构人类索引方式&lt;/strong&gt;的方法论对比&lt;/li&gt;
&lt;/ol&gt;
&lt;hr&gt;
&lt;h2 id="05--推理-vs-maas-双轨"&gt;§05 · 推理 vs MaaS 双轨
&lt;/h2&gt;&lt;p&gt;&lt;strong&gt;自托管推理&lt;/strong&gt;与&lt;strong&gt;云端 MaaS&lt;/strong&gt; 双轨实践 —— 任何严肃的 AI 工程都需要在两条路径都跑通。&lt;/p&gt;
&lt;pre tabindex="0"&gt;&lt;code&gt; ┌───── 自托管推理 ──────┐ ┌────── MaaS 云服务 ──────┐
 │ │ │ │
 │ vLLM 集群部署 │ │ 阿里百炼 qwen-max │
 │ PageAttn │ │ qwen3.6+ │
 │ KV 量化 │ │ Embedding │
 │ │ │ │
 │ OLLama 单机小模型 │ ◄───► │ 华为 MA Studio │
 │ │ │ │
 │ LMStudio 本地 │ │ 火山 字节推理 │
 │ Gemma 1B │ │ │
 │ │ │ Gemini Google │
 │ NanoLLM + MiniSGlang│ │ 多模态 API │
 └───────────────────────┘ └──────────────────────────┘
 适合掌控/隐私/成本 适合快速接入/多模态
&lt;/code&gt;&lt;/pre&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;维度&lt;/th&gt;
 &lt;th&gt;自托管推理&lt;/th&gt;
 &lt;th&gt;MaaS 平台&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;代表&lt;/td&gt;
 &lt;td&gt;vLLM / OLLama / LMStudio&lt;/td&gt;
 &lt;td&gt;阿里百炼 / 华为 MA / 火山 / Gemini&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;适用&lt;/td&gt;
 &lt;td&gt;大模型集群 / 单机本地&lt;/td&gt;
 &lt;td&gt;快速接入 / 多模态&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;关键技术&lt;/td&gt;
 &lt;td&gt;PageAttention · KV Cache 量化&lt;/td&gt;
 &lt;td&gt;API · Embedding · 多模态&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;hr&gt;
&lt;h2 id="06--模型训练-4-阶段链路"&gt;§06 · 模型训练 4 阶段链路
&lt;/h2&gt;&lt;p&gt;从预训练到强化学习的完整链路实践：&lt;/p&gt;
&lt;pre tabindex="0"&gt;&lt;code&gt;┌────────────┐ ┌────────────┐ ┌────────────┐ ┌────────────┐
│ STAGE 01 │ │ STAGE 02 │ │ STAGE 03 │ │ STAGE 04 │
│ 预训练 │──►│ SFT 微调 │──►│ Lora 微调 │──►│ 强化学习 │
│ │ │ │ │ │ │ │
│ Happy-LLM │ │ 指令跟随 │ │ PEFT 适配 │ │ GPRO/RLHF │
│ 215M │ │ 对话能力 │ │ 资源受限 │ │ RLFromScratch│
└────────────┘ └────────────┘ └────────────┘ └────────────┘
 智星云 训练平台 ──────────────────────────► ModelArts
 (YOLO v6 + HCCDP-AI)
&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;&lt;strong&gt;两条互补的训练实践线路&lt;/strong&gt;：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;MiniMind&lt;/strong&gt; —— 大模型训练完整链路实践，从零理解预训练到对话&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;华为云 ModelArts&lt;/strong&gt; —— YOLO v6 模型训练部署 Demo，通过 &lt;strong&gt;HCCDP-AI 认证&lt;/strong&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;strong&gt;训练平台&lt;/strong&gt;：模型智星云完成 Happy-LLM Chapter5 Base 215M 预训练 + SFT 微调 + Lora 微调。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;强化学习&lt;/strong&gt;：基于 &lt;code&gt;RLFromScratch&lt;/code&gt; 从零实现完整 &lt;strong&gt;GPRO 算法&lt;/strong&gt;。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="07--模型原理--理论地基"&gt;§07 · 模型原理 — 理论地基
&lt;/h2&gt;&lt;pre tabindex="0"&gt;&lt;code&gt; ┌─────────────────┐
 │ 理论基础 │
 └────────┬────────┘
 │
 ┌──────────┬────────────┼────────────┬─────────┐
 ▼ ▼ ▼ ▼ ▼
Transformer HappyLLM Agent 原理 强化学习 Python
 │ │ │ 基础
 ├ Embedding + PE ├ 5 类 Agent ├ PPO
 ├ Multi-Head Attn ├ 任务分解 ├ DPO
 ├ Add &amp;amp; Norm ├ 协同机制 └ GPRO
 ├ Feed Forward ├ 记忆管理
 ├ Linear + Softmax └ 李飞飞 paper
 └ Attention is All
 You Need 精读
&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;&lt;strong&gt;Transformer 全链路&lt;/strong&gt;：Embedding + PE → MHA → Add &amp;amp; Norm → FFN → Linear + Softmax，配合 &lt;em&gt;Attention is All You Need&lt;/em&gt; 论文精读。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;Agent 原理&lt;/strong&gt;：李飞飞团队 AI Agent 论文 —— 5 类 Agent 类型、任务分解与协同、记忆管理机制。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;强化学习&lt;/strong&gt;：RLHF 原理 · PPO / DPO 对比 · GPRO 自实现。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="08--能力分布雷达"&gt;§08 · 能力分布雷达
&lt;/h2&gt;&lt;p&gt;按 8 维度自评：&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;技术领域&lt;/th&gt;
 &lt;th&gt;掌握度&lt;/th&gt;
 &lt;th&gt;进度条&lt;/th&gt;
 &lt;th&gt;说明&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;AI IDE (Claude Code)&lt;/td&gt;
 &lt;td&gt;95&lt;/td&gt;
 &lt;td&gt;&lt;code&gt;▓▓▓▓▓▓▓▓▓░&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;主力，Max 会员，3 万行项目产出&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;AI 应用层 (Openclaw)&lt;/td&gt;
 &lt;td&gt;90&lt;/td&gt;
 &lt;td&gt;&lt;code&gt;▓▓▓▓▓▓▓▓▓░&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;多环境部署 + 多 Agent 协同&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;RAG 技术&lt;/td&gt;
 &lt;td&gt;85&lt;/td&gt;
 &lt;td&gt;&lt;code&gt;▓▓▓▓▓▓▓▓░░&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;4 个项目落地&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Agent 平台&lt;/td&gt;
 &lt;td&gt;80&lt;/td&gt;
 &lt;td&gt;&lt;code&gt;▓▓▓▓▓▓▓▓░░&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;n8n / Dify / LangChain 多平台&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;推理 / MaaS&lt;/td&gt;
 &lt;td&gt;75&lt;/td&gt;
 &lt;td&gt;&lt;code&gt;▓▓▓▓▓▓▓░░░&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;多平台跑通&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;模型原理&lt;/td&gt;
 &lt;td&gt;75&lt;/td&gt;
 &lt;td&gt;&lt;code&gt;▓▓▓▓▓▓▓░░░&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;Transformer + RLHF&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;模型训练&lt;/td&gt;
 &lt;td&gt;70&lt;/td&gt;
 &lt;td&gt;&lt;code&gt;▓▓▓▓▓▓▓░░░&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;MiniMind + GPRO + HCCDP-AI&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Python 工程&lt;/td&gt;
 &lt;td&gt;60&lt;/td&gt;
 &lt;td&gt;&lt;code&gt;▓▓▓▓▓▓░░░░&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;语法 ✓ · pandas/PyTorch 进行中&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;hr&gt;
&lt;h2 id="09--代表项目已上线"&gt;§09 · 代表项目（已上线）
&lt;/h2&gt;&lt;h3 id="主动学习平台--llm-wiki--agentic-ai"&gt;主动学习平台 · LLM Wiki + Agentic AI
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;链接&lt;/strong&gt;：&lt;a class="link" href="https://ai.hialbert.online" target="_blank" rel="noopener"
 &gt;ai.hialbert.online&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;规模&lt;/strong&gt;：~3 万行代码&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;栈&lt;/strong&gt;：React + FastAPI + SQLite + RAG + 力导向知识图谱&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;方法论&lt;/strong&gt;：Superpowers + GSD + Playwright&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;特色&lt;/strong&gt;：Agentic AI 原生应用设计 · PWA 移动端 · 主动学习引擎&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="aws-aif-c01-考试应用-10"&gt;AWS-AIF-C01 考试应用 1.0
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;链接&lt;/strong&gt;：&lt;a class="link" href="https://hialberto.github.io/aws-aif-c01-study/index.html?t=1" target="_blank" rel="noopener"
 &gt;hialberto.github.io/aws-aif-c01-study&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;栈&lt;/strong&gt;：纯前端 HTML + CSS + JS&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;方法&lt;/strong&gt;：Openclaw 的 Vibe Coding 完成&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="aws-aif-c01-考试应用-20"&gt;AWS-AIF-C01 考试应用 2.0
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;栈&lt;/strong&gt;：前后端分离 · Node.js 登录验证 + SQLite&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;部署&lt;/strong&gt;：华为云开发者空间 Euler 虚机 + Coplar 免费域名&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;方法&lt;/strong&gt;：Antigravity Vibe Coding 完成&lt;/li&gt;
&lt;/ul&gt;
&lt;hr&gt;
&lt;h2 id="学习路径建议"&gt;学习路径建议
&lt;/h2&gt;
 &lt;blockquote&gt;
 &lt;p&gt;&lt;strong&gt;给同样在学 AI 工程的朋友&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;不要从顶层 API 调用开始学&lt;/strong&gt;。先打地基（Python + Transformer 原理），再往上一层层叠加（训练 → 推理 → RAG → Agent → 应用）。&lt;strong&gt;地基越深，上层能盖得越高。&lt;/strong&gt;&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;p&gt;具体路径：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;理论地基&lt;/strong&gt; —— Transformer 论文精读 + HappyLLM 全链路&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;训练实践&lt;/strong&gt; —— MiniMind 完整链路 + Lora 微调&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;推理部署&lt;/strong&gt; —— OLLama 单机 → vLLM 集群&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;RAG 落地&lt;/strong&gt; —— LanceDB + 至少一个 Fork 项目复现&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Agent 平台&lt;/strong&gt; —— n8n 节点编排 → LangGraph 编程&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;应用层&lt;/strong&gt; —— 选一个 Agent 框架（Openclaw / Dify）深耕&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;IDE 加成&lt;/strong&gt; —— Claude Code Vibe Coding 加速所有上层产出&lt;/li&gt;
&lt;/ol&gt;
&lt;hr&gt;
&lt;h2 id="延伸阅读"&gt;延伸阅读
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;Claude Code 4 档默认架构&lt;/strong&gt; —— 50 / 200 / 1000 / 1000+ 并发对应的渐进式栈选择&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;GenericAgent vs O-easy&lt;/strong&gt; —— 3000 行代码的两种用法对比&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;企业生产环境部署 Agentic RAG 完整指南&lt;/strong&gt;&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Openclaw 长期记忆插件 memory-lancedb-pro&lt;/strong&gt;&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;给 Hermes Agent 装上 Open WebUI&lt;/strong&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;hr&gt;
&lt;h2 id="核心关键词"&gt;核心关键词
&lt;/h2&gt;&lt;p&gt;&lt;code&gt;AI 技术栈&lt;/code&gt; &lt;code&gt;LLM 工程&lt;/code&gt; &lt;code&gt;Agent 架构&lt;/code&gt; &lt;code&gt;RAG&lt;/code&gt; &lt;code&gt;Transformer&lt;/code&gt; &lt;code&gt;RLHF&lt;/code&gt; &lt;code&gt;GPRO&lt;/code&gt; &lt;code&gt;Openclaw&lt;/code&gt; &lt;code&gt;Claude Code&lt;/code&gt; &lt;code&gt;Vibe Coding&lt;/code&gt; &lt;code&gt;LanceDB&lt;/code&gt; &lt;code&gt;vLLM&lt;/code&gt; &lt;code&gt;MiniMind&lt;/code&gt; &lt;code&gt;ModelArts&lt;/code&gt; &lt;code&gt;Lora 微调&lt;/code&gt;&lt;/p&gt;
&lt;hr&gt;

 &lt;blockquote&gt;
 &lt;p&gt;&lt;strong&gt;写在最后&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;这张架构图不是终点，而是当前学习的快照。每加一层能力，地基就要相应加深一寸。&lt;strong&gt;做 AI 系统架构师，靠的不是会用什么工具，而是看清每层之间如何咬合。&lt;/strong&gt;&lt;/p&gt;

 &lt;/blockquote&gt;</description></item><item><title>深度解析：生产级 Agentic RAG 系统架构与企业级实践</title><link>https://blog.hialbert.online/post/%E4%BC%81%E4%B8%9A%E7%94%9F%E4%BA%A7%E7%8E%AF%E5%A2%83%E9%83%A8%E7%BD%B2-agentic-rag-full-guide/</link><pubDate>Tue, 31 Mar 2026 00:00:00 +0000</pubDate><guid>https://blog.hialbert.online/post/%E4%BC%81%E4%B8%9A%E7%94%9F%E4%BA%A7%E7%8E%AF%E5%A2%83%E9%83%A8%E7%BD%B2-agentic-rag-full-guide/</guid><description>&lt;h1 id="深度解析生产级-agentic-rag-系统架构与企业级实践"&gt;深度解析：生产级 Agentic RAG 系统架构与企业级实践
&lt;/h1&gt;&lt;p&gt;本项目不仅仅是一个 RAG 示例，它更是一套完整的&lt;strong&gt;企业知识引擎演进方案&lt;/strong&gt;。它展示了如何从一个脆弱的检索原型一步步进化为具备“自修复”能力的工业级系统。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="-7-周功能演进路线图从原型到工业级"&gt;📅 7 周功能演进路线图：从原型到工业级
&lt;/h2&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th style="text-align: left"&gt;周次&lt;/th&gt;
 &lt;th style="text-align: left"&gt;核心增加功能&lt;/th&gt;
 &lt;th style="text-align: left"&gt;设计初衷 (Why)&lt;/th&gt;
 &lt;th style="text-align: left"&gt;企业应用价值 (Enterprise Value)&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td style="text-align: left"&gt;&lt;strong&gt;Week 1&lt;/strong&gt;&lt;/td&gt;
 &lt;td style="text-align: left"&gt;&lt;strong&gt;生产级基建&lt;/strong&gt;: Docker, FastAPI, Postgres, OpenSearch, Airflow&lt;/td&gt;
 &lt;td style="text-align: left"&gt;企业版 RAG 需要超越 Notebook 脚本，必须具备服务化、数据库持久化和多组件隔离能力。&lt;/td&gt;
 &lt;td style="text-align: left"&gt;&lt;strong&gt;稳定性与可扩展性&lt;/strong&gt;: 为高并发和大规模数据存储打下标准工业底座，支持水平扩展。&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td style="text-align: left"&gt;&lt;strong&gt;Week 2&lt;/strong&gt;&lt;/td&gt;
 &lt;td style="text-align: left"&gt;&lt;strong&gt;自动化数据管道&lt;/strong&gt;: arXiv API + &lt;strong&gt;Docling&lt;/strong&gt; PDF 解析&lt;/td&gt;
 &lt;td style="text-align: left"&gt;依靠手工上传无法建立实时知识库。Docling 能精准解析 PDF 结构和表格，解决“数据垃圾进、垃圾出”的问题。&lt;/td&gt;
 &lt;td style="text-align: left"&gt;&lt;strong&gt;数据质量与自动化&lt;/strong&gt;: 极大提升论文/研报的解析精度，自动同步确保 AI 总是掌握最新情报。&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td style="text-align: left"&gt;&lt;strong&gt;Week 3&lt;/strong&gt;&lt;/td&gt;
 &lt;td style="text-align: left"&gt;&lt;strong&gt;精准检索基准 (BM25)&lt;/strong&gt;&lt;/td&gt;
 &lt;td style="text-align: left"&gt;向量搜索在匹配专业术语（如产品型号、特定缩写）时常失效。BM25 提供精确的语义对齐。&lt;/td&gt;
 &lt;td style="text-align: left"&gt;&lt;strong&gt;高信任度检索&lt;/strong&gt;: 确保用户搜什么得什么，在精确术语检索场景下不会出现“风马牛不相及”。&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td style="text-align: left"&gt;&lt;strong&gt;Week 4&lt;/strong&gt;&lt;/td&gt;
 &lt;td style="text-align: left"&gt;&lt;strong&gt;混合搜索与智能切分&lt;/strong&gt;&lt;/td&gt;
 &lt;td style="text-align: left"&gt;结合语义理解与关键词匹配 (RRF 融合)。语义切分 (Semantic Chunking) 确保知识片段上下文完整。&lt;/td&gt;
 &lt;td style="text-align: left"&gt;&lt;strong&gt;召回率最大化&lt;/strong&gt;: 解决由于召回不全导致的 LLM 幻觉，确保相关背景知识被完整送入生成阶段。&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td style="text-align: left"&gt;&lt;strong&gt;Week 5&lt;/strong&gt;&lt;/td&gt;
 &lt;td style="text-align: left"&gt;&lt;strong&gt;本地化 LLM 与流式响应&lt;/strong&gt;&lt;/td&gt;
 &lt;td style="text-align: left"&gt;集成 &lt;strong&gt;Ollama&lt;/strong&gt; (llama3.2) 及 Gradio。支持流式 API 提升感知速度。&lt;/td&gt;
 &lt;td style="text-align: left"&gt;&lt;strong&gt;安全性与成本控制&lt;/strong&gt;: 解决企业私有数据不出域的问题，大幅降低对外 API 订阅费用。&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td style="text-align: left"&gt;&lt;strong&gt;Week 6&lt;/strong&gt;&lt;/td&gt;
 &lt;td style="text-align: left"&gt;&lt;strong&gt;可观测性与性能优化&lt;/strong&gt;&lt;/td&gt;
 &lt;td style="text-align: left"&gt;&lt;strong&gt;Langfuse&lt;/strong&gt; 全链路追踪 + &lt;strong&gt;Redis&lt;/strong&gt; 语义缓存。&lt;/td&gt;
 &lt;td style="text-align: left"&gt;&lt;strong&gt;审计、调试与降本&lt;/strong&gt;: 记录 Agent 每一笔推理过程用于合规审计；利用缓存节省 80%+ 的重复计算开销。&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td style="text-align: left"&gt;&lt;strong&gt;Week 7&lt;/strong&gt;&lt;/td&gt;
 &lt;td style="text-align: left"&gt;&lt;strong&gt;智能回路 (Agentic RAG)&lt;/strong&gt;&lt;/td&gt;
 &lt;td style="text-align: left"&gt;&lt;strong&gt;LangGraph&lt;/strong&gt; 回路决策、Query 改写、安全护栏 (Guardrails)&lt;/td&gt;
 &lt;td style="text-align: left"&gt;赋予 AI “多想一步”的能力。如果第一次搜不到，AI 会自动改写关键词重搜。&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;hr&gt;
&lt;h2 id="-最终形态修正型智能体检索-crag"&gt;🏗️ 最终形态：修正型智能体检索 (CRAG)
&lt;/h2&gt;&lt;p&gt;该系统的最终形态是一个基于 &lt;strong&gt;LangGraph&lt;/strong&gt; 的“自修正状态机”。它不再盲目相信检索结果，而是引入了&lt;strong&gt;批判性思维&lt;/strong&gt;。&lt;/p&gt;
&lt;h3 id="核心工作流逻辑"&gt;核心工作流逻辑：
&lt;/h3&gt;&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;输入防护 (Guardrails)&lt;/strong&gt;：先判断问题是否在业务范围内，拦截非法或不相关请求。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;混合检索 (Hybrid Execution)&lt;/strong&gt;：同时并发执行关键词和语义搜索，通过 RRF 算法融合。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;文档评分 (Document Grading)&lt;/strong&gt;：有一个专门的 Agent 评估检索出的片段是否真的能回答问题。
&lt;ul&gt;
&lt;li&gt;✅ &lt;strong&gt;相关&lt;/strong&gt;：直接进入生成环节。&lt;/li&gt;
&lt;li&gt;⚠️ &lt;strong&gt;一般/不相关&lt;/strong&gt;：触发 &lt;strong&gt;Query Rewriter&lt;/strong&gt;。&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;查询改写 (Self-Correction)&lt;/strong&gt;：AI 会反思“为什么搜不到？”，然后修改搜索关键词重新检索，直到找到满意答案。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;生成与幻觉检查 (Hallucination Check)&lt;/strong&gt;：生成内容后反向校验是否基于原文，杜绝胡说八道。&lt;/li&gt;
&lt;/ol&gt;
&lt;hr&gt;
&lt;p&gt;架构如下：
!Pasted image 20260401002240.png&lt;/p&gt;
&lt;p&gt;LangGraph的工作流如下：
!Pasted image 20260401002502.png&lt;/p&gt;
&lt;h2 id="-它满足了企业应用的哪些核心需求"&gt;🏢 它满足了企业应用的哪些核心需求？
&lt;/h2&gt;&lt;h3 id="1-极致的生成质量-reliability"&gt;1. 极致的生成质量 (Reliability)
&lt;/h3&gt;&lt;p&gt;通过 &lt;strong&gt;LangGraph&lt;/strong&gt; 建立的闭环反馈，解决了传统 RAG “一锤子买卖”的低成功率问题。AI 在回答前会自我纠错，极大地降低了企业级应用最恐惧的“严重幻觉”。&lt;/p&gt;
&lt;h3 id="2-全生命周期的可观测性-auditability"&gt;2. 全生命周期的可观测性 (Auditability)
&lt;/h3&gt;&lt;p&gt;企业内部使用 AI 必须可追溯。集成 &lt;strong&gt;Langfuse&lt;/strong&gt; 后，管理者可以看到 AI 为什么改写了查询、引用了哪篇文档、推理逻辑在哪里出了叉子，满足合规要求。&lt;/p&gt;
&lt;h3 id="3-数据主权与隐私-privacysecurity"&gt;3. 数据主权与隐私 (Privacy/Security)
&lt;/h3&gt;&lt;p&gt;支持通过 &lt;strong&gt;Ollama&lt;/strong&gt; 本地部署模型。对于涉及内部研报、未公开财报等敏感信息，企业可以实现完全离线的 RAG 方案。&lt;/p&gt;
&lt;h3 id="4-低成本高性能-efficiency"&gt;4. 低成本、高性能 (Efficiency)
&lt;/h3&gt;&lt;p&gt;&lt;strong&gt;Redis 语义缓存&lt;/strong&gt; 可以让 90% 的常见问题（如“公司报销制度”）在毫秒级返回，且不消耗任何 LLM Token 费用。&lt;strong&gt;Airflow&lt;/strong&gt; 则保证了知识库的自动“生长”，无需专人维护。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="-总结建议"&gt;🎯 总结建议
&lt;/h2&gt;&lt;p&gt;如果你在为企业寻找一套可接单、可落地的 AI 方案，该项目提供的 &lt;strong&gt;&amp;ldquo;数据管道 + 混合检索 + 智能体修正 + 全链路监控&amp;rdquo;&lt;/strong&gt; 组合正是目前业界最推崇的 RAG 终极形态。&lt;/p&gt;
&lt;hr&gt;</description></item></channel></rss>