RAG on Albert Intelligence

从模型原理到 Agent 协同 · 我的 AI 技术栈 9 层学习架构

Thu, 14 May 2026 00:00:00 +0000

从模型原理到 Agent 协同 · 我的 AI 技术栈 9 层学习架构

核心立场

做 AI 工程，不能只会调 API，也不能只懂论文。真正的能力是从模型原理到 Agent 协同的全栈贯通。这是我的 9 层学习架构。

总体架构

把 AI 技术栈分成 9 层：底层是 Python 工程与模型原理，往上是训练 / 推理 / MaaS / RAG，最顶层是 Agent 平台、IDE 与应用层。每一层都对应一组具体工具和实践产出。

┌────────────────────────────────────────────────────┐
│ L9 AI 应用层 Openclaw · Zeroclaw · Hermes │
├────────────────────────────────────────────────────┤
│ L8 AI IDE Claude Code · Antigravity │
├────────────────────────────────────────────────────┤
│ L7 Agent 平台 n8n · Dify · LangChain · AWS │
├────────────────────────────────────────────────────┤
│ L6 RAG 技术 LanceDB · 向量检索 · 树结构索引 │
├──────────────────────────┬─────────────────────────┤
│ L5a 推理平台 │ L5b MaaS 平台 │
│ vLLM · OLLama · LMStudio│ 百炼 · 华为 · 火山 · Gemini│
├──────────────────────────┴─────────────────────────┤
│ L4 模型训练 MiniMind · Lora · GPRO · ModelArts│
├────────────────────────────────────────────────────┤
│ L3 模型原理 Transformer · RLHF · Agent 原理 │
├────────────────────────────────────────────────────┤
│ L2 Python 工程 语法 · pandas · PyTorch │
├────────────────────────────────────────────────────┤
│ L1 操作系统/容器/云 Linux · Docker · 华为云·AWS │
└────────────────────────────────────────────────────┘
 ▲
 │
 地基越深，上层能盖越高

设计思路

上层"应用 / IDE / Agent 平台"是看得见的产出；中层"RAG / 推理 / MaaS / 训练"是核心能力；底层"模型原理 / Python"是地基。地基决定上层能盖多高。

§01 · AI 应用层 — 4 个 Agent 系统

 ┌──────────────────┐
 │ AI 应用层 │
 └─────────┬────────┘
 │
 ┌───────────┬────────┴────────┬────────────┐
 ▼ ▼ ▼ ▼
 ┌────────┐ ┌──────────┐ ┌────────────┐ ┌──────────┐
 │Openclaw│ │ Zeroclaw │ │ Hermes │ │ Generic │
 │ ★ 核心 │ │ 轻量 │ │ Agent │ │ Agent │
 └────┬───┘ └──────────┘ └─────┬──────┘ └────┬─────┘
 │ │ │
 ├─ 3 套环境部署 │ │
 │ Win / WSL / 华为云 │ │
 ├─ 多 Agent 协同 │ │
 │ Clawteam / Taskteam │ │
 ├─ A2A 协议 · Skills 开发 │ │
 ├─ 记忆插件 │ │
 │ memory-lancedb-pro │ │
 └─ Vibe Coding │ │
 → AIF-C01 1.0 │ │
 │ │
 ▼ ▼
 安全检查/自我进化 ACP 协议
 任务管理 对接 Obsidian

Openclaw 是我投入最深的 Agent 系统：

部署环境：本地 Windows · WSL Ubuntu Docker · 华为云开发者空间 Euler OS
Channel 集成：Telegram / WeChat / 飞书
高阶能力：记忆插件 memory-lancedb-pro、多 Agent 会话隔离、A2A 协议、Google 无头浏览器、Skills 开发管理、Secrets 安全加固
任务协同：Clawteam 多任务管理 + Taskteam 主 / 子 Agent 协同
产出：基于 Vibe Coding 完成 AWS-AIF-C01 考试应用 1.0

其余三个 Agent 系统：

Zeroclaw：WSL Docker + 华为云双环境验证
Hermes Agent：本地适配、安全检查、自我进化、任务管理
Generic Agent：通过 Claude Code 扩展 ACP 协议，对接 Obsidian Agent Client

§02 · AI IDE 工具链

7 个开发工具构成的多模工作流，主力是 Claude Code，辅以 Antigravity / OpenCode 进行差异化测试。

工具	角色	关键产出
Claude Code ★	主力 IDE · Max 会员	~3 万行主动学习 Wiki · Superpowers + GSD + Playwright
Antigravity	Vibe Coding 验证	AIF-C01 应用 2.0 · 前后端分离 · 华为云部署
OpenCode	Claude Code 平替	Oh My OpenCode + Superpowers + MiniMax AI Skills
Claw Code	ClaudeCode 反编译版	源码级研究
Qwen Code	阿里系测试	国产 IDE 对比
VSCode	云端虚机管理	远程开发 / 调试
Qoder	文档与部署	开发文档辅助工具

多 IDE 策略

不是工具越多越好，而是用差异化 IDE 验证同一套方法论。Claude Code 是主力，Antigravity 用于验证 Vibe Coding 在前后端分离架构上的可行性。

§03 · AI Agent 平台 — Hub 矩阵

6 个 Agent 平台覆盖开源工作流 → 云原生托管全谱系。

 ┌──────────────────┐
 │ Agent 平台矩阵 │
 └────────┬─────────┘
 │
 ┌──────────┬────────────┼────────────┬──────────┐
 ▼ ▼ ▼ ▼ ▼
 ┌───────┐ ┌──────┐ ┌─────────┐ ┌─────────┐ ┌──────────┐
 │ n8n │ │ Dify │ │ Skyloop │ │ Hello │ │ AWS │
 │ 本地 │ │华为云│ │ 土耳其 │ │ Agent │ │Agentcore │
 └───┬───┘ └──┬───┘ └────┬────┘ └─────────┘ └──────────┘
 │ │ │
 └────┬────┘ │
 ▼ ▼
 行业调研日报 多行业 Agent
 (合作伙伴演示)

 + LangChain & LangGraph (编程框架)

平台	部署位置	主要场景
n8n	本地电脑	Agent 节点式编排学习 · 行业调研日报系统
Dify	华为云 Euler Docker	Fork GitHub Dify · 行业调研日报
Skyloop	土耳其本地服务器	土耳其合作伙伴的多行业 Agent 演示
HelloAgent	本地部署	赛博社区游戏
LangChain & LangGraph	通用框架	多步任务建模
AWS Agentcore	AWS 云	云原生 Agent · 与 AIF-C01 协同

§04 · RAG 技术 Pipeline

向量化检索的 4 步标准流程，已在 4 个项目中实践。

 ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐
 │ 01 │ │ 02 │ │ 03 │ │ 04 │
 │ 原始数据 │───►│ 向量化 │───►│ LanceDB │───►│ 检索+生成│
 │ INGEST │ │ EMBED │ │ STORE │ │ RETRIEVE │
 └──────────┘ └──────────┘ └──────────┘ └──────────┘
 │ │ │ │
 文档 / 多模态 Qwen Embedding Agentic RAG RAG / LLM 增强
 多模态支持

4 个 RAG 实践项目：

LanceDB 集成 —— 部署在 Openclaw 上的 Agentic RAG，向量数据库 + 多模态数据支持，对比研究 LanceDB-Pro 与 QMD 两种记忆管理方式
n8n 个人知识库 —— 基于 RAG 流程编排的私有知识检索系统
Interview-Guild —— Fork GitHub 项目，构建面试问题检索与管理应用
PageIndex 对比 —— Fork 项目，传统 RAG vs 树结构人类索引方式的方法论对比

§05 · 推理 vs MaaS 双轨

自托管推理与云端 MaaS 双轨实践 —— 任何严肃的 AI 工程都需要在两条路径都跑通。

 ┌───── 自托管推理 ──────┐ ┌────── MaaS 云服务 ──────┐
 │ │ │ │
 │ vLLM 集群部署 │ │ 阿里百炼 qwen-max │
 │ PageAttn │ │ qwen3.6+ │
 │ KV 量化 │ │ Embedding │
 │ │ │ │
 │ OLLama 单机小模型 │ ◄───► │ 华为 MA Studio │
 │ │ │ │
 │ LMStudio 本地 │ │ 火山 字节推理 │
 │ Gemma 1B │ │ │
 │ │ │ Gemini Google │
 │ NanoLLM + MiniSGlang│ │ 多模态 API │
 └───────────────────────┘ └──────────────────────────┘
 适合掌控/隐私/成本 适合快速接入/多模态

维度	自托管推理	MaaS 平台
代表	vLLM / OLLama / LMStudio	阿里百炼 / 华为 MA / 火山 / Gemini
适用	大模型集群 / 单机本地	快速接入 / 多模态
关键技术	PageAttention · KV Cache 量化	API · Embedding · 多模态

§06 · 模型训练 4 阶段链路

从预训练到强化学习的完整链路实践：

┌────────────┐ ┌────────────┐ ┌────────────┐ ┌────────────┐
│ STAGE 01 │ │ STAGE 02 │ │ STAGE 03 │ │ STAGE 04 │
│ 预训练 │──►│ SFT 微调 │──►│ Lora 微调 │──►│ 强化学习 │
│ │ │ │ │ │ │ │
│ Happy-LLM │ │ 指令跟随 │ │ PEFT 适配 │ │ GPRO/RLHF │
│ 215M │ │ 对话能力 │ │ 资源受限 │ │ RLFromScratch│
└────────────┘ └────────────┘ └────────────┘ └────────────┘
 智星云 训练平台 ──────────────────────────► ModelArts
 (YOLO v6 + HCCDP-AI)

两条互补的训练实践线路：

MiniMind —— 大模型训练完整链路实践，从零理解预训练到对话
华为云 ModelArts —— YOLO v6 模型训练部署 Demo，通过 HCCDP-AI 认证

训练平台：模型智星云完成 Happy-LLM Chapter5 Base 215M 预训练 + SFT 微调 + Lora 微调。

强化学习：基于 RLFromScratch 从零实现完整 GPRO 算法。

§07 · 模型原理 — 理论地基

 ┌─────────────────┐
 │ 理论基础 │
 └────────┬────────┘
 │
 ┌──────────┬────────────┼────────────┬─────────┐
 ▼ ▼ ▼ ▼ ▼
Transformer HappyLLM Agent 原理 强化学习 Python
 │ │ │ 基础
 ├ Embedding + PE ├ 5 类 Agent ├ PPO
 ├ Multi-Head Attn ├ 任务分解 ├ DPO
 ├ Add & Norm ├ 协同机制 └ GPRO
 ├ Feed Forward ├ 记忆管理
 ├ Linear + Softmax └ 李飞飞 paper
 └ Attention is All
 You Need 精读

Transformer 全链路：Embedding + PE → MHA → Add & Norm → FFN → Linear + Softmax，配合 Attention is All You Need 论文精读。

Agent 原理：李飞飞团队 AI Agent 论文 —— 5 类 Agent 类型、任务分解与协同、记忆管理机制。

强化学习：RLHF 原理 · PPO / DPO 对比 · GPRO 自实现。

§08 · 能力分布雷达

按 8 维度自评：

技术领域	掌握度	进度条	说明
AI IDE (Claude Code)	95	`▓▓▓▓▓▓▓▓▓░`	主力，Max 会员，3 万行项目产出
AI 应用层 (Openclaw)	90	`▓▓▓▓▓▓▓▓▓░`	多环境部署 + 多 Agent 协同
RAG 技术	85	`▓▓▓▓▓▓▓▓░░`	4 个项目落地
Agent 平台	80	`▓▓▓▓▓▓▓▓░░`	n8n / Dify / LangChain 多平台
推理 / MaaS	75	`▓▓▓▓▓▓▓░░░`	多平台跑通
模型原理	75	`▓▓▓▓▓▓▓░░░`	Transformer + RLHF
模型训练	70	`▓▓▓▓▓▓▓░░░`	MiniMind + GPRO + HCCDP-AI
Python 工程	60	`▓▓▓▓▓▓░░░░`	语法 ✓ · pandas/PyTorch 进行中

§09 · 代表项目（已上线）

主动学习平台 · LLM Wiki + Agentic AI

链接：ai.hialbert.online
规模：~3 万行代码
栈：React + FastAPI + SQLite + RAG + 力导向知识图谱
方法论：Superpowers + GSD + Playwright
特色：Agentic AI 原生应用设计 · PWA 移动端 · 主动学习引擎

AWS-AIF-C01 考试应用 1.0

链接：hialberto.github.io/aws-aif-c01-study
栈：纯前端 HTML + CSS + JS
方法：Openclaw 的 Vibe Coding 完成

AWS-AIF-C01 考试应用 2.0

栈：前后端分离 · Node.js 登录验证 + SQLite
部署：华为云开发者空间 Euler 虚机 + Coplar 免费域名
方法：Antigravity Vibe Coding 完成

学习路径建议

给同样在学 AI 工程的朋友

不要从顶层 API 调用开始学。先打地基（Python + Transformer 原理），再往上一层层叠加（训练 → 推理 → RAG → Agent → 应用）。地基越深，上层能盖得越高。

具体路径：

理论地基 —— Transformer 论文精读 + HappyLLM 全链路
训练实践 —— MiniMind 完整链路 + Lora 微调
推理部署 —— OLLama 单机 → vLLM 集群
RAG 落地 —— LanceDB + 至少一个 Fork 项目复现
Agent 平台 —— n8n 节点编排 → LangGraph 编程
应用层 —— 选一个 Agent 框架（Openclaw / Dify）深耕
IDE 加成 —— Claude Code Vibe Coding 加速所有上层产出

核心关键词

AI 技术栈 LLM 工程 Agent 架构 RAG Transformer RLHF GPRO Openclaw Claude Code Vibe Coding LanceDB vLLM MiniMind ModelArts Lora 微调

写在最后

这张架构图不是终点，而是当前学习的快照。每加一层能力，地基就要相应加深一寸。做 AI 系统架构师，靠的不是会用什么工具，而是看清每层之间如何咬合。

深度解析：生产级 Agentic RAG 系统架构与企业级实践

Tue, 31 Mar 2026 00:00:00 +0000

深度解析：生产级 Agentic RAG 系统架构与企业级实践

本项目不仅仅是一个 RAG 示例，它更是一套完整的企业知识引擎演进方案。它展示了如何从一个脆弱的检索原型一步步进化为具备“自修复”能力的工业级系统。

📅 7 周功能演进路线图：从原型到工业级

周次	核心增加功能	设计初衷 (Why)	企业应用价值 (Enterprise Value)
Week 1	生产级基建: Docker, FastAPI, Postgres, OpenSearch, Airflow	企业版 RAG 需要超越 Notebook 脚本，必须具备服务化、数据库持久化和多组件隔离能力。	稳定性与可扩展性: 为高并发和大规模数据存储打下标准工业底座，支持水平扩展。
Week 2	自动化数据管道: arXiv API + Docling PDF 解析	依靠手工上传无法建立实时知识库。Docling 能精准解析 PDF 结构和表格，解决“数据垃圾进、垃圾出”的问题。	数据质量与自动化: 极大提升论文/研报的解析精度，自动同步确保 AI 总是掌握最新情报。
Week 3	精准检索基准 (BM25)	向量搜索在匹配专业术语（如产品型号、特定缩写）时常失效。BM25 提供精确的语义对齐。	高信任度检索: 确保用户搜什么得什么，在精确术语检索场景下不会出现“风马牛不相及”。
Week 4	混合搜索与智能切分	结合语义理解与关键词匹配 (RRF 融合)。语义切分 (Semantic Chunking) 确保知识片段上下文完整。	召回率最大化: 解决由于召回不全导致的 LLM 幻觉，确保相关背景知识被完整送入生成阶段。
Week 5	本地化 LLM 与流式响应	集成 Ollama (llama3.2) 及 Gradio。支持流式 API 提升感知速度。	安全性与成本控制: 解决企业私有数据不出域的问题，大幅降低对外 API 订阅费用。
Week 6	可观测性与性能优化	Langfuse 全链路追踪 + Redis 语义缓存。	审计、调试与降本: 记录 Agent 每一笔推理过程用于合规审计；利用缓存节省 80%+ 的重复计算开销。
Week 7	智能回路 (Agentic RAG)	LangGraph 回路决策、Query 改写、安全护栏 (Guardrails)	赋予 AI “多想一步”的能力。如果第一次搜不到，AI 会自动改写关键词重搜。

🏗️ 最终形态：修正型智能体检索 (CRAG)

该系统的最终形态是一个基于 LangGraph 的“自修正状态机”。它不再盲目相信检索结果，而是引入了批判性思维。

核心工作流逻辑：

输入防护 (Guardrails)：先判断问题是否在业务范围内，拦截非法或不相关请求。
混合检索 (Hybrid Execution)：同时并发执行关键词和语义搜索，通过 RRF 算法融合。
文档评分 (Document Grading)：有一个专门的 Agent 评估检索出的片段是否真的能回答问题。
- ✅ 相关：直接进入生成环节。
- ⚠️ 一般/不相关：触发 Query Rewriter。
查询改写 (Self-Correction)：AI 会反思“为什么搜不到？”，然后修改搜索关键词重新检索，直到找到满意答案。
生成与幻觉检查 (Hallucination Check)：生成内容后反向校验是否基于原文，杜绝胡说八道。

架构如下： !Pasted image 20260401002240.png

LangGraph的工作流如下： !Pasted image 20260401002502.png

🏢 它满足了企业应用的哪些核心需求？

1. 极致的生成质量 (Reliability)

通过 LangGraph 建立的闭环反馈，解决了传统 RAG “一锤子买卖”的低成功率问题。AI 在回答前会自我纠错，极大地降低了企业级应用最恐惧的“严重幻觉”。

2. 全生命周期的可观测性 (Auditability)

企业内部使用 AI 必须可追溯。集成 Langfuse 后，管理者可以看到 AI 为什么改写了查询、引用了哪篇文档、推理逻辑在哪里出了叉子，满足合规要求。

3. 数据主权与隐私 (Privacy/Security)

支持通过 Ollama 本地部署模型。对于涉及内部研报、未公开财报等敏感信息，企业可以实现完全离线的 RAG 方案。

4. 低成本、高性能 (Efficiency)

Redis 语义缓存 可以让 90% 的常见问题（如“公司报销制度”）在毫秒级返回，且不消耗任何 LLM Token 费用。Airflow 则保证了知识库的自动“生长”，无需专人维护。

🎯 总结建议

如果你在为企业寻找一套可接单、可落地的 AI 方案，该项目提供的 “数据管道 + 混合检索 + 智能体修正 + 全链路监控” 组合正是目前业界最推崇的 RAG 终极形态。

RAG on Albert Intelligence

从模型原理到 Agent 协同 · 我的 AI 技术栈 9 层学习架构

从模型原理到 Agent 协同 · 我的 AI 技术栈 9 层学习架构

总体架构

§01 · AI 应用层 — 4 个 Agent 系统

§02 · AI IDE 工具链

§03 · AI Agent 平台 — Hub 矩阵

§04 · RAG 技术 Pipeline

§05 · 推理 vs MaaS 双轨

§06 · 模型训练 4 阶段链路

§07 · 模型原理 — 理论地基

§08 · 能力分布雷达

§09 · 代表项目（已上线）

主动学习平台 · LLM Wiki + Agentic AI

AWS-AIF-C01 考试应用 1.0

AWS-AIF-C01 考试应用 2.0

学习路径建议

延伸阅读

核心关键词

深度解析：生产级 Agentic RAG 系统架构与企业级实践

深度解析：生产级 Agentic RAG 系统架构与企业级实践

📅 7 周功能演进路线图：从原型到工业级

🏗️ 最终形态：修正型智能体检索 (CRAG)

核心工作流逻辑：

🏢 它满足了企业应用的哪些核心需求？

1. 极致的生成质量 (Reliability)

2. 全生命周期的可观测性 (Auditability)

3. 数据主权与隐私 (Privacy/Security)

4. 低成本、高性能 (Efficiency)

🎯 总结建议