从模型原理到 Agent 协同 · 我的 AI 技术栈 9 层学习架构
核心立场
做 AI 工程,不能只会调 API,也不能只懂论文。真正的能力是从模型原理到 Agent 协同的全栈贯通。这是我的 9 层学习架构。
总体架构
把 AI 技术栈分成 9 层:底层是 Python 工程与模型原理,往上是训练 / 推理 / MaaS / RAG,最顶层是 Agent 平台、IDE 与应用层。每一层都对应一组具体工具和实践产出。
┌────────────────────────────────────────────────────┐
│ L9 AI 应用层 Openclaw · Zeroclaw · Hermes │
├────────────────────────────────────────────────────┤
│ L8 AI IDE Claude Code · Antigravity │
├────────────────────────────────────────────────────┤
│ L7 Agent 平台 n8n · Dify · LangChain · AWS │
├────────────────────────────────────────────────────┤
│ L6 RAG 技术 LanceDB · 向量检索 · 树结构索引 │
├──────────────────────────┬─────────────────────────┤
│ L5a 推理平台 │ L5b MaaS 平台 │
│ vLLM · OLLama · LMStudio│ 百炼 · 华为 · 火山 · Gemini│
├──────────────────────────┴─────────────────────────┤
│ L4 模型训练 MiniMind · Lora · GPRO · ModelArts│
├────────────────────────────────────────────────────┤
│ L3 模型原理 Transformer · RLHF · Agent 原理 │
├────────────────────────────────────────────────────┤
│ L2 Python 工程 语法 · pandas · PyTorch │
├────────────────────────────────────────────────────┤
│ L1 操作系统/容器/云 Linux · Docker · 华为云·AWS │
└────────────────────────────────────────────────────┘
▲
│
地基越深,上层能盖越高
设计思路
上层"应用 / IDE / Agent 平台"是看得见的产出;中层"RAG / 推理 / MaaS / 训练"是核心能力;底层"模型原理 / Python"是地基。地基决定上层能盖多高。
§01 · AI 应用层 — 4 个 Agent 系统
┌──────────────────┐
│ AI 应用层 │
└─────────┬────────┘
│
┌───────────┬────────┴────────┬────────────┐
▼ ▼ ▼ ▼
┌────────┐ ┌──────────┐ ┌────────────┐ ┌──────────┐
│Openclaw│ │ Zeroclaw │ │ Hermes │ │ Generic │
│ ★ 核心 │ │ 轻量 │ │ Agent │ │ Agent │
└────┬───┘ └──────────┘ └─────┬──────┘ └────┬─────┘
│ │ │
├─ 3 套环境部署 │ │
│ Win / WSL / 华为云 │ │
├─ 多 Agent 协同 │ │
│ Clawteam / Taskteam │ │
├─ A2A 协议 · Skills 开发 │ │
├─ 记忆插件 │ │
│ memory-lancedb-pro │ │
└─ Vibe Coding │ │
→ AIF-C01 1.0 │ │
│ │
▼ ▼
安全检查/自我进化 ACP 协议
任务管理 对接 Obsidian
Openclaw 是我投入最深的 Agent 系统:
- 部署环境:本地 Windows · WSL Ubuntu Docker · 华为云开发者空间 Euler OS
- Channel 集成:Telegram / WeChat / 飞书
- 高阶能力:记忆插件
memory-lancedb-pro、多 Agent 会话隔离、A2A 协议、Google 无头浏览器、Skills 开发管理、Secrets 安全加固 - 任务协同:Clawteam 多任务管理 + Taskteam 主 / 子 Agent 协同
- 产出:基于 Vibe Coding 完成 AWS-AIF-C01 考试应用 1.0
其余三个 Agent 系统:
- Zeroclaw:WSL Docker + 华为云双环境验证
- Hermes Agent:本地适配、安全检查、自我进化、任务管理
- Generic Agent:通过 Claude Code 扩展 ACP 协议,对接 Obsidian Agent Client
§02 · AI IDE 工具链
7 个开发工具构成的多模工作流,主力是 Claude Code,辅以 Antigravity / OpenCode 进行差异化测试。
| 工具 | 角色 | 关键产出 |
|---|---|---|
| Claude Code ★ | 主力 IDE · Max 会员 | ~3 万行 主动学习 Wiki · Superpowers + GSD + Playwright |
| Antigravity | Vibe Coding 验证 | AIF-C01 应用 2.0 · 前后端分离 · 华为云部署 |
| OpenCode | Claude Code 平替 | Oh My OpenCode + Superpowers + MiniMax AI Skills |
| Claw Code | ClaudeCode 反编译版 | 源码级研究 |
| Qwen Code | 阿里系测试 | 国产 IDE 对比 |
| VSCode | 云端虚机管理 | 远程开发 / 调试 |
| Qoder | 文档与部署 | 开发文档辅助工具 |
多 IDE 策略
不是工具越多越好,而是用差异化 IDE 验证同一套方法论。Claude Code 是主力,Antigravity 用于验证 Vibe Coding 在前后端分离架构上的可行性。
§03 · AI Agent 平台 — Hub 矩阵
6 个 Agent 平台覆盖开源工作流 → 云原生托管全谱系。
┌──────────────────┐
│ Agent 平台矩阵 │
└────────┬─────────┘
│
┌──────────┬────────────┼────────────┬──────────┐
▼ ▼ ▼ ▼ ▼
┌───────┐ ┌──────┐ ┌─────────┐ ┌─────────┐ ┌──────────┐
│ n8n │ │ Dify │ │ Skyloop │ │ Hello │ │ AWS │
│ 本地 │ │华为云│ │ 土耳其 │ │ Agent │ │Agentcore │
└───┬───┘ └──┬───┘ └────┬────┘ └─────────┘ └──────────┘
│ │ │
└────┬────┘ │
▼ ▼
行业调研日报 多行业 Agent
(合作伙伴演示)
+ LangChain & LangGraph (编程框架)
| 平台 | 部署位置 | 主要场景 |
|---|---|---|
| n8n | 本地电脑 | Agent 节点式编排学习 · 行业调研日报系统 |
| Dify | 华为云 Euler Docker | Fork GitHub Dify · 行业调研日报 |
| Skyloop | 土耳其本地服务器 | 土耳其合作伙伴的多行业 Agent 演示 |
| HelloAgent | 本地部署 | 赛博社区游戏 |
| LangChain & LangGraph | 通用框架 | 多步任务建模 |
| AWS Agentcore | AWS 云 | 云原生 Agent · 与 AIF-C01 协同 |
§04 · RAG 技术 Pipeline
向量化检索的 4 步标准流程,已在 4 个项目中实践。
┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐
│ 01 │ │ 02 │ │ 03 │ │ 04 │
│ 原始数据 │───►│ 向量化 │───►│ LanceDB │───►│ 检索+生成│
│ INGEST │ │ EMBED │ │ STORE │ │ RETRIEVE │
└──────────┘ └──────────┘ └──────────┘ └──────────┘
│ │ │ │
文档 / 多模态 Qwen Embedding Agentic RAG RAG / LLM 增强
多模态支持
4 个 RAG 实践项目:
- LanceDB 集成 —— 部署在 Openclaw 上的 Agentic RAG,向量数据库 + 多模态数据支持,对比研究 LanceDB-Pro 与 QMD 两种记忆管理方式
- n8n 个人知识库 —— 基于 RAG 流程编排的私有知识检索系统
- Interview-Guild —— Fork GitHub 项目,构建面试问题检索与管理应用
- PageIndex 对比 —— Fork 项目,传统 RAG vs 树结构人类索引方式的方法论对比
§05 · 推理 vs MaaS 双轨
自托管推理与云端 MaaS 双轨实践 —— 任何严肃的 AI 工程都需要在两条路径都跑通。
┌───── 自托管推理 ──────┐ ┌────── MaaS 云服务 ──────┐
│ │ │ │
│ vLLM 集群部署 │ │ 阿里百炼 qwen-max │
│ PageAttn │ │ qwen3.6+ │
│ KV 量化 │ │ Embedding │
│ │ │ │
│ OLLama 单机小模型 │ ◄───► │ 华为 MA Studio │
│ │ │ │
│ LMStudio 本地 │ │ 火山 字节推理 │
│ Gemma 1B │ │ │
│ │ │ Gemini Google │
│ NanoLLM + MiniSGlang│ │ 多模态 API │
└───────────────────────┘ └──────────────────────────┘
适合掌控/隐私/成本 适合快速接入/多模态
| 维度 | 自托管推理 | MaaS 平台 |
|---|---|---|
| 代表 | vLLM / OLLama / LMStudio | 阿里百炼 / 华为 MA / 火山 / Gemini |
| 适用 | 大模型集群 / 单机本地 | 快速接入 / 多模态 |
| 关键技术 | PageAttention · KV Cache 量化 | API · Embedding · 多模态 |
§06 · 模型训练 4 阶段链路
从预训练到强化学习的完整链路实践:
┌────────────┐ ┌────────────┐ ┌────────────┐ ┌────────────┐
│ STAGE 01 │ │ STAGE 02 │ │ STAGE 03 │ │ STAGE 04 │
│ 预训练 │──►│ SFT 微调 │──►│ Lora 微调 │──►│ 强化学习 │
│ │ │ │ │ │ │ │
│ Happy-LLM │ │ 指令跟随 │ │ PEFT 适配 │ │ GPRO/RLHF │
│ 215M │ │ 对话能力 │ │ 资源受限 │ │ RLFromScratch│
└────────────┘ └────────────┘ └────────────┘ └────────────┘
智星云 训练平台 ──────────────────────────► ModelArts
(YOLO v6 + HCCDP-AI)
两条互补的训练实践线路:
- MiniMind —— 大模型训练完整链路实践,从零理解预训练到对话
- 华为云 ModelArts —— YOLO v6 模型训练部署 Demo,通过 HCCDP-AI 认证
训练平台:模型智星云完成 Happy-LLM Chapter5 Base 215M 预训练 + SFT 微调 + Lora 微调。
强化学习:基于 RLFromScratch 从零实现完整 GPRO 算法。
§07 · 模型原理 — 理论地基
┌─────────────────┐
│ 理论基础 │
└────────┬────────┘
│
┌──────────┬────────────┼────────────┬─────────┐
▼ ▼ ▼ ▼ ▼
Transformer HappyLLM Agent 原理 强化学习 Python
│ │ │ 基础
├ Embedding + PE ├ 5 类 Agent ├ PPO
├ Multi-Head Attn ├ 任务分解 ├ DPO
├ Add & Norm ├ 协同机制 └ GPRO
├ Feed Forward ├ 记忆管理
├ Linear + Softmax └ 李飞飞 paper
└ Attention is All
You Need 精读
Transformer 全链路:Embedding + PE → MHA → Add & Norm → FFN → Linear + Softmax,配合 Attention is All You Need 论文精读。
Agent 原理:李飞飞团队 AI Agent 论文 —— 5 类 Agent 类型、任务分解与协同、记忆管理机制。
强化学习:RLHF 原理 · PPO / DPO 对比 · GPRO 自实现。
§08 · 能力分布雷达
按 8 维度自评:
| 技术领域 | 掌握度 | 进度条 | 说明 |
|---|---|---|---|
| AI IDE (Claude Code) | 95 | ▓▓▓▓▓▓▓▓▓░ | 主力,Max 会员,3 万行项目产出 |
| AI 应用层 (Openclaw) | 90 | ▓▓▓▓▓▓▓▓▓░ | 多环境部署 + 多 Agent 协同 |
| RAG 技术 | 85 | ▓▓▓▓▓▓▓▓░░ | 4 个项目落地 |
| Agent 平台 | 80 | ▓▓▓▓▓▓▓▓░░ | n8n / Dify / LangChain 多平台 |
| 推理 / MaaS | 75 | ▓▓▓▓▓▓▓░░░ | 多平台跑通 |
| 模型原理 | 75 | ▓▓▓▓▓▓▓░░░ | Transformer + RLHF |
| 模型训练 | 70 | ▓▓▓▓▓▓▓░░░ | MiniMind + GPRO + HCCDP-AI |
| Python 工程 | 60 | ▓▓▓▓▓▓░░░░ | 语法 ✓ · pandas/PyTorch 进行中 |
§09 · 代表项目(已上线)
主动学习平台 · LLM Wiki + Agentic AI
- 链接:ai.hialbert.online
- 规模:~3 万行代码
- 栈:React + FastAPI + SQLite + RAG + 力导向知识图谱
- 方法论:Superpowers + GSD + Playwright
- 特色:Agentic AI 原生应用设计 · PWA 移动端 · 主动学习引擎
AWS-AIF-C01 考试应用 1.0
- 链接:hialberto.github.io/aws-aif-c01-study
- 栈:纯前端 HTML + CSS + JS
- 方法:Openclaw 的 Vibe Coding 完成
AWS-AIF-C01 考试应用 2.0
- 栈:前后端分离 · Node.js 登录验证 + SQLite
- 部署:华为云开发者空间 Euler 虚机 + Coplar 免费域名
- 方法:Antigravity Vibe Coding 完成
学习路径建议
给同样在学 AI 工程的朋友
不要从顶层 API 调用开始学。先打地基(Python + Transformer 原理),再往上一层层叠加(训练 → 推理 → RAG → Agent → 应用)。地基越深,上层能盖得越高。
具体路径:
- 理论地基 —— Transformer 论文精读 + HappyLLM 全链路
- 训练实践 —— MiniMind 完整链路 + Lora 微调
- 推理部署 —— OLLama 单机 → vLLM 集群
- RAG 落地 —— LanceDB + 至少一个 Fork 项目复现
- Agent 平台 —— n8n 节点编排 → LangGraph 编程
- 应用层 —— 选一个 Agent 框架(Openclaw / Dify)深耕
- IDE 加成 —— Claude Code Vibe Coding 加速所有上层产出
延伸阅读
- Claude Code 4 档默认架构 —— 50 / 200 / 1000 / 1000+ 并发对应的渐进式栈选择
- GenericAgent vs O-easy —— 3000 行代码的两种用法对比
- 企业生产环境部署 Agentic RAG 完整指南
- Openclaw 长期记忆插件 memory-lancedb-pro
- 给 Hermes Agent 装上 Open WebUI
核心关键词
AI 技术栈 LLM 工程 Agent 架构 RAG Transformer RLHF GPRO Openclaw Claude Code Vibe Coding LanceDB vLLM MiniMind ModelArts Lora 微调
写在最后
这张架构图不是终点,而是当前学习的快照。每加一层能力,地基就要相应加深一寸。做 AI 系统架构师,靠的不是会用什么工具,而是看清每层之间如何咬合。