从模型原理到 Agent 协同 · 我的 AI 技术栈 9 层学习架构

核心立场
做 AI 工程，不能只会调 API，也不能只懂论文。真正的能力是从模型原理到 Agent 协同的全栈贯通。这是我的 9 层学习架构。

总体架构

把 AI 技术栈分成 9 层：底层是 Python 工程与模型原理，往上是训练 / 推理 / MaaS / RAG，最顶层是 Agent 平台、IDE 与应用层。每一层都对应一组具体工具和实践产出。

┌────────────────────────────────────────────────────┐
│  L9  AI 应用层    Openclaw · Zeroclaw · Hermes      │
├────────────────────────────────────────────────────┤
│  L8  AI IDE       Claude Code · Antigravity        │
├────────────────────────────────────────────────────┤
│  L7  Agent 平台   n8n · Dify · LangChain · AWS     │
├────────────────────────────────────────────────────┤
│  L6  RAG 技术     LanceDB · 向量检索 · 树结构索引   │
├──────────────────────────┬─────────────────────────┤
│  L5a 推理平台            │  L5b MaaS 平台           │
│  vLLM · OLLama · LMStudio│  百炼 · 华为 · 火山 · Gemini│
├──────────────────────────┴─────────────────────────┤
│  L4  模型训练     MiniMind · Lora · GPRO · ModelArts│
├────────────────────────────────────────────────────┤
│  L3  模型原理     Transformer · RLHF · Agent 原理   │
├────────────────────────────────────────────────────┤
│  L2  Python 工程  语法 · pandas · PyTorch          │
├────────────────────────────────────────────────────┤
│  L1  操作系统/容器/云  Linux · Docker · 华为云·AWS │
└────────────────────────────────────────────────────┘
                          ▲
                          │
                  地基越深，上层能盖越高

设计思路
上层"应用 / IDE / Agent 平台"是看得见的产出；中层"RAG / 推理 / MaaS / 训练"是核心能力；底层"模型原理 / Python"是地基。地基决定上层能盖多高。

§01 · AI 应用层 — 4 个 Agent 系统

                  ┌──────────────────┐
                  │   AI 应用层       │
                  └─────────┬────────┘
                            │
       ┌───────────┬────────┴────────┬────────────┐
       ▼           ▼                 ▼            ▼
   ┌────────┐  ┌──────────┐  ┌────────────┐  ┌──────────┐
   │Openclaw│  │ Zeroclaw │  │   Hermes   │  │ Generic  │
   │ ★ 核心 │  │  轻量    │  │   Agent    │  │  Agent   │
   └────┬───┘  └──────────┘  └─────┬──────┘  └────┬─────┘
        │                          │              │
        ├─ 3 套环境部署            │              │
        │   Win / WSL / 华为云     │              │
        ├─ 多 Agent 协同           │              │
        │   Clawteam / Taskteam    │              │
        ├─ A2A 协议 · Skills 开发  │              │
        ├─ 记忆插件                │              │
        │   memory-lancedb-pro     │              │
        └─ Vibe Coding             │              │
            → AIF-C01 1.0          │              │
                                   │              │
                                   ▼              ▼
                            安全检查/自我进化  ACP 协议
                            任务管理          对接 Obsidian

Openclaw 是我投入最深的 Agent 系统：

部署环境：本地 Windows · WSL Ubuntu Docker · 华为云开发者空间 Euler OS
Channel 集成：Telegram / WeChat / 飞书
高阶能力：记忆插件 memory-lancedb-pro、多 Agent 会话隔离、A2A 协议、Google 无头浏览器、Skills 开发管理、Secrets 安全加固
任务协同：Clawteam 多任务管理 + Taskteam 主 / 子 Agent 协同
产出：基于 Vibe Coding 完成 AWS-AIF-C01 考试应用 1.0

其余三个 Agent 系统：

Zeroclaw：WSL Docker + 华为云双环境验证
Hermes Agent：本地适配、安全检查、自我进化、任务管理
Generic Agent：通过 Claude Code 扩展 ACP 协议，对接 Obsidian Agent Client

§02 · AI IDE 工具链

7 个开发工具构成的多模工作流，主力是 Claude Code，辅以 Antigravity / OpenCode 进行差异化测试。

工具	角色	关键产出
Claude Code ★	主力 IDE · Max 会员	~3 万行主动学习 Wiki · Superpowers + GSD + Playwright
Antigravity	Vibe Coding 验证	AIF-C01 应用 2.0 · 前后端分离 · 华为云部署
OpenCode	Claude Code 平替	Oh My OpenCode + Superpowers + MiniMax AI Skills
Claw Code	ClaudeCode 反编译版	源码级研究
Qwen Code	阿里系测试	国产 IDE 对比
VSCode	云端虚机管理	远程开发 / 调试
Qoder	文档与部署	开发文档辅助工具

多 IDE 策略
不是工具越多越好，而是用差异化 IDE 验证同一套方法论。Claude Code 是主力，Antigravity 用于验证 Vibe Coding 在前后端分离架构上的可行性。

§03 · AI Agent 平台 — Hub 矩阵

6 个 Agent 平台覆盖开源工作流 → 云原生托管全谱系。

                       ┌──────────────────┐
                       │  Agent 平台矩阵   │
                       └────────┬─────────┘
                                │
        ┌──────────┬────────────┼────────────┬──────────┐
        ▼          ▼            ▼            ▼          ▼
    ┌───────┐  ┌──────┐   ┌─────────┐  ┌─────────┐ ┌──────────┐
    │  n8n  │  │ Dify │   │ Skyloop │  │  Hello  │ │   AWS    │
    │ 本地  │  │华为云│   │ 土耳其  │  │  Agent  │ │Agentcore │
    └───┬───┘  └──┬───┘   └────┬────┘  └─────────┘ └──────────┘
        │         │            │
        └────┬────┘            │
             ▼                 ▼
       行业调研日报         多行业 Agent
                          (合作伙伴演示)

        + LangChain & LangGraph (编程框架)

平台	部署位置	主要场景
n8n	本地电脑	Agent 节点式编排学习 · 行业调研日报系统
Dify	华为云 Euler Docker	Fork GitHub Dify · 行业调研日报
Skyloop	土耳其本地服务器	土耳其合作伙伴的多行业 Agent 演示
HelloAgent	本地部署	赛博社区游戏
LangChain & LangGraph	通用框架	多步任务建模
AWS Agentcore	AWS 云	云原生 Agent · 与 AIF-C01 协同

§04 · RAG 技术 Pipeline

向量化检索的 4 步标准流程，已在 4 个项目中实践。

   ┌──────────┐    ┌──────────┐    ┌──────────┐    ┌──────────┐
   │  01      │    │  02      │    │  03      │    │  04      │
   │ 原始数据 │───►│ 向量化   │───►│ LanceDB  │───►│ 检索+生成│
   │ INGEST   │    │ EMBED    │    │ STORE    │    │ RETRIEVE │
   └──────────┘    └──────────┘    └──────────┘    └──────────┘
       │               │                │               │
   文档 / 多模态    Qwen Embedding   Agentic RAG    RAG / LLM 增强
                                    多模态支持

4 个 RAG 实践项目：

LanceDB 集成 —— 部署在 Openclaw 上的 Agentic RAG，向量数据库 + 多模态数据支持，对比研究 LanceDB-Pro 与 QMD 两种记忆管理方式
n8n 个人知识库 —— 基于 RAG 流程编排的私有知识检索系统
Interview-Guild —— Fork GitHub 项目，构建面试问题检索与管理应用
PageIndex 对比 —— Fork 项目，传统 RAG vs 树结构人类索引方式的方法论对比

§05 · 推理 vs MaaS 双轨

自托管推理与云端 MaaS 双轨实践 —— 任何严肃的 AI 工程都需要在两条路径都跑通。

   ┌───── 自托管推理 ──────┐         ┌────── MaaS 云服务 ──────┐
   │                       │         │                          │
   │  vLLM     集群部署    │         │  阿里百炼    qwen-max    │
   │           PageAttn    │         │              qwen3.6+    │
   │           KV 量化     │         │              Embedding   │
   │                       │         │                          │
   │  OLLama   单机小模型  │  ◄───►  │  华为        MA Studio   │
   │                       │         │                          │
   │  LMStudio 本地        │         │  火山        字节推理     │
   │           Gemma 1B    │         │                          │
   │                       │         │  Gemini      Google      │
   │  NanoLLM  + MiniSGlang│         │              多模态 API   │
   └───────────────────────┘         └──────────────────────────┘
        适合掌控/隐私/成本                  适合快速接入/多模态

维度	自托管推理	MaaS 平台
代表	vLLM / OLLama / LMStudio	阿里百炼 / 华为 MA / 火山 / Gemini
适用	大模型集群 / 单机本地	快速接入 / 多模态
关键技术	PageAttention · KV Cache 量化	API · Embedding · 多模态

§06 · 模型训练 4 阶段链路

从预训练到强化学习的完整链路实践：

┌────────────┐   ┌────────────┐   ┌────────────┐   ┌────────────┐
│  STAGE 01  │   │  STAGE 02  │   │  STAGE 03  │   │  STAGE 04  │
│  预训练    │──►│  SFT 微调  │──►│  Lora 微调 │──►│  强化学习  │
│            │   │            │   │            │   │            │
│ Happy-LLM  │   │ 指令跟随   │   │ PEFT 适配  │   │ GPRO/RLHF  │
│   215M     │   │ 对话能力   │   │ 资源受限   │   │ RLFromScratch│
└────────────┘   └────────────┘   └────────────┘   └────────────┘
       智星云 训练平台 ──────────────────────────► ModelArts
                                                    (YOLO v6 + HCCDP-AI)

两条互补的训练实践线路：

MiniMind —— 大模型训练完整链路实践，从零理解预训练到对话
华为云 ModelArts —— YOLO v6 模型训练部署 Demo，通过 HCCDP-AI 认证

训练平台：模型智星云完成 Happy-LLM Chapter5 Base 215M 预训练 + SFT 微调 + Lora 微调。

强化学习：基于 RLFromScratch 从零实现完整 GPRO 算法。

§07 · 模型原理 — 理论地基

                  ┌─────────────────┐
                  │   理论基础       │
                  └────────┬────────┘
                           │
   ┌──────────┬────────────┼────────────┬─────────┐
   ▼          ▼            ▼            ▼         ▼
Transformer HappyLLM   Agent 原理    强化学习  Python
   │                       │            │       基础
   ├ Embedding + PE       ├ 5 类 Agent ├ PPO
   ├ Multi-Head Attn      ├ 任务分解   ├ DPO
   ├ Add & Norm           ├ 协同机制   └ GPRO
   ├ Feed Forward         ├ 记忆管理
   ├ Linear + Softmax     └ 李飞飞 paper
   └ Attention is All
     You Need 精读

Transformer 全链路：Embedding + PE → MHA → Add & Norm → FFN → Linear + Softmax，配合 Attention is All You Need 论文精读。

Agent 原理：李飞飞团队 AI Agent 论文 —— 5 类 Agent 类型、任务分解与协同、记忆管理机制。

强化学习：RLHF 原理 · PPO / DPO 对比 · GPRO 自实现。

§08 · 能力分布雷达

按 8 维度自评：

技术领域	掌握度	进度条	说明
AI IDE (Claude Code)	95	`▓▓▓▓▓▓▓▓▓░`	主力，Max 会员，3 万行项目产出
AI 应用层 (Openclaw)	90	`▓▓▓▓▓▓▓▓▓░`	多环境部署 + 多 Agent 协同
RAG 技术	85	`▓▓▓▓▓▓▓▓░░`	4 个项目落地
Agent 平台	80	`▓▓▓▓▓▓▓▓░░`	n8n / Dify / LangChain 多平台
推理 / MaaS	75	`▓▓▓▓▓▓▓░░░`	多平台跑通
模型原理	75	`▓▓▓▓▓▓▓░░░`	Transformer + RLHF
模型训练	70	`▓▓▓▓▓▓▓░░░`	MiniMind + GPRO + HCCDP-AI
Python 工程	60	`▓▓▓▓▓▓░░░░`	语法 ✓ · pandas/PyTorch 进行中

§09 · 代表项目（已上线）

主动学习平台 · LLM Wiki + Agentic AI

链接：ai.hialbert.online
规模：~3 万行代码
栈：React + FastAPI + SQLite + RAG + 力导向知识图谱
方法论：Superpowers + GSD + Playwright
特色：Agentic AI 原生应用设计 · PWA 移动端 · 主动学习引擎

AWS-AIF-C01 考试应用 1.0

链接：hialberto.github.io/aws-aif-c01-study
栈：纯前端 HTML + CSS + JS
方法：Openclaw 的 Vibe Coding 完成

AWS-AIF-C01 考试应用 2.0

栈：前后端分离 · Node.js 登录验证 + SQLite
部署：华为云开发者空间 Euler 虚机 + Coplar 免费域名
方法：Antigravity Vibe Coding 完成

学习路径建议

给同样在学 AI 工程的朋友
不要从顶层 API 调用开始学。先打地基（Python + Transformer 原理），再往上一层层叠加（训练 → 推理 → RAG → Agent → 应用）。地基越深，上层能盖得越高。

具体路径：

理论地基 —— Transformer 论文精读 + HappyLLM 全链路
训练实践 —— MiniMind 完整链路 + Lora 微调
推理部署 —— OLLama 单机 → vLLM 集群
RAG 落地 —— LanceDB + 至少一个 Fork 项目复现
Agent 平台 —— n8n 节点编排 → LangGraph 编程
应用层 —— 选一个 Agent 框架（Openclaw / Dify）深耕
IDE 加成 —— Claude Code Vibe Coding 加速所有上层产出

核心关键词

AI 技术栈 LLM 工程 Agent 架构 RAG Transformer RLHF GPRO Openclaw Claude Code Vibe Coding LanceDB vLLM MiniMind ModelArts Lora 微调

写在最后
这张架构图不是终点，而是当前学习的快照。每加一层能力，地基就要相应加深一寸。做 AI 系统架构师，靠的不是会用什么工具，而是看清每层之间如何咬合。