开源自扩展编程 Agent

Pi Agent

什么是 Pi Agent？它能做什么？
让我们一起来探索这个开源编程 Agent 新范式

4

核心模块

MIT

开源协议

Node 22+

运行环境

💡 开场介绍

什么是 Pi Agent？

Pi Agent 是一个开源的编程 Agent 框架，旨在打造真正为开发者设计的 AI 编程伙伴。它不是黑盒 AI 产品，而是一套开源的、模块化的、可扩展的 Agent 运行时—— 你可以深入源码，理解机制，甚至定制自己的 Agent Brain。

🧠

开源自扩展

不是黑盒 AI 产品，而是开源框架——你可以深入源码、理解机制、定制自己的 Agent Brain。

🔧

模块化架构

4 个独立包：Agent Runtime、AI Layer、CLI 应用、Terminal UI，可单独使用或自由组合。

🌐

多 LLM 支持

通过 pi-ai 统一封装 OpenAI、Anthropic、Google AI 等主流大模型接口，切换模型不影响上层逻辑。

📺 灵感来源

从 ZazenCodes 视频说起

Pi Agent 的设计理念，源于 YouTube 技术博主 ZazenCodes 的 "Build an AI Bookkeeper with Pi Agent Harness" 视频。它展示了如何用轻量级框架构建专用 AI Agent。

📄

1

AGENTS 文件

定义 Agent 的角色、性格、行为规范——Agent 的"灵魂"配置文件。

🧠

2

Brain 文件

管理指令、记忆、技能——Agent 的"大脑"，包含持久化知识。

💾

3

Memory 机制

持久化存储，Agent 跨会话记忆项目上下文和历史决策。

Pi Brain 架构示例

# AGENTS — 角色定义
role: coding-assistant
personality: precise, helpful, security-conscious
tools: [read, bash, edit, write]

# brain — 持久化记忆
project: my-app
last_edit: src/api/users.ts
context: TypeScript monorepo, D1 database

🏗️ 系统架构

Monorepo 分层设计

4 个核心包，依赖关系清晰。pi-ai 提供 AI 能力，pi-agent-core 实现运行时， pi-coding-agent 提供 CLI 应用，pi-tui 负责终端 UI 渲染。

👤 User Interface

CLI 交互界面
TUI 终端 UI
Session 管理

pi-coding-agent

⚙️ Agent Runtime

Tool Calling
State Management
Transport 抽象

pi-agent-core

🤖 AI Layer

OpenAI
Anthropic Claude
Google AI

💡 传输层抽象（Transport）：核心亮点——Agent 与外部世界的交互完全通过 Transport 接口抽象，支持 CLI、HTTP Server、WebSocket、Slack Bot 等多种方式，核心逻辑与传输层完全解耦。

📦 核心模块

4 大模块各尽其能

每个包都遵循 MIT 协议，依赖严格锁定，可独立使用也可组合部署。

🧠

01

pi-agent-core

通用 Agent 运行时核心：传输层抽象、状态管理、附件支持。与 UI 和 LLM 完全解耦。

TransportStateTool Calling

🔮

02

pi-ai

统一多 Provider LLM API，封装 OpenAI、Anthropic、Google AI 等主流接口，支持流式输出。

OpenAIAnthropicStreaming

💻

03

pi-coding-agent

交互式编程 Agent CLI，内置 read、bash、edit、write 工具，Session 持久化，Bun 编译输出单文件。

CLISessionBun Binary

🖥️

04

pi-tui

高性能差分渲染终端 UI 库，为编程 Agent 提供富文本输出、语法高亮、进度条等交互体验。

Diff RenderSyntax HLRich Text

💡 设计理念

6 大核心技术

Pi Agent 的设计围绕传输抽象、状态管理、安全容器化三大核心展开。

🚌

01

Transport 抽象

通过 Transport 接口，Agent 可以是 CLI、HTTP Server、Slack Bot 或自定义协议，完全解耦。

📊

02

State Management

状态机 + Session 持久化，Agent 跨调用记忆项目上下文和历史决策。

🔧

03

Tool Calling

内置 read、bash、edit、write 等工具，基于 TypeBox 定义 schema，自动生成接口。

🔒

04

Supply Chain 安全

直接依赖精确锁定，npm shrinkwrap 固化所有传递依赖，CI 定期 audit。

🌐

05

Multi-Provider LLM

pi-ai 封装 OpenAI、Anthropic Claude、Google Gemini，切换模型不影响上层代码。

📤

06

OSS Session 分享

会话导出 HTML，分享到 HuggingFace 数据集，推动开源社区积累真实 Agent 数据。

🚀 应用案例

这些场景 Pi Agent 都能胜任

🛠️

日常编程助手

Bug 修复、代码审查、重构建议、文档生成。通过 Session 记住项目上下文。

Bug 修复代码审查重构

🐛

OSS Bug 修复

通过 pi-share-hf 工具将修复过程发布到 HuggingFace 数据集，贡献真实开源数据。

开源贡献HuggingFaceSession

🔄

数据管道自动化

收据→OCR→字段提取→存储的自动化管道，Brain 架构让记忆持久化成为可能。

OCR自动化持久化

🏗️

跨平台 Agent 服务

HTTP Server、Slack Bot 或自定义协议服务，结合 Docker 实现完全隔离运行。

HTTP ServerSlack BotDocker

🍓

Raspberry Pi 浏览器 Agent

树莓派 + Docker + noVNC + Playwright，实现网页表单自动填写，KYC/DDR 文档处理。

Raspberry PiPlaywrightnoVNC

⚡

Bun 原生编译部署

Bun 编译输出单文件二进制，无需 Node.js 运行时，零依赖部署，极致轻量。

Bun Binary零依赖轻量

🛡️ 容器化方案

3 种隔离部署模式

Pi 不内置权限系统，文档明确建议：通过容器化获得文件系统、进程、网络、凭证的隔离边界。

🦬 Gondolin Extension（推荐）

保持 pi 和 Provider 认证在宿主机，工具和命令路由到本地 Linux Micro-VM（通过 gVisor）。兼顾安全与便利。

Host: pi + API keys
    ↓ (tools/!cmds)
Micro-VM: isolated fs

📦 Plain Docker

最简单方案：将整个 pi 进程运行在 Docker 容器中，适合文件系统和网络需要严格边界的场景。

docker run -v $HOME/.pi:/home/pi/.pi \
  -v $(pwd):/workspace pi-agent

🔒 OpenShell Policy

通过 policy-controlled sandbox 运行，支持精确的读/写/网络权限策略，适合企业级安全审计需求。

pi run --sandbox \
  --allow-read=$PWD \
  --deny-network=external

⚖️ 特性对比

vs 其他开源编程 Agent

特性	Pi Agent	Cursor	Claude Code	OpenAI Agent
开源协议	MIT ✓	专有 ✗	专有 ✗	MIT ✓
Transport 抽象	✓	✗	✗	部分
多 LLM Provider	✓	限 OpenAI	限 Anthropic	✓
Session 持久化	✓	✓	✓	基础
Bun 编译输出	✓	✗	✗	✗
TUI 差分渲染	✓	✗	基础	✗
OSS Session 分享	✓	✗	✗	✗
Supply-chain 审计	✓	✗	部分	部分

📅 发展历程

从灵感到 pi.dev

Pi Agent 的设计理念源于 ZazenCodes 的 "Pi Agent Harness" 视频，逐步演化为功能完整的开源框架。

💡 灵感来源

ZazenCodes 视频展示如何从零构建轻量级专用 Agent——AGENTS + Brain + Memory 架构。

🧱 核心架构

Mario Zechner 工程化构建：Transport 抽象层 + 状态管理系统，核心与 UI/LLM 完全解耦。

📦 pi-ai 发布

统一多 Provider LLM API：OpenAI、Anthropic、Google AI，为生态系统提供统一 AI 接口。

💻 CLI 应用

完整交互式编程 CLI：内置工具 + Session 管理 + Bun 编译输出单文件二进制。

🌐 OSS 生态

pi-share-hf 发布：会话导出 HTML，分享到 HuggingFace，推动开源 Agent 数据积累。

🚀 立即开始

准备好开始了吗？

Pi Agent 完全开源，MIT 协议，立即开始你的第一个 AI 编程 Agent 之旅。

pi.dev

官方网站

MIT

开源协议

Discord

社区支持

📖 开始文档 ⭐ GitHub

Pi Agent

什么是 Pi Agent？

开源自扩展

模块化架构

多 LLM 支持

从 ZazenCodes 视频说起

AGENTS 文件

Brain 文件

Memory 机制

Monorepo 分层设计

👤 User Interface

⚙️ Agent Runtime

🤖 AI Layer

4 大模块 各尽其能

pi-agent-core

pi-ai

pi-coding-agent

pi-tui

6 大 核心技术

Transport 抽象

State Management

Tool Calling

Supply Chain 安全

Multi-Provider LLM

OSS Session 分享

这些场景 Pi Agent 都能胜任

日常编程助手

OSS Bug 修复

数据管道自动化

跨平台 Agent 服务

Raspberry Pi 浏览器 Agent

Bun 原生编译部署

3 种 隔离部署模式

🦬 Gondolin Extension（推荐）

📦 Plain Docker

🔒 OpenShell Policy

vs 其他开源 编程 Agent

从灵感到 pi.dev

💡 灵感来源

🧱 核心架构

📦 pi-ai 发布

💻 CLI 应用

🌐 OSS 生态

准备好开始了吗？

4 大模块各尽其能

6 大核心技术

3 种隔离部署模式

vs 其他开源编程 Agent