翻页 Space 暂停 M 静音
开源 · MIT · 编程 Agent

Pi Agent

下一代开源自扩展编程 Agent
模块化架构 · 传输层抽象 · 状态管理 · 统一 LLM API

4
核心模块
MIT
开源协议
Node 22+
运行环境
💡 概念引入

什么是 Pi Agent

Pi Agent 是一个开源的编程 Agent 框架,由 Mario Zechner 开发, 旨在打造真正为开发者设计的 AI 编程伙伴。它不是完整的 IDE 插件, 而是一个可扩展、可组合、可容器化的 Agent 运行时。

🧠

开源自扩展

不是黑盒 AI 产品,而是开源框架——你可以深入源码、理解机制、定制自己的 Agent Brain。

🔧

模块化架构

4 个独立包:Agent Runtime、AI Layer、CLI 应用、Terminal UI,可单独使用或自由组合。

🌐

多 LLM 支持

通过 pi-ai 统一封装 OpenAI、Anthropic、Google AI 等主流大模型接口,切换模型不影响上层逻辑。

📺 灵感来源

ZazenCodes 视频说起

Pi Agent 的设计理念,源于 YouTube 技术博主 ZazenCodes 的 "Build an AI Bookkeeper with Pi Agent Harness" 视频。 它展示了如何用轻量级框架构建专用 AI Agent。

📄
1

AGENTS 文件

定义 Agent 的角色、性格、行为规范——Agent 的"灵魂"配置文件。

🧠
2

Brain 文件

管理指令、记忆、技能——Agent 的"大脑",包含持久化知识。

💾
3

Memory 机制

持久化存储,Agent 跨会话记忆项目上下文和历史决策。

Pi Brain 架构示例
# AGENTS — 角色定义
role: coding-assistant
personality: precise, helpful, security-conscious
tools: [read, bash, edit, write]

# brain — 持久化记忆
project: my-app
last_edit: src/api/users.ts
context: TypeScript monorepo, D1 database
🏗️ 系统架构

Monorepo 分层设计

4 个核心包,依赖关系清晰。pi-ai 提供 AI 能力,pi-agent-core 实现运行时, pi-coding-agent 提供 CLI 应用,pi-tui 负责终端 UI 渲染。

👤 User Interface

  • CLI 交互界面
  • TUI 终端 UI
  • Session 管理
pi-coding-agent

⚙️ Agent Runtime

  • Tool Calling
  • State Management
  • Transport 抽象
pi-agent-core

🤖 AI Layer

  • OpenAI
  • Anthropic Claude
  • Google AI
💡 传输层抽象(Transport):核心亮点——Agent 与外部世界的交互完全通过 Transport 接口抽象, 支持 CLI、HTTP Server、WebSocket、Slack Bot 等多种方式,核心逻辑与传输层完全解耦。
📦 核心模块

4 大模块 各尽其能

每个包都遵循 MIT 协议,依赖严格锁定,可独立使用也可组合部署。

🧠
01

pi-agent-core

通用 Agent 运行时核心:传输层抽象、状态管理、附件支持。与 UI 和 LLM 完全解耦。

TransportStateTool Calling
🔮
02

pi-ai

统一多 Provider LLM API,封装 OpenAI、Anthropic、Google AI 等主流接口,支持流式输出。

OpenAIAnthropicStreaming
💻
03

pi-coding-agent

交互式编程 Agent CLI,内置 read、bash、edit、write 工具,Session 持久化,Bun 编译输出单文件。

CLISessionBun Binary
🖥️
04

pi-tui

高性能差分渲染终端 UI 库,为编程 Agent 提供富文本输出、语法高亮、进度条等交互体验。

Diff RenderSyntax HLRich Text
💡 设计理念

6 大 核心技术

Pi Agent 的设计围绕传输抽象、状态管理、安全容器化三大核心展开。

🚌
01

Transport 抽象

通过 Transport 接口,Agent 可以是 CLI、HTTP Server、Slack Bot 或自定义协议,完全解耦。

📊
02

State Management

状态机 + Session 持久化,Agent 跨调用记忆项目上下文和历史决策。

🔧
03

Tool Calling

内置 read、bash、edit、write 等工具,基于 TypeBox 定义 schema,自动生成接口。

🔒
04

Supply Chain 安全

直接依赖精确锁定,npm shrinkwrap 固化所有传递依赖,CI 定期 audit。

🌐
05

Multi-Provider LLM

pi-ai 封装 OpenAI、Anthropic Claude、Google Gemini,切换模型不影响上层代码。

📤
06

OSS Session 分享

会话导出 HTML,分享到 HuggingFace 数据集,推动开源社区积累真实 Agent 数据。

🚀 应用案例

这些场景 Pi Agent 都能胜任

🛠️

日常编程助手

Bug 修复、代码审查、重构建议、文档生成。通过 Session 记住项目上下文。

Bug 修复代码审查重构
🐛

OSS Bug 修复

通过 pi-share-hf 工具将修复过程发布到 HuggingFace 数据集,贡献真实开源数据。

开源贡献HuggingFaceSession
🔄

数据管道自动化

收据→OCR→字段提取→存储的自动化管道,Brain 架构让记忆持久化成为可能。

OCR自动化持久化
🏗️

跨平台 Agent 服务

HTTP Server、Slack Bot 或自定义协议服务,结合 Docker 实现完全隔离运行。

HTTP ServerSlack BotDocker
🍓

Raspberry Pi 浏览器 Agent

树莓派 + Docker + noVNC + Playwright,实现网页表单自动填写,KYC/DDR 文档处理。

Raspberry PiPlaywrightnoVNC

Bun 原生编译部署

Bun 编译输出单文件二进制,无需 Node.js 运行时,零依赖部署,极致轻量。

Bun Binary零依赖轻量
🛡️ 容器化方案

3 种 隔离部署模式

Pi 不内置权限系统,文档明确建议:通过容器化获得文件系统、进程、网络、凭证的隔离边界。

🦬 Gondolin Extension(推荐)

保持 pi 和 Provider 认证在宿主机,工具和命令路由到本地 Linux Micro-VM(通过 gVisor)。兼顾安全与便利。

Host: pi + API keys
    ↓ (tools/!cmds)
Micro-VM: isolated fs

📦 Plain Docker

最简单方案:将整个 pi 进程运行在 Docker 容器中,适合文件系统和网络需要严格边界的场景。

docker run -v $HOME/.pi:/home/pi/.pi \
  -v $(pwd):/workspace pi-agent

🔒 OpenShell Policy

通过 policy-controlled sandbox 运行,支持精确的读/写/网络权限策略,适合企业级安全审计需求。

pi run --sandbox \
  --allow-read=$PWD \
  --deny-network=external
⚖️ 特性对比

vs 其他开源 编程 Agent

特性 Pi Agent Cursor Claude Code OpenAI Agent
开源协议MIT ✓专有 ✗专有 ✗MIT ✓
Transport 抽象部分
多 LLM Provider限 OpenAI限 Anthropic
Session 持久化基础
Bun 编译输出
TUI 差分渲染基础
OSS Session 分享
Supply-chain 审计部分部分
📅 发展历程

从灵感到 pi.dev

Pi Agent 的设计理念源于 ZazenCodes 的 "Pi Agent Harness" 视频,逐步演化为功能完整的开源框架。

💡 灵感来源

ZazenCodes 视频展示如何从零构建轻量级专用 Agent——AGENTS + Brain + Memory 架构。

🧱 核心架构

Mario Zechner 工程化构建:Transport 抽象层 + 状态管理系统,核心与 UI/LLM 完全解耦。

📦 pi-ai 发布

统一多 Provider LLM API:OpenAI、Anthropic、Google AI,为生态系统提供统一 AI 接口。

💻 CLI 应用

完整交互式编程 CLI:内置工具 + Session 管理 + Bun 编译输出单文件二进制。

🌐 OSS 生态

pi-share-hf 发布:会话导出 HTML,分享到 HuggingFace,推动开源 Agent 数据积累。

🚀 立即开始

准备好开始了吗?

Pi Agent 完全开源,MIT 协议,立即开始你的第一个 AI 编程 Agent 之旅。

pi.dev
官方网站
MIT
开源协议
Discord
社区支持
📖 开始文档 ⭐ GitHub