headroomlabs-ai/headroom
Compress tool outputs, logs, files, and RAG chunks before they reach the LLM. 60-95% fewer tokens, same answers. Library, proxy, MCP server.
github.com · headroomlabs-ai/headroom
headroomlabs-ai/headroom
Compress tool outputs, logs, files, and RAG chunks before they reach the LLM. 60-95% fewer tokens, same answers. Library, proxy, MCP server.
Headroom 是面向 AI Agent 的上下文压缩层:在工具输出、日志、RAG 分块、文件与对话历史进入 LLM 之前完成压缩,官方宣称可节省 60–95% Token 且保持答案质量。数据默认在本地处理,支持 Python/TypeScript 库内联调用、零改代码的本地代理,以及 MCP 服务器三种接入方式,并可通过 headroom wrap 一键包裹 Claude Code、Codex、Cursor、Aider 等主流编码 Agent。
compress(messages) 库调用、headroom proxy 透明代理、MCP 工具(headroom_compress / headroom_retrieve / headroom_stats)headroom wrap claude|codex|cursor|aider|…,headroom unwrap 可撤销HEADROOM_OUTPUT_SHAPER=1)编码 Agent 日常会把大量工具返回、日志与检索结果塞进上下文,Token 账单随之膨胀。Headroom 在不改业务代码的前提下拦截并压缩这些内容——跑代理或 wrap 即可生效,库模式则可嵌入自有流水线。可逆 CCR 让模型在压缩后仍能取回原文,降低「压过头」的风险;跨 Agent 记忆则避免同一信息在 Claude Code 与 Codex 之间重复占用窗口。对个人开发者,这是降低 Opus 等高价模型成本的实用层;对团队,官方还提供企业级托管部署选项。
wrap 生态,开箱即可接入 Claude Code/Cursor 而非自行拼装流水线。headroom perf、headroom dashboard)与基准测试套件(python -m headroom.evals suite),并支持 headroom learn 从失败会话挖掘修正写入 CLAUDE.md 等。headroom CLI。REQUESTS_CA_BUNDLE 等 CA 信任(见 README 企业环境说明)。headroom wrap 与代理模式需在本地运行进程;纯沙箱且无本地进程权限的环境不适用。pip install "headroom-ai[all]" # Python,含 headroom CLInpm install headroom-ai # TypeScript SDK(仅库,无 CLI)docker pull ghcr.io/chopratejas/headroom:latest可选 extras:[proxy]、[mcp]、[ml]、[code]、[memory]、[langchain]、[agno] 等;pipx 用户建议指定 Python 3.13 以启用仪表盘美元节省统计。
headroom wrap claude # 包裹 Claude Code(或其他 Agent)# 或headroom proxy --port 8787 # 启动透明代理,客户端指向本地端口# 或库模式python -c "from headroom import compress; print(compress([...]))"headroom doctor # 健康检查,确认路由正常headroom perf # 查看压缩性能与节省比例headroom dashboard # 实时节省仪表盘(需代理运行中)headroom CLI 仅随 pip 包提供,npm 包是 TypeScript 库,不要期望 npx headroom 可用。$0.00(LiteLLM 兼容性限制);建议 pipx 使用 Python 3.13。--only-binary 预编译 wheel;运行时还需信任 cdn.pyke.io(ONNX)与 huggingface.co(模型)。HEADROOM_OUTPUT_SHAPER 等环境变量对已运行代理需通过 headroom wrap 的热同步或重启生效;共享代理上为全局设置。headroom unwrap claude(支持 claude、copilot、codex、opencode、openclaw 等)。