hub / github.com/DietrichGebert/ponytail

github.com/DietrichGebert/ponytail @v4.8.4 sqlite

repository ↗ · DeepWiki ↗ · release v4.8.4 ↗

159 symbols 488 edges 46 files 21 documented · 13%

README

<img src="https://github.com/DietrichGebert/ponytail/raw/v4.8.4/assets/logo.png" width="220" alt="Ponytail, el senior dev flojo">

Ponytail

No dice nada. Escribe una línea. Funciona.

Stars Release npm

~54% menos código (hasta 94%) · ~20% más barato · ~27% más rápido · 100% seguro

_{Medido en sesiones reales de Claude Code editando un repo open-source real (FastAPI + React), contra el mismo agente sin skill. ~54% es el promedio de 12 tareas de feature (Haiku 4.5, n=4); llega al 94% cuando un agente sobre-construye (un selector de fechas) y es casi cero cuando el código ya es mínimo. ponytail mantiene cada guarda de seguridad, mientras que un prompt pelado de "escribe one-liners" se salta una. (El benchmark anterior de un solo disparo reportaba 80-94% como cifra plana; contra un baseline agéntico justo, ese es el techo por tarea, no el promedio.) Reporte completo · reprodúcelo.}

_{Traducción de la comunidad. La versión de referencia y más reciente es el README en inglés.}

Lo conoces. Cola de caballo larga. Lentes ovalados. Lleva más tiempo en la empresa que el control de versiones. Le muestras cincuenta líneas; las mira, no dice nada, y las reemplaza por una.

Ponytail lo pone dentro de tu agente de IA.

Antes / después

Le pides un selector de fechas. Tu agente instala flatpickr, escribe un componente wrapper, agrega un stylesheet, y empieza una discusión sobre zonas horarias.

Con ponytail:


<input type="date">

Más sobrevivientes en examples/.

Números

La medición honesta es un agente real haciendo trabajo real: una sesión headless de Claude Code editando el template full-stack-fastapi de tiangolo (un repo real de FastAPI + React), evaluada sobre el git diff que deja. Doce tickets de feature, el mismo agente con y sin el skill, n=4, Haiku 4.5.

Cada variante como porcentaje del baseline sin skill en LOC, tokens, costo y tiempo (Haiku 4.5). ponytail es el más bajo en cada métrica (LOC 46%, tokens 78%, costo 80%, tiempo 73%); caveman sube por encima del 100% en tokens, costo y tiempo; yagni-oneliner LOC 67%. Seguridad, tier adversarial aparte: baseline, caveman y ponytail 100%, yagni-oneliner 95%.

vs baseline sin skill	LOC	tokens	costo	tiempo	seguro
ponytail	-54%	-22%	-20%	-27%	100%
caveman (control de prosa concisa)	-20%	+7%	+3%	+2%	100%
prompt "YAGNI + one-liners"	-33%	-14%	-21%	-30%	95%

ponytail es la única variante que recorta cada métrica, y la única que se mantiene totalmente segura al hacerlo. El recorte es mayor donde hay una trampa real de sobre-construcción (selector de fechas de 404 a 23 líneas, selector de color de 287 a 23, porque usa un <input> nativo en vez de un componente) y casi cero en código que ya es mínimo. Método completo, tablas por tarea y limitaciones: benchmarks/results/2026-06-18-agentic.md.

Números anteriores de un solo disparo (generación aislada)

Cinco tareas del día a día, tres modelos, tres variantes (sin skill, caveman, ponytail), diez ejecuciones, mediana reportada. Un prompt, una completación, contando las líneas de la respuesta:

Mediana de líneas de código por variante en Haiku, Sonnet y Opus

Esto mostraba 80-94% menos código. #126 señaló con razón que el baseline del modelo pelado infla su respuesta con prosa y opciones, así que esa diferencia es en parte un artefacto del baseline conversacional. Los números agénticos de arriba son la versión corregida y defendible. Reproduce la corrida de un solo disparo con npx promptfoo eval -c benchmarks/promptfooconfig.yaml.

La regla nunca fue "menos tokens." Es: escribe solo lo que la tarea necesita, y nunca recortes validación, manejo de errores, seguridad ni accesibilidad. El código termina pequeño porque es necesario, no por golf. El menor costo y latencia son un efecto secundario en los modelos que siguen la escalera; un modelo de razonamiento conciso que gasta tokens de pensamiento deliberando los peldaños puede ir al revés (en GPT-5.5 lo hace).

Cómo funciona

Antes de escribir código, el agente se detiene en el primer peldaño que aguanta:

1. ¿Necesita existir esto?        → no: omitirlo (YAGNI)
2. ¿Ya existe en este código?     → reúsalo, no lo reescribas
3. ¿Lo hace la stdlib?            → úsala
4. ¿Es una feature nativa?        → úsala
5. ¿Una dependencia ya instalada? → úsala
6. ¿Cabe en una línea?            → una línea
7. Solo entonces: el mínimo que funciona

La escalera se recorre después de entender el problema, no en su lugar: lee el código que toca el cambio y sigue el flujo real antes de elegir un peldaño. Flojo en la solución, nunca en la lectura.

Flojo, no negligente: la validación en límites de confianza, el manejo de pérdida de datos, la seguridad y la accesibilidad nunca están en riesgo.

Instalación

El mayor esfuerzo que ponytail te va a pedir:

Los plugins de Claude Code y Codex ejecutan dos pequeños lifecycle hooks de Node.js, así que node debe estar en tu PATH (nota para usuarios de Nix/nvm: debe estar en el PATH del shell no-interactivo). Si no lo está, los skills igualmente funcionan, la activación automática simplemente queda en silencio en vez de lanzar un error en cada prompt.

Claude Code

/plugin marketplace add DietrichGebert/ponytail
/plugin install ponytail@ponytail

La app de escritorio no tiene el comando /plugin. Instálala desde la interfaz: Customize, el + junto a los plugins personales, Create plugin and add marketplace, Add from repository, y luego ingresa la URL del repo (gracias @NiklasDHahn, #98).

Codex

codex plugin marketplace add DietrichGebert/ponytail
codex

Abre /plugins, selecciona el marketplace de Ponytail e instala Ponytail. Luego abre /hooks, revisa y autoriza sus dos lifecycle hooks, y empieza un nuevo hilo.

Esta misma instalación cubre también la app de escritorio de Codex: reinicia la app después de instalar y detecta el plugin automáticamente.

GitHub Copilot CLI

copilot plugin marketplace add DietrichGebert/ponytail
copilot plugin install ponytail@ponytail

En una sesión interactiva de Copilot CLI, usa los equivalentes con slash:

/plugin marketplace add DietrichGebert/ponytail
/plugin install ponytail@ponytail

Copilot CLI agrupa los comandos del plugin bajo el nombre del plugin. Por ejemplo:

/ponytail:ponytail ultra
/ponytail:ponytail-review

Pi agent harness

pi install git:github.com/DietrichGebert/ponytail

OpenCode

Agrega esto a opencode.json:

{ "plugin": ["@dietrichgebert/ponytail"] }

O ejecútalo desde un checkout (el plugin reutiliza sus hooks/ y skills/):

{ "plugin": ["./.opencode/plugins/ponytail.mjs"] }

Inyecta el ruleset en cada turno con el nivel activo; agrega los comandos /ponytail (ver Comandos). OpenCode también carga automáticamente el AGENTS.md de este repo, así que las reglas aplican incluso sin el plugin. El plugin agrega los niveles lite/full/ultra/off.

El path ./ se resuelve contra el opencode.json de tu proyecto; para compartir un único checkout entre proyectos, apunta al path absoluto del .mjs (encuentra sus hooks/ y skills/ relativo a su propio archivo).

Gemini CLI

gemini extensions install https://github.com/DietrichGebert/ponytail

Carga el ruleset como contexto permanente en cada sesión y registra los comandos /ponytail; los skills/ también se incluyen, activados cuando una tarea los necesita.

Antigravity CLI

Google está renombrando Gemini CLI a Antigravity CLI (el binario agy); la misma extensión se instala ahí:

agy plugin install https://github.com/DietrichGebert/ponytail

Reutiliza el gemini-extension.json de este repo. Una diferencia: Antigravity convierte los comandos /ponytail en skills, así que los escribes en el chat (por ejemplo /ponytail-review como mensaje) en vez de seleccionarlos de un menú slash. Hasta que la migración se complete (alrededor del 18 de junio de 2026), gemini extensions install también funciona. Para usarlo como regla permanente, coloca el ruleset en .agents/rules/.

CodeWhale

Lee AGENTS.md desde la raíz del proyecto, sin configuración. Copia AGENTS.md a tu proyecto, o ejecuta codewhale desde un checkout de este repo. Eso es todo.

Devin CLI

devin plugins install DietrichGebert/ponytail

Instala ponytail como plugin de Devin; los skills quedan disponibles como /ponytail:ponytail, /ponytail:ponytail-review, etc.

OpenClaw

clawhub install ponytail

Instala ponytail como skill de OpenClaw desde ClawHub; los skills de review, audit, debt y help se instalan igual (clawhub install ponytail-review, etc.). OpenClaw lo aplica en tareas de código y también lo expone como comando /ponytail. Sin ClawHub, copia .openclaw/skills/ponytail a ~/.openclaw/skills/.

Eso fue todo. Él estaría orgulloso. No lo va a decir.

Activo en cada sesión, con un puñado de comandos (ver Comandos). /ponytail ultra existe para cuando el codebase te hizo algo personal. El texto de inicio y de cambio de modo muestra el nivel activo.

Configura el nivel para cada nueva sesión con la variable de entorno PONYTAIL_DEFAULT_MODE (lite/full/ultra/off), o con un campo defaultMode en ~/.config/ponytail/config.json (%APPDATA%\ponytail\config.json en Windows). El default es full.

Cursor, Windsurf, Cline, GitHub Copilot (editor), Aider, Kiro: copia el archivo de reglas correspondiente de este repo (.cursor/rules/, .windsurf/rules/, .clinerules/, .github/copilot-instructions.md, AGENTS.md, .kiro/steering/).

Kiro: copia .kiro/steering/ponytail.md a ~/.kiro/steering/ (global) o .kiro/steering/ en tu proyecto.

Fallback de GitHub Copilot CLI (modo solo instrucciones): lee AGENTS.md y .github/copilot-instructions.md en un proyecto, o copia las reglas a ~/.copilot/copilot-instructions.md para ejecutar ponytail en todos tus proyectos. Esta vía mantiene la guía permanente, pero no agrega switches de modo ni hooks.

VS Code con la extensión Codex lee AGENTS.md, que este repo incluye, así que funciona desde la raíz del repo sin configuración adicional (~/.codex/AGENTS.md hace a Codex global).

Qué archivos corresponden a qué agente: Portabilidad de agentes.

Comandos

Comando	Qué hace
`/ponytail [lite \\| full \\| ultra \\| off]`	Cambia la intensidad, o apágalo. Sin argumento, reporta el nivel actual.
`/ponytail-review`	Revisa el diff actual en busca de sobre-ingeniería y devuelve una lista de qué eliminar.
`/ponytail-audit`	Audita el repo completo en busca de sobre-ingeniería, no solo el diff.
`/ponytail-debt`	Recolecta los atajos marcados con `ponytail:` que dejaste pendientes en un registro, para que "después" no se convierta en "nunca".
`/ponytail-help`	Referencia rápida de los comandos anteriores.

Los comandos requieren un host compatible con skills (Claude Code, Codex, Devin CLI, OpenCode, Gemini, pi, Swival). En Codex son skills; se invocan con @ (@ponytail-review). Los adaptadores de solo instrucciones (Cursor, Windsurf, Cline, Copilot, Kiro, Antigravity) cargan el ruleset permanente sin los comandos.

Desarrollo

Al cambiar el texto compacto de las reglas, mantén alineadas las copias en los adaptadores:

node scripts/check-rule-copies.js
npm test

El paquete de skills de OpenClaw (.openclaw/skills/) se genera desde skills/; ejecuta node scripts/build-openclaw-skills.js después de cambiar un skill, la suite de tests f

Core symbols most depended-on inside this repo

_fail

called by 37

benchmarks/agentic/tasks.py

_find

called by 12

benchmarks/agentic/tasks.py

_ok

called by 12

benchmarks/agentic/tasks.py

_import

called by 9

benchmarks/agentic/tasks.py

normalizeMode

called by 8

hooks/ponytail-config.js

isShellSafe

called by 6

hooks/ponytail-config.js

getDefaultMode

called by 6

hooks/ponytail-config.js

writeHookOutput

called by 6

hooks/ponytail-runtime.js

Shape

Function 159

Languages

Python52%

TypeScript48%

Modules by API surface

benchmarks/agentic/tasks.py25 symbols

benchmarks/agentic/run.py22 symbols

__init__.py16 symbols

hooks/ponytail-config.js10 symbols

benchmarks/correctness.js10 symbols

pi-extension/test/extension.test.js8 symbols

benchmarks/agentic/judge.py8 symbols

pi-extension/index.js6 symbols

benchmarks/benchmark-local.py6 symbols

benchmarks/agentic/complete.py6 symbols

benchmarks/behavior.js5 symbols

hooks/ponytail-runtime.js4 symbols

Dependencies from manifests, versioned

@modelcontextprotocol/sdk1.26.0 · 1×

zod3.23.0 · 1×

For agents

$ claude mcp add ponytail \
  -- python -m otcore.mcp_server <graph>

⬇ download graph artifact