Codex / Claude LABIS Runbook¶

Fecha: 2026-05-07 (actualizado)

Alcance¶

Usar este monorepo para corridas comparables entre Codex y Claude sobre material LABIS: EPPA, exoesqueleto, OpenPose y manos/agarres.

Prompt Packs¶

Cada corrida usa un prompt pack que define objetivo, fuentes, prompt, formato de salida y criterios.

Template: shared/runbooks/prompt-pack-template.md (markdown) / shared/runbooks/prompt-pack-template.json (JSON validable)
Packs disponibles: shared/runbooks/prompt-packs/
exoesqueleto-informe-cristina.md — analisis informe Cristina
openpose-claims-validation.md — validacion claims OpenPose
eppa-matlab-python-parity.md — paridad MATLAB-Python
manos-taxonomia.md — taxonomia agarres
Validadores: bash shared/scripts/check-prompt-pack.sh / python3 shared/scripts/validate_prompt_pack.py

Proceso¶

Elegir o crear prompt pack desde template.
Ubicar la fuente cruda en fronts/<frente>/sources/.
Registrar hash y origen en el manifest local del frente.

Crear carpeta de corrida:

fronts/<frente>/runs/YYYY-MM-DD-tema/
├── prompt-pack.json  # prompt pack validable (o prompt.md)
├── input/            # fuentes usadas (o symlinks)
├── outputs/
│   ├── codex/        # outputs de Codex por prompt
│   └── claude/       # outputs de Claude por prompt
├── review/
│   ├── comparison.md # diferencias y coincidencias
│   └── review.md     # estado de revision y decisiones

Validar con python3 shared/scripts/validate_prompt_pack.py.
Ejecutar ambos modelos con el mismo prompt.
Documentar comparacion en review/comparison.md.
Promover solo conclusiones validadas a fronts/<frente>/docs/.

Campos requeridos del prompt pack (JSON)¶

Campo	Descripcion
`objetivo`	Que se busca obtener
`fuentes`	Lista de archivos fuente
`modelo`	claude, codex, o ambos
`fecha`	YYYY-MM-DD
`output_esperado`	Formato y contenido esperado
`criterios_evidencia`	Como se valida el output
`riesgos`	Que puede salir mal
`prompts`	Array con id, texto, contexto

Guardrails¶

Output de AI no es evidencia si no tiene fuente trazable.
Material de pacientes queda privado, con nombres anonimizados (ver shared/privacy-policy.md).
Toda conclusion medica o cientifica necesita fila claim-evidence.
Las imagenes sinteticas solo sirven para smoke tests de pipeline.
NUNCA enviar resultados a Cristina/Monica sin validacion humana.
No enviar archivos S3-restricted a servicios externos.

Corridas activas¶

Corrida	Frente	Estado
`2026-05-07-informe-diego`	exoesqueleto	Claude ejecutado, Codex BLOCKED (#25)

Primeras corridas sugeridas¶

Exoesqueleto: procesar informe y variables pendientes de Cristina.
OpenPose: validar cada claim del informe enviado a Cristina/Monica.
EPPA: verificar paridad MATLAB-Python.
Manos y agarres: taxonomia y matriz objeto-agarre-camara antes de modelos.