Codex / Claude LABIS Runbook¶
Fecha: 2026-05-07 (actualizado)
Alcance¶
Usar este monorepo para corridas comparables entre Codex y Claude sobre material LABIS: EPPA, exoesqueleto, OpenPose y manos/agarres.
Prompt Packs¶
Cada corrida usa un prompt pack que define objetivo, fuentes, prompt, formato de salida y criterios.
- Template:
shared/runbooks/prompt-pack-template.md(markdown) /shared/runbooks/prompt-pack-template.json(JSON validable) - Packs disponibles:
shared/runbooks/prompt-packs/ exoesqueleto-informe-cristina.md— analisis informe Cristinaopenpose-claims-validation.md— validacion claims OpenPoseeppa-matlab-python-parity.md— paridad MATLAB-Pythonmanos-taxonomia.md— taxonomia agarres- Validadores:
bash shared/scripts/check-prompt-pack.sh/python3 shared/scripts/validate_prompt_pack.py
Proceso¶
- Elegir o crear prompt pack desde template.
- Ubicar la fuente cruda en
fronts/<frente>/sources/. - Registrar hash y origen en el manifest local del frente.
- Crear carpeta de corrida:
fronts/<frente>/runs/YYYY-MM-DD-tema/ ├── prompt-pack.json # prompt pack validable (o prompt.md) ├── input/ # fuentes usadas (o symlinks) ├── outputs/ │ ├── codex/ # outputs de Codex por prompt │ └── claude/ # outputs de Claude por prompt ├── review/ │ ├── comparison.md # diferencias y coincidencias │ └── review.md # estado de revision y decisiones - Validar con
python3 shared/scripts/validate_prompt_pack.py. - Ejecutar ambos modelos con el mismo prompt.
- Documentar comparacion en
review/comparison.md. - Promover solo conclusiones validadas a
fronts/<frente>/docs/.
Campos requeridos del prompt pack (JSON)¶
| Campo | Descripcion |
|---|---|
objetivo |
Que se busca obtener |
fuentes |
Lista de archivos fuente |
modelo |
claude, codex, o ambos |
fecha |
YYYY-MM-DD |
output_esperado |
Formato y contenido esperado |
criterios_evidencia |
Como se valida el output |
riesgos |
Que puede salir mal |
prompts |
Array con id, texto, contexto |
Guardrails¶
- Output de AI no es evidencia si no tiene fuente trazable.
- Material de pacientes queda privado, con nombres anonimizados (ver
shared/privacy-policy.md). - Toda conclusion medica o cientifica necesita fila claim-evidence.
- Las imagenes sinteticas solo sirven para smoke tests de pipeline.
- NUNCA enviar resultados a Cristina/Monica sin validacion humana.
- No enviar archivos S3-restricted a servicios externos.
Corridas activas¶
| Corrida | Frente | Estado |
|---|---|---|
2026-05-07-informe-diego |
exoesqueleto | Claude ejecutado, Codex BLOCKED (#25) |
Primeras corridas sugeridas¶
- Exoesqueleto: procesar informe y variables pendientes de Cristina.
- OpenPose: validar cada claim del informe enviado a Cristina/Monica.
- EPPA: verificar paridad MATLAB-Python.
- Manos y agarres: taxonomia y matriz objeto-agarre-camara antes de modelos.