Saltar a contenido

Codex / Claude LABIS Runbook

Fecha: 2026-05-07 (actualizado)

Alcance

Usar este monorepo para corridas comparables entre Codex y Claude sobre material LABIS: EPPA, exoesqueleto, OpenPose y manos/agarres.

Prompt Packs

Cada corrida usa un prompt pack que define objetivo, fuentes, prompt, formato de salida y criterios.

  • Template: shared/runbooks/prompt-pack-template.md (markdown) / shared/runbooks/prompt-pack-template.json (JSON validable)
  • Packs disponibles: shared/runbooks/prompt-packs/
  • exoesqueleto-informe-cristina.md — analisis informe Cristina
  • openpose-claims-validation.md — validacion claims OpenPose
  • eppa-matlab-python-parity.md — paridad MATLAB-Python
  • manos-taxonomia.md — taxonomia agarres
  • Validadores: bash shared/scripts/check-prompt-pack.sh / python3 shared/scripts/validate_prompt_pack.py

Proceso

  1. Elegir o crear prompt pack desde template.
  2. Ubicar la fuente cruda en fronts/<frente>/sources/.
  3. Registrar hash y origen en el manifest local del frente.
  4. Crear carpeta de corrida:
    fronts/<frente>/runs/YYYY-MM-DD-tema/
    ├── prompt-pack.json  # prompt pack validable (o prompt.md)
    ├── input/            # fuentes usadas (o symlinks)
    ├── outputs/
    │   ├── codex/        # outputs de Codex por prompt
    │   └── claude/       # outputs de Claude por prompt
    ├── review/
    │   ├── comparison.md # diferencias y coincidencias
    │   └── review.md     # estado de revision y decisiones
    
  5. Validar con python3 shared/scripts/validate_prompt_pack.py.
  6. Ejecutar ambos modelos con el mismo prompt.
  7. Documentar comparacion en review/comparison.md.
  8. Promover solo conclusiones validadas a fronts/<frente>/docs/.

Campos requeridos del prompt pack (JSON)

Campo Descripcion
objetivo Que se busca obtener
fuentes Lista de archivos fuente
modelo claude, codex, o ambos
fecha YYYY-MM-DD
output_esperado Formato y contenido esperado
criterios_evidencia Como se valida el output
riesgos Que puede salir mal
prompts Array con id, texto, contexto

Guardrails

  • Output de AI no es evidencia si no tiene fuente trazable.
  • Material de pacientes queda privado, con nombres anonimizados (ver shared/privacy-policy.md).
  • Toda conclusion medica o cientifica necesita fila claim-evidence.
  • Las imagenes sinteticas solo sirven para smoke tests de pipeline.
  • NUNCA enviar resultados a Cristina/Monica sin validacion humana.
  • No enviar archivos S3-restricted a servicios externos.

Corridas activas

Corrida Frente Estado
2026-05-07-informe-diego exoesqueleto Claude ejecutado, Codex BLOCKED (#25)

Primeras corridas sugeridas

  • Exoesqueleto: procesar informe y variables pendientes de Cristina.
  • OpenPose: validar cada claim del informe enviado a Cristina/Monica.
  • EPPA: verificar paridad MATLAB-Python.
  • Manos y agarres: taxonomia y matriz objeto-agarre-camara antes de modelos.