Prompt Pack Template
Usar esta plantilla para cada corrida comparativa Codex/Claude sobre datos LABIS.
Cada campo es obligatorio para que el validador (shared/scripts/check-prompt-pack.sh) pase.
| Campo |
Valor |
| run_id |
YYYY-MM-DD-tema |
| frente |
eppa / exoesqueleto / openpose / manos-agarres |
| objetivo |
Pregunta concreta que la corrida intenta responder |
| modelo_codex |
Modelo y version de Codex usado |
| modelo_claude |
Modelo y version de Claude usado |
| fecha |
YYYY-MM-DD |
| autor |
Quien configura y ejecuta la corrida |
Fuentes
| Archivo |
Path en repo |
SHA-256 |
Sensitivity |
| nombre |
fronts/<frente>/sources/... |
hash |
S0/S1/S2 |
Prompt
<El prompt exacto que se usa para ambas herramientas, identico para comparabilidad>
Output esperado
Describir el formato esperado de la salida:
- Tipo: tabla / texto / JSON / claim-evidence matrix
- Campos minimos que debe contener
- Criterios de completitud
Criterios de evidencia
| Criterio |
Descripcion |
| Trazabilidad |
Todo claim debe citar fuente especifica (archivo + seccion) |
| Reproducibilidad |
Mismos inputs deben producir resultados comparables |
| No-hallucination |
Claims sin fuente se marcan como [UNVERIFIED] |
| Consistencia |
Diferencias Codex/Claude se documentan en comparacion |
Riesgos
| Riesgo |
Mitigacion |
| Datos sensibles en prompt |
Verificar sensitivity < S3 antes de enviar |
| Claim medico sin fuente |
Gate humano antes de usar en informe |
| Sesgo por orden de ejecucion |
Alternar cual modelo corre primero |
Comparacion (post-ejecucion)
| Aspecto |
Codex |
Claude |
Coinciden? |
Notas |
| claim 1 |
|
|
SI/NO |
|
| claim 2 |
|
|
SI/NO |
|
Reviewer
| Campo |
Valor |
| reviewer |
Quien revisa los outputs |
| fecha_review |
YYYY-MM-DD |
| estado |
draft / reviewed / approved |