EPPA Source Inventory¶
Repository activo¶
larancibia/labis-eppa-software (monorepo) es el repositorio unico. Los legacy repos 000072_ortho_posture y ortho_posture estan congelados y referenciados como fuente en el manifiesto.
Manifiesto¶
docs/source-manifest.tsv — TSV con 6 columnas:
| Columna | Descripcion |
|---|---|
sha256 |
Hash SHA-256 del archivo |
path |
Ruta relativa desde fronts/eppa/ |
category |
Tipo: matlab-code, matlab-gui, matlab-data, patient-image, patient-data, clinical-doc, reference-doc, academic-paper, video, e2e-video, legacy-repo, conversation, admin-doc, other |
origin |
Procedencia: gmail/cristina-oleari, drive, local/legacy-000072, local/legacy-ortho, repo, derived |
sensitivity |
Nivel: public, internal, clinical-phi, clinical-deidentified |
destination |
Estado: canonical, duplicate, lfs-candidate, private-storage, archive, defer |
Estadisticas (2026-05-07)¶
- 149 entradas totales
- 11 duplicados (mismo SHA-256 en rutas distintas, marcados como
duplicate) - 79 archivos clinical-phi (imagenes y datos de pacientes)
- 75 candidatos a LFS (binarios grandes: imagenes, videos, .mat)
- 63 canonicos (fuente unica)
Fuentes por origen¶
| Origen | Cantidad | Notas |
|---|---|---|
| local/legacy-ortho | 85 | Repo ortho_posture congelado |
| gmail/cristina-oleari | 42 | Adjuntos de la Dra. Oleari |
| local/legacy-000072 | 21 | Repo 000072_ortho_posture congelado |
| drive | 1 | Video presentacion MATLAB |
Duplicados detectados¶
Los archivos duplicados comparten el mismo SHA-256 en rutas distintas. El primero encontrado es canonical, los demas duplicate. Ejemplo:
DatosSujeto- con valores normalidad V2- julio 2024.xlsx: 3 copias (gmail thread 195dcc + 19b74b + legacy-ortho)OPSEIHIS21023_spa.pdf: 2 copias (gmail thread 199f43 + 19b74b)Circular N1_Jornadas_2026_SI_FADU_UBA.pdf: 2 copiasIDEA MON.docx: 2 copias
Privacidad y LFS¶
Los archivos marcados como clinical-phi contienen informacion identificable de pacientes. Para uso en CI/tests, estos archivos se trazan via LFS con acceso controlado. Antes de agregar nuevos datos clinicos al repo, verificar consentimiento.
Validador¶
python3 scripts/validate_source_manifest.py
Verifica: header, SHA-256 valido, campos no vacios, vocabularios controlados.