Saltar a contenido

EPPA Source Inventory

Repository activo

larancibia/labis-eppa-software (monorepo) es el repositorio unico. Los legacy repos 000072_ortho_posture y ortho_posture estan congelados y referenciados como fuente en el manifiesto.

Manifiesto

docs/source-manifest.tsv — TSV con 6 columnas:

Columna Descripcion
sha256 Hash SHA-256 del archivo
path Ruta relativa desde fronts/eppa/
category Tipo: matlab-code, matlab-gui, matlab-data, patient-image, patient-data, clinical-doc, reference-doc, academic-paper, video, e2e-video, legacy-repo, conversation, admin-doc, other
origin Procedencia: gmail/cristina-oleari, drive, local/legacy-000072, local/legacy-ortho, repo, derived
sensitivity Nivel: public, internal, clinical-phi, clinical-deidentified
destination Estado: canonical, duplicate, lfs-candidate, private-storage, archive, defer

Estadisticas (2026-05-07)

  • 149 entradas totales
  • 11 duplicados (mismo SHA-256 en rutas distintas, marcados como duplicate)
  • 79 archivos clinical-phi (imagenes y datos de pacientes)
  • 75 candidatos a LFS (binarios grandes: imagenes, videos, .mat)
  • 63 canonicos (fuente unica)

Fuentes por origen

Origen Cantidad Notas
local/legacy-ortho 85 Repo ortho_posture congelado
gmail/cristina-oleari 42 Adjuntos de la Dra. Oleari
local/legacy-000072 21 Repo 000072_ortho_posture congelado
drive 1 Video presentacion MATLAB

Duplicados detectados

Los archivos duplicados comparten el mismo SHA-256 en rutas distintas. El primero encontrado es canonical, los demas duplicate. Ejemplo:

  • DatosSujeto- con valores normalidad V2- julio 2024.xlsx: 3 copias (gmail thread 195dcc + 19b74b + legacy-ortho)
  • OPSEIHIS21023_spa.pdf: 2 copias (gmail thread 199f43 + 19b74b)
  • Circular N1_Jornadas_2026_SI_FADU_UBA.pdf: 2 copias
  • IDEA MON.docx: 2 copias

Privacidad y LFS

Los archivos marcados como clinical-phi contienen informacion identificable de pacientes. Para uso en CI/tests, estos archivos se trazan via LFS con acceso controlado. Antes de agregar nuevos datos clinicos al repo, verificar consentimiento.

Validador

python3 scripts/validate_source_manifest.py

Verifica: header, SHA-256 valido, campos no vacios, vocabularios controlados.