Base de imágenes digitalizadas y anotadas de PAPs 

Esta base de datos forma parte del proyecto “Estudio de factibilidad para el desarrollo de un sistema de diagnóstico a distancia y en tiempo real de muestras citológicas de extendidos cervicovaginales fijados (PAPs) asistido por Inteligencia Artificial (IA)”, proyecto financiado por el Centro de Inteligencia Artificial y Salud para América Latina y el Caribe (CLIAS) con el apoyo del Centro Internacional de Investigaciones para el Desarrollo de Canadá (IDRC). El proyecto es una colaboración entre la Facultad de Cs. Exactas y Naturales de la Universidad de Buenos Aires, la Universidad Torcuato Di Tella, el Instituto Tecnológico de Buenos Aires y el Hospital Bernardino Rivadavia, CABA, Argentina.

Descripción general: 

La base de datos recopila 100 parches obtenidos de alrededor de 60 muestras de Papanicolaou anonimizadas del repositorio permanente del Servicio de Anatomía Patológica del Hospital Bernardino Rivadavia. Estas muestras están globalmente categorizadas como LSIL, ASC-H, ASC-US, HSIL y CARCINOMA.  Los portaobjetos se  digitalizan con un scanner Grundium Ocus 40 para obtener imágenes con un aumento 40X de las regiones de interés. Estas regiones se subdividen para obtener parches con un tamaño de 1024 x 1024 (mini-parches) y resolución de 0.25 𝜇m/píxel (dato provisto por el fabricante del scanner). 

Las imágenes contienen 5 tipos diferentes de células (pre)cancerosas (CARCINOMA, HSIL y  LSIL, ASC-H y ASC-US) y 3 categorías de célula sin lesión (NLIM, ENFO, INFL).

Descripción de los archivos del Dataset:

  1. Imágenes en formato “.png” de mini-parches con una denominación que contiene la etiqueta del diagnóstico de la muestra de la que proviene: CARCINOMA, HSIL, LSIL, etc.
  2. Archivos de texto en formatos “.csv” y “.json” conteniendo la información sobre ubicación en la imagen correspondiente de las células anotadas: coordenadas de la posición del núcleo y de la clase. Se incluyen la anotación de 4 anotaciones independientes como archivos separados.
  3. Para cada parche es posible exportar un archivo “.zip” conteniendo la imagen y la anotación.

    Participan en la confección de la base de datos: 

    Luciana Bruno, Emmanuel Iarussi, Viviana Siless, Jimena Medel, Estefanía Uelf, Alicia Dos Santos, Noemí Buosi, Rosana Vargas, Bruno Volcovinsky, Juliana Reves ,  Hugo Massarolli, Paula Perez Bianchi, Malena Vázquez Currié, Sol Anselmo y Diego Brunetti 

    E-mail de contacto: lucianabrun@gmail.com