Red neuronal convolucional en un ambiente pseudo-distribuido para la clasificación de radiografías de pacientes con neumonía.
En los últimos años, se ha presenciado un incremento en el volumen de datos médicos, llegando a generar cientos de datos provenientes de distintas fuentes [1]. Aunado a eso, a pesar de que la capacidad de almacenamiento ha aumentado considerablemente, no ha sucedido lo mismo con la velocidad de proc...
Saved in:
Main Author: | |
---|---|
Other Authors: | |
Format: | Trabajo recepcional licenciatura |
Language: | spa |
Published: |
Universidad Autónoma de Ciudad Juárez
2019
|
Subjects: | |
Online Access: | http://hdl.handle.net/20.500.11961/5407 |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Summary: | En los últimos años, se ha presenciado un incremento en el volumen de datos médicos, llegando a generar cientos de datos provenientes de distintas fuentes [1]. Aunado a eso, a pesar de que la capacidad de almacenamiento ha aumentado considerablemente, no ha sucedido lo mismo con la velocidad de procesamiento de datos [2]. Esto ha propiciado el surgimiento de tecnologías novedosas como Apache Spark, el cual es un marco de trabajo que permite el análisis de datos en memoria basado en el procesamiento distribuido [3]. Sin embargo, por ser una tecnología relativamente nueva, tanto Spark como las
herramientas que se han desarrollado como complemento, no cuentan con documentación ordenada y actualizada. El objetivo general de este proyecto se estableció en cómo implementar una red neuronal convolucional en un ambiente pseudo-distribuido para la clasificación automática de radiografías de pacientes con neumonía. Para ello, se comenzó buscando la manera de configurar la red neuronal convolucional en Spark, probando con diferentes librerías, entre ellas dist-keras, que fue la que finalmente se utilizó en el presente proyecto. El proceso de instalación y configuración se documentó, generando una guía. Por otra parte, se pudo explorar cómo se comporta la red neuronal convolucional en Spark conforme se va aumentando el tamaño de la base de datos. Mientras que el tiempo iba mostrando un incremento conforme iba creciendo la base de datos, las métricas de exactitud, precisión y sensibilidad mostraron un comportamiento no estable. |
---|