Metadatos de indexación

Evaluation of data balancing techniques. Application to CAD of lung nodules using the LUNA16 framework


 
Dublin Core Elementos de metadatos PKP Metadatos para el documento
 
1. Título Título del documento Evaluation of data balancing techniques. Application to CAD of lung nodules using the LUNA16 framework
 
2. Creador/a Nombre de autor/a, institución, país Alexander Sóñora-Mengana; Centro de Biofísica Médica; Cuba
 
2. Creador/a Nombre de autor/a, institución, país Evgenia Papavasileiou; Vrije Universiteit Brussel, Brussels, Belgium; Grecia
 
2. Creador/a Nombre de autor/a, institución, país Juan García-Naranjo; Vrije Universiteit Brussel, Brussels, Belgium; Cuba
 
2. Creador/a Nombre de autor/a, institución, país Bart Jansen; Vrije Universiteit Brussel, Brussels, Belgium; Bélgica
 
2. Creador/a Nombre de autor/a, institución, país Jef Vandemeulebroucke; Vrije Universiteit Brussel, Brussels, Belgium; Bélgica
 
3. Materia Disciplina(s)
 
3. Materia Palabra/s clave Data balance;Computer Aided Detection;Near-Miss;CNN;Random Under-sample;Tomek links;Self-Organized Map;Random Over-sample;ADASYN;SMOTE;LUNA16
 
4. Descripción Resumen Due to the high incidence of the lung cancer all over the world, computer-aided detection (CAD) systems play an important role in screening. Classification in CAD systems have to deal with highly imbalanced datasets composed by actual nodules and non-nodules structures. The application of data balancing techniques helps the training process of the classifiers making the generation of the classification rules more effective. The purpose of this paper is to compare the performance of different data balancing techniques applied to the classification of lung nodules. According to the reviewed literature, this is the first time that different data balancing methods are evaluated on the problem of lung nodule detection using a large data set. A web-based framework was used to evaluate the different methods applied to a classical CAD system (ETROCAD) presented in the LUNA16 Challenge. In the experiments, data balance using SMOTE and SMOTE-TL lead to the best results, with a score of 0.760 and 0.759 respectively, in comparison to 0.748 when not balancing the data. At the time of writing this paper, the SMOTE-based ETROCAD system have the best score among all the classical systems using handcrafted features in LUNA16 web sit.
 
5. Editorial Institución organizadora, ubicación Universidad Tecnológica de La Habana José Antonio Echeverría
 
6. Colaborador/a Patrocinador(es) VLIR-UOS (Flemish Interuniversity Council-University Cooperation for Development);
 
7. Fecha (DD-MM-AAAA) 2018-10-18
 
8. Tipo Estado y género Artículo revisado por pares
 
8. Tipo Tipo
 
9. Formato Formato de archivo PDF
 
10. Identificador Identificador uniforme de recursos http://rielac.cujae.edu.cu/index.php/rieac/article/view/681
 
11. Fuente Título; vol., núm. (año) Revista Ingeniería Electrónica, Automática y Comunicaciones ISSN: 1815-5928; Vol. 39, Núm. 3 (2018)
 
12. Idioma Español=es en
 
13. Relación Archivos complementarios Carta de presentacion (40KB)
 
14. Cobertura Localización geoespacial, periodo cronológico, muestra de investigación (sexo, edad, etc.)
 
15. Derechos Derechos de autor/a y permisos Copyright (c) 2018 Revista Ingeniería Electrónica, Automática y Comunicaciones ISSN: 1815-5928