Una propuesta determinista para la obtención de reglas en problemas de minería de datos

dc.contributor.advisorMata Vázquez, Jacinto
dc.contributor.authorDomínguez Olmedo, Juan Luis
dc.contributor.otherUniversidad de Huelva. Departamento de Tecnologías de la Informaciónes_ES
dc.date.accessioned2019-05-10T12:40:11Z
dc.date.available2019-05-10T12:40:11Z
dc.date.created2019-01-15
dc.date.issued2019
dc.description.abstractEn esta tesis se describen con detalle los trabajos realizados para afrontar, mediante un nuevo enfoque determinista, la generación de reglas para su aplicación a problemas de minería de datos. Concretamente, y dado que la discretización previa de los atributos numéricos de un conjunto de datos, conlleva pérdida de información y posible disminución de la calidad de las reglas obtenidas, se ha estudiado generar directamente reglas combinando intervalos en las condiciones de los atributos numéricos. Para reducir el tiempo de cómputo que cualquier proceso exhaustivo de búsqueda lleva implícito, se han definido diferentes estructuras de datos y se han desarrollado algoritmos para generar y evaluar, de forma eficiente, las reglas del modelo, así como los parámetros apropiados para conseguir un equilibrio entre el tiempo de cómputo y la calidad de las reglas generadas. Se ha adaptado el método propuesto a distintas tareas de minería de datos, concretamente, a la obtención de reglas de asociación, el descubrimiento de subgrupos y la clasificación. Los algoritmos desarrollados se han aplicado en diversos conjuntos de datos de prueba, comparando la bondad de las reglas resultantes con la de otros métodos existentes en la literatura. La significancia de los resultados obtenidos se ha evaluado mediante los apropiados tests estadísticos. El método propuesto ha obtenido unos excelentes resultados, igualando o mejorando los de otros métodos de referencia, tanto deterministas como no deterministas. También se ha aplicado a datos reales, como el caso de un conjunto de datos médicos, donde se consiguió obtener un modelo predictivo interpretable y con gran precisión.
dc.description.abstractThis thesis describes in detail the work done to address, through a new deterministic approach, the generation of rules for its application to data mining problems. Specifically, and given that a previous discretization of the numerical attributes of a dataset, leads to loss of information and possible decrease in the quality of the obtained rules, it has been studied to directly generate rules combining intervals in the conditions of the numerical attributes. In order to reduce the computation time that any exhaustive search process implies, different data structures have been defined and algorithms have been developed to generate and evaluate, in an efficient way, the rules of the model, as well as appropriate parameters to achieve a balance between the computation time and the quality of the rules generated. The proposed method has been adapted to different data mining tasks, specifically, association rules, subgroup discovery, and classification. The developed algorithms have been applied in several test datasets, comparing the quality of the resulting rules with that of other existing methods in the literature. The significance of the results obtained has been evaluated through the appropriate statistical tests. Excellent results were achieved by the proposed method, equaling or improving those of other reference methods, both deterministic and non-deterministic. It has also been applied to real data, such as the case of a medical dataset, where an interpretable predictive model was obtained, also having high accuracy.
dc.description.departmentTecnologías de la Información
dc.identifier.urihttp://hdl.handle.net/10272/16246
dc.language.isospaes_ES
dc.publisherUniversidad de Huelvaes_ES
dc.rightsAtribución-NoComercial-SinDerivadas 3.0 España*
dc.rights.accessRightsopen accesses_ES
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/*
dc.subject.otherInformática
dc.subject.otherInteligencia artificial
dc.subject.otherSoftware
dc.subject.otherAnálisis de datos
dc.subject.otherTécnicas de predicción estadística
dc.subject.otherComputer science
dc.subject.otherArtificial intelligence
dc.subject.otherData analysis
dc.subject.otherStatistical prediction techniques
dc.titleUna propuesta determinista para la obtención de reglas en problemas de minería de datoses_ES
dc.typedoctoral thesises_ES
dspace.entity.typePublication
relation.isAdvisorOfPublicationac76819b-d91a-4158-b947-4a9e827e5e9d
relation.isAdvisorOfPublication.latestForDiscoveryac76819b-d91a-4158-b947-4a9e827e5e9d
relation.isAuthorOfPublication11d4312c-8591-4e26-b971-740ce012d168
relation.isAuthorOfPublication.latestForDiscovery11d4312c-8591-4e26-b971-740ce012d168

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Una_propuesta_determinista.pdf
Size:
11.02 MB
Format:
Adobe Portable Document Format

Collections