Selección de Atributos Considerando Inter-Dependencias

Hdl Handle:
http://hdl.handle.net/11285/572623
Title:
Selección de Atributos Considerando Inter-Dependencias
Issue Date:
01/03/2007
Abstract:
Las bases de datos están creciendo a un ritmo acelerado, propiciado por diversos avances tecnológicos. Esto crea un problema para los algoritmos tradicionales de descubrimiento de conocimiento, los cuales no fueron diseñados para escalar con el tamaño de atributos e instancias, redundando en tiempos excesivos de procesamiento y/o agotamiento de la memoria principal, aÚn en computadoras de gran tamaño. Una estrategia para solucionar lo anterior es la Selección de Atributos, que busca eliminar los atributos irrelevantes y redundantes de una base de datos. Idealmente, la Selección de Atributos reduce el tiempo y la cantidad de memoria necesaria para el procesamiento de los datos. Además es capaz de mantener, e incluso mejorar, la exactitud predictiva del algoritmo de inducción y produce modelos de conocimiento más pequeños que son más fáciles de entender por el usuario final. Aunque existe una gran variedad de métodos para Selección de Atributos, muchos de ellos asumen que los atributos son independientes entre ellos, por lo que excluyen subconjuntos de atributos que resultan relevantes sólo cuando se consideran juntos. En esta tesis se investigan, proponen y experimenta con algoritmos eficientes y eficaces de Selección de Atributos que consideran las inter-dependencias entre los atributos y la clase discreta, empleando una nueva función heurística basada en la entropía n-dimensional. También se analiza y avanza en el caso cuando los atributos son continuos y la clase discreta, usando una nueva función heurística basada en la Ganancia de Información y el determinante de la matriz de covarianzas de los atributos. En los experimentos realizados, los algoritmos propuestos muestran, en la mayoría de los casos, igualar o superar a métodos tradicionales de Selección de Atributos en cuanto a reducción del nÚmero de atributos y exactitud predictiva, con un tiempo de procesamiento competitivo. En esta tesis también se analizan y discuten variaciones de los algoritmos propuestos así como sus limitaciones, y se enfatizan las direcciones futuras de investigación.
Keywords:
Hill Climbing; Algoritmos; Inter-Dependecias
Degree Program:
Programa de Graduados en informática y computación
Advisors:
Dr. Eduardo F. Morales Manzanares
Committee Member / Sinodal:
Dr. Guillermo Rodríguez Ortíz
Degree Level:
Doctor en ciencias computacionales
School:
Escuela de Graduados en Ciencias Computacionales
Campus Program:
Campus Cuernavaca
Discipline:
Ingeniería y Ciencias Aplicadas / Engineering & Applied Sciences
Appears in Collections:
Ciencias Exactas

Full metadata record

DC FieldValue Language
dc.contributor.advisorDr. Eduardo F. Morales Manzanareses
dc.creatorMejía Lavalle, Manuelen
dc.date.accessioned2015-08-17T11:36:47Zen
dc.date.available2015-08-17T11:36:47Zen
dc.date.issued01/03/2007-
dc.identifier.urihttp://hdl.handle.net/11285/572623en
dc.description.abstractLas bases de datos están creciendo a un ritmo acelerado, propiciado por diversos avances tecnológicos. Esto crea un problema para los algoritmos tradicionales de descubrimiento de conocimiento, los cuales no fueron diseñados para escalar con el tamaño de atributos e instancias, redundando en tiempos excesivos de procesamiento y/o agotamiento de la memoria principal, aÚn en computadoras de gran tamaño. Una estrategia para solucionar lo anterior es la Selección de Atributos, que busca eliminar los atributos irrelevantes y redundantes de una base de datos. Idealmente, la Selección de Atributos reduce el tiempo y la cantidad de memoria necesaria para el procesamiento de los datos. Además es capaz de mantener, e incluso mejorar, la exactitud predictiva del algoritmo de inducción y produce modelos de conocimiento más pequeños que son más fáciles de entender por el usuario final. Aunque existe una gran variedad de métodos para Selección de Atributos, muchos de ellos asumen que los atributos son independientes entre ellos, por lo que excluyen subconjuntos de atributos que resultan relevantes sólo cuando se consideran juntos. En esta tesis se investigan, proponen y experimenta con algoritmos eficientes y eficaces de Selección de Atributos que consideran las inter-dependencias entre los atributos y la clase discreta, empleando una nueva función heurística basada en la entropía n-dimensional. También se analiza y avanza en el caso cuando los atributos son continuos y la clase discreta, usando una nueva función heurística basada en la Ganancia de Información y el determinante de la matriz de covarianzas de los atributos. En los experimentos realizados, los algoritmos propuestos muestran, en la mayoría de los casos, igualar o superar a métodos tradicionales de Selección de Atributos en cuanto a reducción del nÚmero de atributos y exactitud predictiva, con un tiempo de procesamiento competitivo. En esta tesis también se analizan y discuten variaciones de los algoritmos propuestos así como sus limitaciones, y se enfatizan las direcciones futuras de investigación.es
dc.language.isoesen
dc.rightsOpen Accessen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.titleSelección de Atributos Considerando Inter-Dependenciases
dc.typeTesis de Doctoradoes
thesis.degree.grantorInstituto Tecnológico y de Estudios Superiores de Monterreyes
thesis.degree.levelDoctor en ciencias computacionaleses
dc.contributor.committeememberDr. Guillermo Rodríguez Ortízes
thesis.degree.disciplineEscuela de Graduados en Ciencias Computacionaleses
thesis.degree.namePrograma de Graduados en informática y computaciónes
dc.subject.keywordHill Climbinges
dc.subject.keywordAlgoritmoses
dc.subject.keywordInter-Dependeciases
thesis.degree.programCampus Cuernavacaes
dc.subject.disciplineIngeniería y Ciencias Aplicadas / Engineering & Applied Scienceses
All Items in REPOSITORIO DEL TECNOLOGICO DE MONTERREY are protected by copyright, with all rights reserved, unless otherwise indicated.