Estas en: Principal > ARTÍCULOS IDT > Detalle del producto
Análisis comparativo del Índice Entrópico en Bases de Datos Utilizando la Entropía de Tsallis y Renyi en Árboles de clasificación C4.5

El aprendizaje automático brinda a los sistemas la capacidad de aprender con base a la experiencia. Esto se logra mediante la generación de modelos de aprendizaje automático. Uno de los modelos más usados es el aprendizaje supervisado, el cual emplea modelos de clasificación que permiten que un programa informático aprenda de los datos de entrada para obtener clasificaciones. Los datos de entrada y salida son etiquetados para su clasificación, proporcionando una base de aprendizaje para el procesamiento futuro de datos. El algoritmo C4.5 se utiliza para obtener modelos de clasificación (de una base de datos), llamados árboles de decisión. Este algoritmo utiliza el concepto de entropía definido por Shannon para calcular la relación de ganancia. En este estudio se usan las entropías de Tsallis y Renyi (en lugar de Shannon) para construir un árbol de decisiones. En trabajos anteriores, estas entropías han mostrado mejores resultados que Shannon. Estas entropías tienen un parámetro adicional q que se usa para afectar las distribuciones de probabilidad. Esta investigación se centra en desarrollar un método que obtiene el valor de q que se aplicará para calcular la relación de ganancia de información en el algoritmo C4.5 mediante entropías de Tsallis y Renyi. El método obtiene una representación de red a partir de una vista minable; luego, se calcula el algoritmo de cobertura de cajas para obtener el número mínimo de cajas para cubrir la red. El cálculo del parámetro q dependerá de la cobertura mínima de la red. Los resultados muestran que el método para obtener q en algunos casos mejora la clasificación y en otros no la demerita, en comparación con el algoritmo C4.5 clásico.
Palabras clave: Algoritmo C4.5, Tsallis, Renyi, entropías paramétricas, índice entrópico.