Algoritmo divisivo de clustering con determinación automática de componentes

No Thumbnail Available

Date

2014-04-11

Journal Title

Journal ISSN

Volume Title

Publisher

Facultad de Ciencias Exactas, Ingeniería y Agrimensura. Universidad Nacional de Rosario

Abstract

Cluster analysis es el estudio de algoritmos y métodos cuyo objetivo es encontrar una forma conveniente y válida de organizar un conjunto de datos en grupos. Entre sus múltiples aplicaciones se encuentran la segmentación de imágenes, la clasificación automática de documentos o archivos multimedia, la detección de comunidades en redes sociales y la identificación de genes con funciones similares, por nombrar algunas. En este trabajo exploramos soluciones a problemas abiertos del área de cluster analysis y como resultado desarrollamos un nuevo algoritmo de clustering, DHclus, que descubre clusters con formas arbitrarias en los datos, determina automáticamente la cantidad de componentes presentes en los datos (incluso cuando hay clusters a diferentes escalas en un mismo problema) y además selecciona los parámetros que afectan su performance. Además implementamos el algoritmo como un paquete de software libre para el entorno de programación R y se encuentra disponible para toda la comunidad.

Description

Keywords

clustering divisivo, spectral clustering, métricas, test de hipótesis

Citation

http://www.fceia.unr.edu.ar/lcc/t523/