Examinando por Autor "Granitto, Pablo M."
Mostrando 1 - 9 de 9
Resultados por página
Opciones de ordenación
Ítem Acceso Abierto Adaptación de arquitecturas profundas a problemas no estacionarios(Facultad de Ciencias Exactas, Ingeniería y Agrimensura. Universidad Nacional de Rosario, 2013-03-22) Morelli, Leonardo R.; Grinblat, Guillermo L.; Granitto, Pablo M.; Granitto, Pablo M.En Aprendizaje Automatizado, la mayoría de los métodos de análisis de datos utilizados asumen como premisa básica la estacionaridad de los mismos (es decir, que el fenómeno bajo análisis no cambia en el tiempo). Sin embargo, muchos sistemas reales de gran interés práctico son claramente no estacionarios como por ejemplo cualquier propiedad relacionada a la meteorología o el problema de detección temprana de fallas en líneas de producción. Otra característica que presentan estos métodos es que se basan en lo que puede definirse como arquitecturas poco profundas (Redes Neuronales con una capa oculta, SVM, Árboles de Decisión, etc.), aunque desde hace bastante tiempo se sabe que las arquitecturas profundas, como las Stacked Restricted Boltzmann Machines (SRBM), pueden ser mucho más eficientes a la hora de representar ciertas funciones. En este trabajo se estudia el rendimiento de estas arquitecturas en el ámbito de los problemas no estacionarios y su adaptación a los mismos. Para ello se propone una forma en que se puede integrar la información aportada por los datos antiguos al entrenamiento de un modelo de mayor profundidad que al mismo tiempo sea capaz de adaptarse rápidamente a cambios observados. Para validar la nueva técnica se compara su desempeño con métodos tradicionales sobre problemas no estacionarios diseñados a partir de dos datasets ampliamente usados y conocidos, MNIST y NORB.Ítem Acceso Abierto Algoritmo divisivo de clustering con determinación automática de componentes(Facultad de Ciencias Exactas, Ingeniería y Agrimensura. Universidad Nacional de Rosario, 2014-04-11) Vidal, Erica; Bayá, Ariel; Granitto, Pablo M.Cluster analysis es el estudio de algoritmos y métodos cuyo objetivo es encontrar una forma conveniente y válida de organizar un conjunto de datos en grupos. Entre sus múltiples aplicaciones se encuentran la segmentación de imágenes, la clasificación automática de documentos o archivos multimedia, la detección de comunidades en redes sociales y la identificación de genes con funciones similares, por nombrar algunas. En este trabajo exploramos soluciones a problemas abiertos del área de cluster analysis y como resultado desarrollamos un nuevo algoritmo de clustering, DHclus, que descubre clusters con formas arbitrarias en los datos, determina automáticamente la cantidad de componentes presentes en los datos (incluso cuando hay clusters a diferentes escalas en un mismo problema) y además selecciona los parámetros que afectan su performance. Además implementamos el algoritmo como un paquete de software libre para el entorno de programación R y se encuentra disponible para toda la comunidad.Ítem Acceso Abierto Búsqueda de mejoras en la detección automática de estrellas variables(Facultad de Ciencias Exactas, Ingeniería y Agrimensura. Universidad Nacional de Rosario, 2021-05) Rodríguez, Jeremías; Granitto, Pablo M.; Cabral, Juan B.La astronomía está atravesando una profunda transformación debido al desarrollo de modernos telescopios terrestres y satelitales, que han fomentado la realización de enormes relevamientos astronómicos. Ante la abrumadora cantidad y calidad de los datos generados, se vuelve imprescindible el uso de procedimientos automatizados. Consecuentemente, diversas técnicas de aprendizaje automatizado y minería de datos surgen como una elección natural a la hora de analizar y extraer información de modernos datasets astronómicos. En este trabajo se hará uso de mediciones generadas por el relevamiento VVV del infrarrojo cercano (realizado en Parnal, Chile), que relevó aproximadamente 109 estrellas durante un período de 5 años. Se aplicarán diversas técnicas de aprendizaje automatizado con el objeto de identificar estrellas de tipo RR Lyrae, las cuales son extremadamente valiosas pues permiten estimar distancias a viejas poblaciones estelares. En concreto, se hará uso de clasificadores de tipo Random Forest y Support Vector Machine, haciendo ́énfasis en comprender por qué los primeros parecen tener significativamente mejor performance en este tipo de datasets astronómicos.Ítem Acceso Abierto Clustering gene expression data with a penalized graph-based metric(BioMed Central, 2011-01-04) Bayá, Ariel E.; Granitto, Pablo M.Background The search for cluster structure in microarray datasets is a base problem for the so-called "-omic sciences". A difficult problem in clustering is how to handle data with a manifold structure, i.e. data that is not shaped in the form of compact clouds of points, forming arbitrary shapes or paths embedded in a high-dimensional space, as could be the case of some gene expression datasets. Results In this work we introduce the Penalized k-Nearest-Neighbor-Graph (PKNNG) based metric, a new tool for evaluating distances in such cases. The new metric can be used in combination with most clustering algorithms. The PKNNG metric is based on a two-step procedure: first it constructs the k-Nearest-Neighbor-Graph of the dataset of interest using a low k-value and then it adds edges with a highly penalized weight for connecting the subgraphs produced by the first step. We discuss several possible schemes for connecting the different sub-graphs as well as penalization functions. We show clustering results on several public gene expression datasets and simulated artificial problems to evaluate the behavior of the new metric. Conclusions In all cases the PKNNG metric shows promising clustering results. The use of the PKNNG metric can improve the performance of commonly used pairwise-distance based clustering methods, to the level of more advanced algorithms. A great advantage of the new procedure is that researchers do not need to learn a new method, they can simply compute distances with the PKNNG metric and then, for example, use hierarchical clustering to produce an accurate and highly interpretable dendrogram of their high-dimensional data.Ítem Acceso Abierto Discriminant models based on sensory evaluations: Single assessors versus panel average(Elsevier B.V., 2008-09) Granitto, Pablo M.; Biasioli, Franco; Endrizzi, Isabella; Gasperi, FlaviaProduct classification based on sensory evaluations can play an important role in quality control or typicality assessment. Unfortunately its real world applications face the difficulties related to the cost of a proper sensory approach. To partially overcome these issues we propose to build discriminant models based on the evaluation of single assessors and develop an appropriate method to combine them. We compare this new strategy with the more traditional one based on the panel average. We consider as applicative examples two datasets obtained from the sensory assessment of diverse cheese typologies from North Italy by two different panels. Also, we apply diverse, innovative and noise-resistant discriminant methods (random forest, penalized discriminant analysis and discriminant partial least squares) to show that our new strategy based on modeling each individual assessor is efficient and that this result is independent of the classifier being used. The main finding of our work is that using noise-resistant multivariate methods, product discrimination based on the combination of independent models built for each assessor is never worse than discrimination based on panel average and that the error reduction is higher in the case of low consonance between assessors. Experiments on the same datasets adding random uniform values (noise) with different intensities support these findings. We also discuss a demonstrative experiment using different sets of attributes for each assessor. Overall, our results suggest that, if the goal is product classification, the consonance among assessors or even the use of the same vocabulary seem not necessary, the key factor being the discrimination capability and repeatability of each judge.Ítem Acceso Abierto Reconocimiento de Escritura Manuscrita (Online Handwriting Recognition)(Facultad de Ciencias Exactas, Ingeniería y Agrimensura. Universidad Nacional de Rosario, 2011-09-05) Speciale, Pablo; Gómez, Juan Carlos; Granitto, Pablo M.Este trabajo tiene como objetivo reconocer escritura manuscrita obtenida digitalmente como secuencias de puntos de una manera robusta; ésto es, reconocer trazos indistintamente de que sean dígitos, letras o símbolos matemáticos. Se probaron diferentes métodos basados en la misma idea: tratar las secuencias de puntos como curvas continuas, lo cual es posible aproximando los trazos mediante bases de polinomios ortogonales. Se probará que dichas aproximaciones caracterizan muy bien a los trazos, permitiendo alcanzar una alta precisión en el reconocimiento, y eficiencia computacional. Se obtuvieron buenos resultados en dos bases de datos diferentes, una de dígitos y otra de letras.Ítem Acceso Abierto Selección de variables en problemas anchos con alta correlación(Facultad de Ciencias Exactas, Ingeniería y Agrimensura. Universidad Nacional de Rosario, 2014-05-16) Di Masso, Mauro; Granitto, Pablo M.El aprendizaje automatizado es un área de la inteligencia artificial que ha estado en auge desde hace ya varios años. Su utilidad en la creación de modelos de predicción en base a observaciones ha generado el surgimiento de múltiples métodos de entrenamiento. Sin embargo, la complejidad de los problemas de hoy en día los hace impracticables por el mero número de variables en juego (problemas anchos). Los métodos de selección de variables ayudan a corregir esto eliminando de la ecuación variables irrelevantes y redundantes que dificultan tanto el modelado como su interpretación. En esta tesina se analiza la problemática de la correlación entre variables en problemas anchos considerando algoritmos recientes y se presenta uno propio, teniendo no sólo en cuenta la selección de variables independientes y relevantes sino también la estabilidad de la misma.Ítem Acceso Abierto Selección de variables en problemas multiclase(FCEIA (Facultad de Ciencias Exactas, Ingenieria y Agrimensura). Universidad Nacional de Rosario, 2009-03-27) Burgos, Andrés C.; Granitto, Pablo M.La selección de variables es una técnica de preprocesado comúnmente usada en conjuntos de datos de alta dimensionalidad. Tiene como propósito reducir la dimensión del espacio de variables, eliminar variables irrelevantes o redundantes, mejorar la eficiencia de los algoritmos de aprendizaje e incrementar la interpretabilidad de los modelos construidos. En este trabajo se introduce una nueva técnica de selección de variables para problemas multiclase. La técnica es una extensión del popular algoritmo RFE, consistente en resolver el problema de clasificación multiclase con una combinación One Vs. All de clasificadores binarios, y seleccionar luego variables en cada uno de los subproblemas creados por el OVA usando RFE. Usando datos reales de genómica y espectrometría de masa, y varios clasificadores para construir los rankings, se analiza en detalle la performance y estabilidad del nuevo método y se lo compara con el método RFE tradicional.Ítem Acceso Abierto Time–Adaptive Support Vector Machines(Asociación Española de Inteligencia Artificial, 2008) Grinblat, Guillermo; Granitto, Pablo M.; Ceccatto, AlejandroIn this work we propose an adaptive classification method able both to learn and to follow the temporal evolution of a drifting concept. With that purpose we introduce a modified SVM classifier, created using multiple hyperplanes valid only at small temporal intervals (windows). In contrast to other strategies proposed in the literature, our method learns all hyperplanes in a global way, minimizing a cost function that evaluates the error committed by this family of local classifiers plus a measure associated to the VC dimension of the family. We also show how the idea of slowly changing classifiers can be applied to non-linear stationary concepts with results similar to those obtained with normal SVMs using gaussian kernels.