SITIO DE TEST - SITIO DE TEST - SITIO DE TEST - SITIO DE TEST - SITIO DE TEST - SITIO DE TEST - SITIO DE TEST - SITIO DE TEST - SITIO DE TEST
 

Análisis y aprovechamiento de bases de datos agronómicas recurriendo al proceso “Knowledge discovery in databases” (KDD) y algoritmos de “data mining”(DM). Una Aplicación al pronóstico de producción de frutas de pepita en los Valles de Río Negro y Neuquén

dc.contributor.advisorBramardi, Sergio
dc.contributor.coadvisorPratta, Guillermo
dc.contributor.coadvisorBeltrán, Celina
dc.creatorGiménez, Gustavo Néstor
dc.date.accessioned2022-05-02T20:55:04Z
dc.date.available2022-05-02T20:55:04Z
dc.date.issued2020
dc.description.abstractUna de las principales actividades económicas en las provincias de Río Negro y Neuquén, es la producción de peras y manzanas. En dicha zona se ha llevado a cabo el pronóstico de producción desde el año 1992 durante 23 años. El pronóstico de producción de frutas de pepita ha sido una herramienta importante para planificar la cosecha y mejorar estrategias de mercado. El método de predicción de la producción, con antelación a la cosecha de los principales cultivares, se basó en curvas de crecimiento. La curvas de crecimiento no sólo permitieron estimar la producción sino que, conjuntamente con la relación diámetro-peso de los frutos, los tamaños comerciales. Toda esta información ha generado un volumen de datos que resulta difícil procesar y aprovechar con los métodos estadísticos habituales. Una opción para estos casos es utilizar una técnica de extracción de conocimientos en bases de datos también llamado proceso KDD (Knowledge Discovery in Data Bases). El proceso KDD consta de tres etapas: preprocesamiento, análisis de datos aplicando técnicas de minería de datos y extracción de conocimiento. El objetivo principal de esta tesis fue aplicar el proceso KDD y algoritmos de “Data Mining” como el SVM o máquina de soporte vectorial aplicados al pronóstico de producción. Otro objetivo de este trabajo fue diseñar una base de datos que pudiera preservar la información generada. Además, se aplicaron técnicas de preprocesamiento y visualización para detectar datos faltantes y con errores de registro; se buscaron relaciones entre variables como peso y diámetro. Para esto fue esencial programar nuevas funciones y algoritmos en R. Una vez sistematizados los datos de crecimiento se ajustó un modelo estadístico y se estimaron los efectos del mismo destacándose el efecto de la parcela. A partir de la estimación del modelo se simularon curvas de crecimiento para calibrar y entrenar el SVM. Aprovechando las curvas simuladas se verificó que el SVM mejoró el ajuste de las curvas de crecimiento observando un error cuadrativo medio menor que utilizando modelos estadísticos. La utilización del SVM como clasificador multiclase permitió predecir con antelación a la cosecha los tamaños comerciales de los frutos. La ventaja de aplicar el SVM residió principalmente en procesar mayor volumen de datos y lograr mayor precisión en el pronóstico. El alcance de las predicciones del SVM fue evaluado con una experiencia a campo donde se realizó una predicción 14 días posteriores a la cosecha comercial y se comparó con los tamaños de los frutos recolectados. La precisión expresada en tamaños comerciales correctamente clasificados fue de 30% pero al reagrupar las clases productivas en frutos pequeños, medianos y grandes se logró una precisión de 70%. Mediante esta tesis se logró sistematizar, procesar y analizar un gran volumen conformando una base de datos de 17 tablas y 160.000 registros. La aplicación del proceso KDD y de algoritmos de DM permitió obtener predicciones de gran precisión.es
dc.description.abstractIn Río Negro and Neuquén provinces, pears and apples production forecast had been carried out since 1992 during 23 years. Forecasts are a valuable tool for planning harvesting and improving marketing conditions. The method to predict the entire production of the main cultivars before harvest are based on fruit growth curves, we use it not only to estimate the whole production, but also to know the relationship between weight and diameter required for ideal commercial size. All this information had generated a volume of data which is unable to process with an usual procedure. Therefore in these cases there are process of knowledge extractionn in databases called KDD which is the most recommended option, it consist of 3 stages: preprocessing, analysis using data mining(DM) techniques and obtaining knowledge. Based on the aforementioned, the overriding objective was to apply the KDD process and data mining algorithms such as Support Vector Machine(SVM) to the forecast data for its use. The aim of this research was design a data base which could be able to house the generated information. In addition, preprocessing and visualization techniques were applied to detect errors and missing data, and the relationship between variables such diameter and weight. It was essential to program new algorithms and functions in R. Once we had the data growth results, an statistical model was fitted, in the same way it could estimate the effect that standed out, which was the farm effect. Since the model, growth curves were simulated for calibration and tunning of the SVM. Using the simulated curves, it was verified that SVM improved the adjustment of the growth patterns with a smaller mean root error than the statistical models. Using the SVM as a multiclass classifier, it was possible to predict in advance the harvest the commercial size. A considerable advantage of SVM consist of primarily processing more data having a high accuracy of the forecast. The reach of the SVM predictions, was evaluated doing fieldwork, making predictions 14 days after the commercial harvest, comparing its result with the harvested fruits. The precision was 0; 3 but when regrouping the size in small, medium, and large fruits the precision remained at 0; 7. In this thesis. it has been possible to save, process and analyze a large volume of data(17 tables and 160.000 registers) from the KDD process, obtaining accurate predictions. Keywords: Forecasting, Fruit Growing, Nonlinear Models, Support Vector Machine, Accuracy.es
dc.description.filGiménez, Gustavo. Universidad Nacional de Rosario. Facultad de Ciencias Agrarias; Argentinaes
dc.formatapplication/pdf
dc.identifier.urihttp://hdl.handle.net/2133/23497
dc.language.isospaes
dc.publisherFCA-UNRes
dc.rightsopenAccesses
dc.rights.holderAutores
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/2.5/ar/*
dc.subjectFruticulturaes
dc.subjectModelos No Linealeses
dc.subjectMáquina de soporte de vectoreses
dc.subjectPronósticoes
dc.subjectPrecisiónes
dc.titleAnálisis y aprovechamiento de bases de datos agronómicas recurriendo al proceso “Knowledge discovery in databases” (KDD) y algoritmos de “data mining”(DM). Una Aplicación al pronóstico de producción de frutas de pepita en los Valles de Río Negro y Neuquénes
dc.titleAnalysis and use of agronomic databases applying the “knowledge discovery in databases” (KDD) process and “data mining” (DM) algorithms. An Application to the Forecast of Fruit Production in the Valleys of Río Negro and Neuquénes
dc.typedoctoralThesis
dc.typeTésis de Doctorado
dc.typeacceptedVersion
dc.type.collectiontesis
dc.type.otherdoctoralThesises
dc.type.versionacceptedVersiones

Archivos

Bloque original
Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
GIMÉNEZ GUSTAVO N Doctorado.pdf
Tamaño:
7.36 MB
Formato:
Adobe Portable Document Format
Descripción:
Tesis
Bloque de licencias
Mostrando 1 - 1 de 1
Nombre:
license.txt
Tamaño:
3.59 KB
Formato:
Item-specific license agreed upon to submission
Descripción: