Una propuesta para la extracción automática del sintagma adverbial
dc.citation.title | Análisis Automatizado de Sentimiento en Textos Breves de la Plataforma Twitter | es |
dc.creator | Rodrigo, Andrea | |
dc.creator | Bonino, Rodolfo | |
dc.date.accessioned | 2021-08-14T03:19:37Z | |
dc.date.available | 2021-08-14T03:19:37Z | |
dc.date.issued | 2012-12 | |
dc.description | En el área de la Lingüística Computacional o Procesamiento de Lenguaje Natural (PLN), una de las tareas estándares más desafiantes es el análisis de sentimiento (sentiment analysis) en texto opinionado. Aunque algunos enfoques de aprendizaje no supervisado (machine learning) hacen uso de técnicas estadísticas como clasificadores bayesianos, bigramas de orientación semántica, etc. [1], los trabajos más exitosos en el campo recurren a recursos léxico-gramaticales bajo la forma de una ontología con valoración de sentimiento y diversas reglas de sintaxis básica. Nuestra solución sigue tal enfoque simbólico de recursos léxico-gramaticales y reglas de sintaxis local y global. En forma temprana detectamos indicios como emoticones para dar veredictos de sentimiento. Luego, pasamos a la etapa de pre-procesamiento de texto: estandarización del texto y segmentación en unidades significativas menores a la oración, las cuales pasan a ser procesadas por un lematizador optimizado para el español (Freeling) con anotación morfosintáctica (POS-tagging). De esta manera, obtenemos lemas muy confiables por cada unidad de análisis, los cuales son valorados por nuestra propia ontología -similar a SentiWordNet [2]- con más de 4.000 lemas anotados a mano. Finalmente, aplicamos reglas de cambios de modalidad para estructuras negadas y subjuntivo con modalidad irreal y reglas de polaridad para frases como sin respeto, imposible enojarse, etc. | es |
dc.description | In Computational Linguistics or Natural Language Processing (NLP), Sentiment Analysis in opinionated text is one of the most challenging standard tasks. Although some unsupervised learning approaches based on machine learning use statistical techniques such as Bayesian classifiers, semantic-oriented bigrams, etc. [1], the most successful works in the field lean on lexical-grammar resources under the form of ontologies with sentiment values and several basic syntax rules. Our solution is based on such symbolic paradigm of lexical-grammar resources and local and global syntax rules. We detect early hints such as emoticons in order to come up with sentiment verdicts. Then, we pre-process the text by standardizing it and segment it into significant units smaller than sentences. Those small units are processed by a lemmatizer (Freeling) with POS-tagging optimized for Spanish. Thus, we get accurate lemmata for each unit of analysis. Those lemmata are valued by our own ontology -similar to SentiWordNet [2]- with more than 4,000 hand-annotated lemmata. Finally, we apply rules for modal changes in negated structures or modal subjunctive and polarity shifters for phrases such as sin respeto, imposible de enojarse, etc. | es |
dc.description.fil | Fil: Rodrigo, Andrea. Universidad Nacional de Rosario. Facultad de Humanidades de Artes | es |
dc.description.fil | Fil: Bonino, Rodolfo. Universidad Nacional de Rosario. Facultad de Humanidades y Artes. Escuela de Letras. | es |
dc.format | application/pdf | |
dc.format.extent | 87 | es |
dc.identifier.issn | 1851-1996 | es |
dc.identifier.uri | http://hdl.handle.net/2133/21632 | |
dc.language.iso | spa | es |
dc.publisher | INFOSUR. Revista de Lingüística Informática, Modelización e Ingeniería Lingüística | es |
dc.rights | openAccess | es |
dc.rights.holder | Autor | es |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/2.5/ar/ | * |
dc.subject | Análisis de sentimiento | es |
dc.subject | Minería de texto opinionado | es |
dc.subject | Ontologías | es |
dc.subject | Freeling | es |
dc.subject | SentiWordNet. | es |
dc.title | Una propuesta para la extracción automática del sintagma adverbial | es |
dc.type | article | |
dc.type | artículo | |
dc.type | publishedVersion | |
dc.type.collection | articulo | |
dc.type.version | publishedVersion | es |
Archivos
Bloque original
1 - 1 de 1
Cargando...
- Nombre:
- Una propuesta para la extracción automática del sintagma adverbial_ Rodrigo_Bonino.pdf
- Tamaño:
- 1.88 MB
- Formato:
- Adobe Portable Document Format
- Descripción:
Bloque de licencias
1 - 1 de 1
- Nombre:
- license.txt
- Tamaño:
- 3.59 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción: