La anotación de funcionalidades biológicas de productos génicos, RNA y proteí nas, es una tarea crítica en el desarrollo de proyectos de secuenciación genómica. En
el caso de proyectos de genomas virales, estas anotaciones infieren el rol molecular
de estos productos virales de interés durante la infección a sus células diana, indi cando aquellos procesos biológicos en los que están involucrados y constituyen una
herramienta útil para el desarrollo y mejoramiento de tratamientos antivirales. La
velocidad actual a la que se generan nuevas secuencias de RNA y proteínas a partir
de proyectos de secuenciación genómica genera un cuello de botella para los méto dos de anotación tradicionales, basados en estudios experimentales exhaustivos. Este
cuello de botella puede resolverse parcialmente mediante métodos computacionales
de anotación. Es de interés global el estudio de virus y en particular, SARS-CoV-2,
que causa la enfermedad COVID-19 y representa aún una amenaza para la salud
mundial. Los esfuerzos para desarrollar medicamentos y vacunas eficaces frente a
nuevas variantes se ven obstaculizados por el conocimiento limitado de los detalles
moleculares de cómo el SARS-CoV-2 infecta y se propaga. En particular, en es te trabajo se aborda el problema de anotación funcional automática de productos
génicos para SARS-CoV-2 a través de ontologías y aprendizaje computacional. La
ontología funcional de genes utilizada es Gene Ontology (GO) y el método de apren dizaje computacional utilizado se llama Factor Graph GO Annotation (FGGA). Este
método de clasificación jerárquico toma como entrada un conjunto de atributos, ca racterísticas, extraídos desde las secuencias y devuelve un grafo consistente en los
tres subdominios de GO. El proceso de extracción de atributos desde las secuencias
se lo denomina caracterización. En este trabajo, se considera una caracterización
básica que consiste en propiedades fisicoquímicas y una caracterización enriquecida,
desarrollada en este proyecto, que agrega atributos virales. La incorporación de es tos contribuye a mejorar la especificidad de predicción de las funcionalidades GO.
Finalmente, se evalúa el rendimiento de las predicciones GO obtenidas y se compara
los resultados obtenidos sobre 31 productos génicos anotados en forma experimental
en Jungreis et al. (2021). Estos resultados validaron de forma exitosa las anotaciones
existentes curadas manualmente y también generaron nuevas anotaciones in-silico
que fueron avaladas por diversas fuentes bibliográficas disponibles en la actualidad