Métricas de reputación para la construcción de Sistemas Basados en el Conocimiento

Fecha

2023

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Rey Juan Carlos

Resumen

La reputación es un concepto tratado de manera tradicional como una medida afectada por agentes subjetivos. Además, los esfuerzos realizados para proponer una métrica calculada con parámetros objetivos se han visto comprometidos por aspectos que no se han tenido en cuenta y reducen la calidad de la métrica. En la comunidad científica, por ejemplo, no existe una métrica única, objetiva y precisa para clasificar el trabajo de los investigadores en función de su mérito científico. La mayoría de las métricas existentes se basan en la cantidad de publicaciones asociadas con un autor junto con la cantidad de citas recibidas por esas publicaciones. Para mitigar alguna de estas limitaciones se presenta el framework Unified Knowledge Compiler (UNIKO). Este framework incluye la evaluación de puntuaciones de reputación de artículos y autores, y el análisis de sentimiento de los textos de los artículos. Además, también incluye la recomendación de artículos y autores relacionados con un campo de aplicación específico para facilitar el proceso de investigación a la comunidad científica. UNIKO está construido como un framework híbrido basado en sistemas basados en el conocimiento y sistemas de recomendación basados en el contenido. Con el fin de evaluar el rendimiento del sistema, se han realizado varios experimentos. El primer experimento se desarrolla para ilustrar la tarea de puntuación de reputación. El segundo aborda el cálculo de puntuaciones de sentimiento basado en un léxico que es compatible con una red neuronal convolucional. El último experimento muestra las tareas de recomendación basadas en medidas específicas de similaridad y aprendizaje no supervisado. También se ha propuesto el Framework for Reputation Estimation of Scientific Authors (FRESA), centrándose en la calidad de la métrica de reputación. Es un sistema capaz de estimar la reputación de un investigador haciendo uso de los conceptos de relevancia y novedad en el dominio científico. El sistema es capaz de representar las trayectorias científicas de los investigadores a través de los índices propuestos para ilustrar su evolución en el tiempo. FRESA utiliza fuentes de información web y aplica medidas de similaridad, técnicas de minería de texto y algoritmos de clustering para clasificar y agrupar a los investigadores. Por último, también se presenta el framework Domains Classifier based on Risky Websites (DOCRIW), que estudia el cálculo de la reputación de sitios web. Se basa en dos componentes principales. El primer componente es una base de conocimiento construida previamente que contiene información de sitios web riesgosos. El segundo complementa el sistema con un clasificador binario capaz de etiquetar un sitio web (como riesgoso o no) en base a su reputación considerando solo su dominio web. El sistema hace uso de fuentes de información web e incluye variables basadas en host. También aplica medidas de similaridad, algoritmos de aprendizaje supervisado y métodos de optimización para mejorar su rendimiento. El trabajo presentado es experimental y ofrece resultados prometedores.

Descripción

Tesis Doctoral leída en la Universidad Rey Juan Carlos de Madrid en 2023. Directores: Isaac Martín de Diego Alberto Fernández-Isabel

Citación

Colecciones

license logo
Excepto si se señala otra cosa, la licencia del ítem se describe como Attribution-NonCommercial-NoDerivatives 4.0 Internacional