Métricas de reputación para la construcción de Sistemas Basados en el Conocimiento
Fecha
2023
Autores
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Rey Juan Carlos
Resumen
La reputación es un concepto tratado de manera tradicional como una medida afectada
por agentes subjetivos. Además, los esfuerzos realizados para proponer una métrica
calculada con parámetros objetivos se han visto comprometidos por aspectos que no se
han tenido en cuenta y reducen la calidad de la métrica. En la comunidad científica, por
ejemplo, no existe una métrica única, objetiva y precisa para clasificar el trabajo de los
investigadores en función de su mérito científico. La mayoría de las métricas existentes
se basan en la cantidad de publicaciones asociadas con un autor junto con la cantidad
de citas recibidas por esas publicaciones. Para mitigar alguna de estas limitaciones se
presenta el framework Unified Knowledge Compiler (UNIKO). Este framework incluye la
evaluación de puntuaciones de reputación de artículos y autores, y el análisis de sentimiento
de los textos de los artículos. Además, también incluye la recomendación de artículos
y autores relacionados con un campo de aplicación específico para facilitar el proceso de
investigación a la comunidad científica. UNIKO está construido como un framework híbrido
basado en sistemas basados en el conocimiento y sistemas de recomendación basados
en el contenido. Con el fin de evaluar el rendimiento del sistema, se han realizado varios
experimentos. El primer experimento se desarrolla para ilustrar la tarea de puntuación de
reputación. El segundo aborda el cálculo de puntuaciones de sentimiento basado en un léxico
que es compatible con una red neuronal convolucional. El último experimento muestra
las tareas de recomendación basadas en medidas específicas de similaridad y aprendizaje
no supervisado. También se ha propuesto el Framework for Reputation Estimation of
Scientific Authors (FRESA), centrándose en la calidad de la métrica de reputación. Es un
sistema capaz de estimar la reputación de un investigador haciendo uso de los conceptos
de relevancia y novedad en el dominio científico. El sistema es capaz de representar las
trayectorias científicas de los investigadores a través de los índices propuestos para ilustrar
su evolución en el tiempo. FRESA utiliza fuentes de información web y aplica medidas
de similaridad, técnicas de minería de texto y algoritmos de clustering para clasificar
y agrupar a los investigadores. Por último, también se presenta el framework Domains
Classifier based on Risky Websites (DOCRIW), que estudia el cálculo de la reputación de
sitios web. Se basa en dos componentes principales. El primer componente es una base de
conocimiento construida previamente que contiene información de sitios web riesgosos. El segundo complementa el sistema con un clasificador binario capaz de etiquetar un sitio
web (como riesgoso o no) en base a su reputación considerando solo su dominio web.
El sistema hace uso de fuentes de información web e incluye variables basadas en host.
También aplica medidas de similaridad, algoritmos de aprendizaje supervisado y métodos
de optimización para mejorar su rendimiento. El trabajo presentado es experimental y
ofrece resultados prometedores.
Descripción
Tesis Doctoral leída en la Universidad Rey Juan Carlos de Madrid en 2023. Directores:
Isaac Martín de Diego
Alberto Fernández-Isabel
Palabras clave
Citación
Colecciones
Excepto si se señala otra cosa, la licencia del ítem se describe como Attribution-NonCommercial-NoDerivatives 4.0 Internacional