Examinando por Autor "Soguero Ruiz, Cristina"
Mostrando 1 - 3 de 3
- Resultados por página
- Opciones de ordenación
Ítem Diagnóstico de modelo y selección de variables para métodos de aprendizaje estadístico aplicados a efectividad promocional(Universidad Rey Juan Carlos, 2011) Soguero Ruiz, CristinaLa inestabilidad económica de los últimos años está produciendo una disminución generalizada de las ventas y en concreto de los productos de alimentación. Esta situación ha hecho que muchos distribuidores minoristas hayan puesto en marcha acciones promocionales como el descuento directo y las promociones en cantidad (3x2 ). La información digital disponible hoy en día ha provocado una evolución en el desarrollo de estas actividades, y debido a su potencial, los métodos de aprendizaje estadístico han empezado a cobrar verdadera importancia para conseguir aumentar el volumen de ventas. En el presente proyecto se utilizan los métodos de aprendizaje estadístico para analizar el comportamiento de las promociones en términos de unidades vendidas, realizando una comparación estadística detallada entre diferentes métodos para determinar de forma objetiva cuál de ellos ofrece mejores prestaciones. La nalidad de este trabajo es proponer un procedimiento operativo para el diagnóstico de modelo y la selección de variables utilizando técnicas estadísticas en aplicaciones de efectividad promocional. En concreto, se han analizado las promociones realizadas por un distribuidor minorista en 6 productos de la categoría de leche y en 14 productos de la categoría de cerveza durante un año, y para ello se han realizado diferentes experimentos. El primero ha consistido en comparar las prestaciones de cuatro métodos de aprendizaje estadístico: k-NN (k-Nearest Neighbors), GRNN (General Regression Neural Network), MLP (Multi Layer Perceptron) y SVM (Support Vector Machine) en términos absolutos utilizando el MAE (Mean Absolute Error) como gura de mérito. Se ha contrastado si algún método es signi cativamente mejor que otro mediante un test estadístico no paramétrico, basado en remuestreo bootstrap. Esta metodología se ha utilizado posteriormente para contrastar las prestaciones del esquema -SVM diseñado con núcleo RBF y con núcleo semiparamétrico, para analizar los elementos de diseño del MLP y comprobar la conveniencia de incluir determinadas variables (en general de naturaleza dicotómica) en los modelos promocionales. En conclusión, las técnicas de aprendizaje estadístico y la utilización del test bootstrap propuesto permiten extraer información relevante en el análisis de la efectividad promocional.Ítem Machine Learning and Knowledge Management for Decision Support. Applications in Promotional Efficiency and Healthcare(Universidad Rey Juan Carlos, 2015) Soguero Ruiz, CristinaEl desarrollo alcanzado en las Tecnologías de la Información y las Comunicaciones en las últimas décadas, ha traído consigo la recopilación y almacenamiento creciente de datos en ámbitos tan diversos como pueden ser marketing, salud o seguridad. La disponibilidad de grandes cantidades de datos hace necesaria la búsqueda de nuevos paradigmas de aprendizaje máquina, capaces de abordar el análisis automatizado de los mismos con la consiguiente extracción de información. En concreto, las técnicas de aprendizaje máquina permiten diseñar modelos estadísticos no paramétricos que aprendan las relaciones existentes entre un conjunto suficientemente representativo de ejemplos, cada uno de ellos formado por unas variables observadas (características), y su correspondiente salida. Se desea que el modelo construido pueda generalizar, es decir, obtener una salida adecuada ante ejemplos de entrada no considerados durante la fase del diseño. En los últimos años, estas técnicas han experimentado un avance espectacular, tanto en fundamentos teóricos como en su aplicación a distintos y numerosos dominios de conocimiento. El objetivo general de esta Tesis es el desarrollo teórico y la implementación de métodos de aprendizaje máquina, con énfasis en las etapas de selección de características y diseño del modelo predictivo, de forma que permita abordar el análisis de grandes cantidades de datos de naturaleza diversa, creando procedimientos específicos para cada etapa pero al tiempo aplicables en distintos ámbitos. En esta Tesis se han abordado tres áreas específicas de creciente interés económico y social: (a) el modelado de las interacciones entre productos de consumo diario y su eficiencia promocional; (b) el apoyo a la toma de decisiones para la predicción temprana de complicaciones tras la cirugía de cáncer de colon; (c) la estratificación de riesgo de muerte súbita cardíaca a partir de índices predictores obtenidos de las señales eléctricas del corazón, utilizando un modelo de conocimiento clínico y una terminología estandarizada. El análisis de datos de cada una de estas aplicaciones presenta como denominador común la utilización de técnicas de aprendizaje máquina, de acuerdo con el objetivo general. Sin embargo, la naturaleza tan diversa de dichas aplicaciones hace que cada una represente por sí misma un objetivo específico de la presente Tesis. El primer objetivo específico consiste en profundizar en la evaluación y análisis de las ventas promocionales, tradicionalmente basado en técnicas de estadística clásica. Un apoyo sustancial en la toma de decisiones ha de venir necesariamente del análisis sistemático de datos masivos sobre el control y monitorización de las promociones y sus complejas interacciones. Por ello se propone el análisis y la comparación estadística de distintas técnicas de aprendizaje máquina. Otro ámbito de naturaleza muy diversa al anterior, pero de indudable interés social, es el de la salud. El análisis de datos clínicos, tanto estructurados (constantes vitales o análisis de sangre) como no estructurados (texto libre en documentos clínicos), recogidos longitudinal y sistemáticamente en las historias clínicas electrónicas (HCEs) de un conjunto numeroso de pacientes, permite incrementar sustancialmente el conocimiento clínico y apoyar la toma de decisiones. Sin embargo, las técnicas de aprendizaje máquina y el análisis de datos han tenido, hasta la fecha, un alcance limitado en este ámbito. Esta situación se debe principalmente a la dificultad de extraer información útil de datos clínicos procedentes de fuentes heterogéneas. Además, existen muy pocos precedentes de sistemas que permitan la explotación automática de la información a nivel agregado entre diferentes entidades hospitalarias y existe gran necesidad de disponer de datos que sirvan de base para el avance científico, con mayor impacto en la práctica clínica. En esta Tesis se analizan dos dominios del ámbito salud de gran prevalencia en el mundo occidental, a saber, el cáncer de colon y las enfermedades cardíacas. El segundo objetivo específico consiste en la adaptación y aplicación de métodos de aprendizaje máquina para la detección temprana de complicaciones tras la cirugía de cáncer de colon, analizando tanto individual como conjuntamente variables procedentes de fuentes heterogéneas, extraídas todas ellas de la HCE. El tercer objetivo específico consiste en la creación de modelos de conocimiento clínico que permitan intercambiar datos y comprender semánticamente la información clínica de distintas HCEs. En los últimos años se han propuesto numerosos índices predictores del riesgo cardíaco. En concreto, en esta Tesis se analiza el dominio de la turbulencia del ciclo cardíaco por ser un predictor de muerte súbita cardíaca con guías clínicas claras y concisas. El análisis de grandes cantidades de datos y el desarrollo teórico de nuevos algoritmos de aprendizaje estadístico representan hoy, sin duda, un área de investigación muy activa en distintos dominios. Esta Tesis contribuye a mejorar el conocimiento y la toma de decisiones en aplicaciones reales de muy diversa naturaleza, y al tiempo con claros denominadores comunes.Ítem Ontology for Heart Rate Turbulence Domain Applying the Conceptual Model of SNOMED-CT(2012-07-18) Soguero Ruiz, CristinaAlthough cardiovascular risk stratification (CVRS) based on ECG-derived indices has been deeply studied, many current findings are not being widely used in the clinical practice. We hypothesized that, in addition to the necessary scientific evidence, also a clear and standardized connection among the current knowledge in the scientific literature, its availability for the cardiologist, and the actual patient data, is necessary for the practical implementation and refinement of these indices. For this purpose, we implemented an standardized framework for CVRS based on ECG-derived indices, focused on the actual knowledge of Heart Rate Turbulence (HRT) indices (with concise guidelines and clear procedures to parameter calculations). An ontology for HRT was built according to a set of logical and relational rules, yielding the class hierarchy model and its corresponding inferred model (Prot¿eg¿e-OWL, 4.1) for completeness. Different from other biomedical ontologies, ours was based on the international standard SNOMED-CT. The model of SNOMEDCT not only considers terminology, but also properties and relationships, what guaranteed the standardization and compatibility with current and emerging Electronic Health Records. Our HRT ontology consisted of 308 concepts (289 from SNOMED-CT, and 19 a local extension to model the main concepts of the HRTdomain). As an application example, a database of 27 instances of patients with HRT from 24-Holter monitoring recordings was considered, with basic HRT indices and also conventional and emergent signal processing calculations. A consistence of 86% and 77% was achieved between averaged procedure for HRT index calculations given in the guidelines and with a filtering procedure.