INGENIERÍA DE DATOS CON EL FRAMEWORK SPARK Y SCALA
Fecha
2024-07-15
Autores
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Rey Juan Carlos
Resumen
2
Resumen
El presente trabajo pretende profundizar en Apache Spark, la cual es una de las herramientas
más importantes hoy en día existentes para el procesamiento y análisis de big data. Permite a
las organizaciones el cómputo de grandes conjuntos de datos de manera eficiente para extraer
información que permita realizar una toma informada de decisiones y hacer prosperar su
negocio. Este motor de computación distribuida está escrito en el lenguaje de programación
funcional Scala. Se promueve el desarrollo de código siguiendo las técnicas del paradigma de
programación sobre el que apoya, ya que la utilización de funciones matemáticas permite una
mejor división de las tareas entre los nodos del clúster respecto a la utilización de iteraciones
y estructuras de datos mutables. De igual modo, permite la reutilización de código al usar las
APIs de las que consta el framework como GraphFrames o GraphSQL y la mantenibilidad de
este permite un mantenimiento y una evolución eficientes y rentables del código base a lo
largo del tiempo.
Descripción
Trabajo Fin de Grado leído en la Universidad Rey Juan Carlos en el curso académico 2023/2024. Directores/as: Juan Manuel Serrano Hidalgo