Projects Proposals (in Spanish)
Si puedes estar interesado/a en alguna de estas propuestas (para Trabajo de Fin de Grado, Trabajo de Fin de Máster o similar), por favor contacta conmigo. También puedo considerar otras propuestas relacionadas con gestión de datos, sistema de información distribuidos y computación móvil. ¡Anímate!
Si estás interesado/a en posibles contratos de iniciación a la investigación en temáticas de gestión de datos digitales (estos contratos requieren finalizar primero el grado, defendiendo el TFG), por ejemplo en el contexto del proyecto NEAT-AMBIENCE, no dudes en contactarme. Existen oportunidades y puede ser una buena forma de continuar colaborando en temas que os interesen más allá del trabajo fin de estudios.
Además, si quieres colaborar en alguna línea de investigación independientemente del trabajo académico final de estudios, podrías estar interesado en las becas de colaboración del Ministerio de Educación y Formación Profesional.
Tipos de propuestas:
- Sistemas de Recomendación
- Redes de Vehículos y Sistemas de Transporte Inteligentes
- Otros proyectos sobre minería de datos y gestión de datos
- Otros proyectos sobre computación móvil
- Herramientas de Apoyo a la Docencia
- Proyectos en Empresa o en Colaboración con Otras Entidades
- Otros Proyectos
Sistemas de Recomendación
1.- Desarrollo de un recomendador genérico y mantenible para dispositivos móviles
Objetivo: en este trabajo se desarrollará una aplicación móvil para dispositivos móviles (Android y, si se considera de interés, iOS) con un énfasis en su fácil mantenimiento y evolución a lo largo del tiempo. Para ello, se dispondrá de prototipos previos que podrían (si resulta de interés) unificarse y actualizarse para versiones modernas de Android y otras bibliotecas asociadas. Se utilizarán dispositivos reales y emuladores en una máquina virtual para facilitar la obtención de un entorno de trabajo estable. Se considerarán distintas arquitecturas/soluciones de recomendación en varios escenarios, así como la realización de pruebas de usabilidad con usuarios reales.
Referencias:
- Sergio Ilarri, Irene Fumanal, Raquel Trillo-Lado, "An Experience with the Implementation of a Rule-Based Triggering Recommendation Approach for Mobile Devices", 19th International Conference on Advances in Mobile Computing & Multimedia (MoMM 2021), ACM Press, ISBN 978-1-4503-9556-4, pp. 568-576, November-December 2021, DOI: 10.1145/3487664.3487806. Online conference due to the COVID-19 pandemic.
- Sergio Ilarri, Manuel Herrero, "Towards the Implementation of a Push-Based Recommendation Architecture", 13th International Workshop on Semantic and Social Media Adaptation and Personalization (SMAP 2018), Zaragoza (Spain), IEEE, Electronic ISBN 978-1-5386-8225-8, USB ISBN 978-1-5386-8224-1, Print on Demand (PoD) ISBN 978-1-5386-8226-5, pp. 87-92, September 2018, DOI: 10.1109/SMAP.2018.8501875.
2.- Técnicas de gestión de datos para sistemas de recomendación en entornos distribuidos y dispositivos móviles
Objetivo: en este trabajo se estudiará en profundidad la utilización de técnicas de gestión de datos para el desarrollo de sistemas de recomendación y su despliegue en sistemas distribuidos y móviles. Se considerarán soluciones para sistemas de recomendación completamente embebidos en dispositivos móviles (sin dependencia de servidores externos), así como para sistemas de recomendación que requieren la colaboración entre distintos dispositivos móviles (intercambiando datos y/o procesamiento). Se desarrollarán prototipos y se realizarán pruebas que permitan evaluar experimentalmente cuáles son las limitaciones de distintos tipos de despliegues (técnicas que se pueden utilizar, volúmenes de datos, etc.).
Referencias:
- María del Carmen Rodríguez-Hernández, Sergio Ilarri, Raquel Trillo-Lado, Ramón Hermoso, "Context-Aware Recommendations Using Mobile P2P", 15th International Conference on Advances in Mobile Computing & Multimedia (MoMM 2017), Salzburg (Austria), ACM Press, ISBN 978-1-4503-5300-7, pp. 82-91, December 2017, DOI: 10.1145/3151848.3151856.
3.- Desarrollo de una herramienta avanzada para la generación de datos y simulación para la evaluación de sistemas de recomendación
Objetivo: en este trabajo se desarrollará una herramienta para la generación de datos sintéticos para la evaluación de sistemas de recomendación, así como un simulador para la evaluación de sistemas de recomendación dependientes del contexto, logrando una adecuada integración entre ambos. Para ello, se partirá de herramientas desarrolladas en trabajos previos: AutoDataGenCARS y RecMobiSim. Si bien dichas herramientas se pueden utilizar de base, se mejorarían significativamente con el desarrollo de este trabajo, incorporando nuevas funcionalidades y facilitando su utilización por parte de usuarios inexpertos. Entre las funcionalidades a considerar en la herramienta de generación de datos sintéticos, se desarrollará un asistente (por ejemplo, un chatbot) que permita ayudar al usuario en las tareas de generación de datos, se incorporarán modos de ejecución guiados, comprobaciones de errores más exhaustivas, y más estrategias de generación de datos. En cuanto a la simulación de escenarios, se incluirán funcionalidades tales como una moviola (herramienta de "replay"), que permita visualizar ejecuciones pasadas (parándolas, continuándolas, pasándolas a cámara lenta, así como avanzándolas hacia delante y hacia atrás, según sea necesario), la posibilidad de definir ítems móviles (tales como, por ejemplo, taxis o personas moviéndose) y la incorporación de nuevos algoritmos de recomendación que puedan evaluarse. Existe también la posibilidad de centrar el trabajo únicamente en una de las dos partes que se han mencionado (es decir, en la parte de generación de datos o en la parte de simulación), dado que en cualquiera de esas dos partes se pueden plantear suficientes funcionalidades como para que el trabajo adquiera la entidad necesaria para un TFG.
Referencias:
- María del Carmen Rodríguez-Hernández, Sergio Ilarri, Ramón Hermoso, Raquel Trillo-Lado, "DataGenCARS: A Generator of Synthetic Data for the Evaluation of Context-Aware Recommendation Systems", Pervasive and Mobile Computing, ISSN 1574-1192, volume 38, part 2, pp. 516-541, Elsevier, July 2017, https://doi.org/10.1016/j.pmcj.2016.09.020. Special Issue on Context-aware Mobile Recommender Systems.
Redes de vehículos y Sistemas de Transporte Inteligentes
1.-Desarrollo de un sistema de movilidad compartida que minimice riesgos en tiempos de pandemia
Objetivo: el objetivo de este trabajo es realizar un estudio de técnicas de gestión de datos existentes para permitir movilidad compartida (
Otros proyectos sobre minería de datos y gestión de datos
1.- Análisis de trayectorias para monitorización de contactos en epidemias
Objetivo: se desarrollará una herramienta que facilitará la detección de posibles situaciones de riesgo en la expansión de una epidemia (por ejemplo, para el caso del actual coronavirus), a partir de información de localizaciones y de trayectorias seguidas por las personas. Se estudiarán técnicas existentes en el ámbito de las bases de datos especiales y minería de datos espacio-temporal (análisis de trayectorias) y se considerará diverso software y tecnologías existentes que podrían utilizarse en el desarrollo de la herramienta. Para mostrar la utilidad de la herramienta, se analizará la posible inclusión de funcionalidades que permitan importar trayectorias reales o simularlas en distintos escenarios.
2.- Análisis y evaluación de aproximaciones para el procesamiento de consultas espaciales basadas en palabras clave
Objetivo: se analizarán y compararán experimentalmente distintas técnicas para abordar el problema de Collective Spatial Keyword Query (CoSKQ). El objetivo de CoSKQ es recuperar un conjunto de ítems espaciales (por ejemplo, puntos de interés es un escenario de turismo, tales como restaurantes, museos, hoteles, monumentos, atracciones, etc.) cuya descripción permite cubrir las palabras claves proporcionadas por el usuario en una consulta (por ejemplo, "leisure time, outdoors, see animals, with kids") y al mismo tiempo trata de garantizar que los ítems de la respuesta están tan cerca como sea posible de la localización del usuario y tengan entre sí distancias lo más pequeñas posibles (lo que permitiría, por ejemplo, que el usuario pudiera visitarlos todos sin moverse mucho del área). El trabajo a desarrollar implica un estudio de las técnicas algorítmicas existentes para resolver este problema y una evaluación experimental para compararlas utilizando diversos conjuntos de datos existentes. Asimismo, podrían considerarse pequeñas variaciones del problema original, proponiéndose adaptaciones en los algoritmos existentes.
3.- Procesamiento distribuido de data streams para smart cities
Objetivo: se desarrollará una herramienta que permita diseñar y evaluar técnicas de gestión de data streams (flujos de datos provenientes de sensores) en el contexto de una ciudad inteligente (smart city). La herramienta permitirá simular diversos escenarios de movilidad en una ciudad y procesar distintos tipos de preguntas (espaciales y/o espacio-temporales) sobre los data streams generados. Para implementar las técnicas de procesamiento, se analizarán y estudiarán diversas tecnologías existentes, con un énfasis en aquéllas que permiten hacer un procesamiento distribuido. Se considerará la posible reutilización de un prototipo de investigación previo de un sistema de gestión de data streams que explota funciones de predicción (funciones que estiman cómo van a evolucionar los valores medidos por los sensores) para disminuir la carga de procesamiento, así como de una interfaz gráfica asociada desarrollada en un proyecto previo.
4.- Evaluación de sistemas de gestión de datos espaciales
Objetivo: en este trabajo se analizarán y compararán, de forma cualitativa y cuantitativa, diversos sistemas de gestión de datos espaciales existentes, tales como PostGIS + PostgreSQL, Simba, GeoMesa, y SpatialHadoop. Para la evaluación experimental, se diseñarán diversos escenarios de ejemplo (casos de uso) que se reproducirán con los distintos sistemas gestores existentes y se explotarán para obtener resultados relevantes (por ejemplo, formulando consultas). Se evaluará tanto el rendimiento de los distintos sistemas al procesar consultas o analizar datos como la facilidad de definición de los distintos escenarios y las funcionalidades ofrecidas por los gestores analizados.
5.- Anonimización eficiente de datos de salud utilizando técnicas de aprendizaje automático
Objetivo: en el contexto del proyecto NEAT-AMBIENCE estamos desarrollando soluciones de gestión de datos para ayudar a la toma de decisiones ante diversos desafíos actuales. En este trabajo se colaborará con el proyecto NEAT-AMBIENCE, y en particular con un caso de uso de salud, abordando el estudio y desarrollo de técnicas eficientes de anonimización de datos médicos utilizando aproximaciones basadas en aprendizaje automático. Se pondrá el foco del trabajo no sólo en la precisión del sistema sino también en el rendimiento de la aproximación, ya que se pretende que pueda utilizarse a gran escala sobre grandes volúmenes de datos. Para resolver el problema de la escasa disponibilidad de conjuntos de datos etiquetados, requeridos para la construcción de modelos de aprendizaje, se considerará la posible utilización de técnicas de aprendizaje semi-supervisado así como la generación de datos sintéticos. Para el desarrollo de este trabajo, se partirá de un prototipo (HealthDataAnonym) desarrollado en NEAT-AMBIENCE con la colaboración de un TFG previo. El trabajo se desarrollará en colaboración con el Instituto Aragonés de Ciencias de la Salud, lo que permitirá el desarrollo de un trabajo más cercano a las necesidades reales y poder acceder a datos reales.
Otros proyectos sobre computación móvil
1.- Simulación de movimientos de personas en entornos cerrados
Objetivo: en este trabajo se desarrollará un simulador de movimientos de personas (y quizá de otros objetos móviles de interés) en entornos cerrados. El simulador deberá permitir definir espacios cerrados (tales como edificios o centros comerciales) de varias plantas y el movimiento de personas en su interior, permitiendo la definición de distintas estrategias de generación de rutas (por ejemplo, considerando el concepto de trayectorias semánticas) y actividades dentro del edificio. Se considerará también la posible utilización del simulador en algún caso de estudio (por ejemplo, para evaluar técnicas de sistemas de recomendación o monitorizar si las personas están manteniendo la distancia interpersonal requerida en el contexto del COVID-19).
2.- Simulación de propagación de virus
Objetivo: en el contexto del proyecto NEAT-AMBIENCE estamos desarrollando soluciones de gestión de datos para ayudar a la toma de decisiones ante diversos desafíos actuales. En este trabajo se colaborará con el proyecto NEAT-AMBIENCE, y en particular con un caso de uso de salud, abordando el análisis y la comparación de aproximaciones existentes relativas a modelos de contagios de virus, con un énfasis en el contagio del virus del COVID-19. Se considerará el desarrollo de una aproximación de simulación que permita integrar diversos modelos de contagio en escenarios donde hay personas que se mueven. Será posible introducir al simulador re-alimentación referente a observaciones reales, de manera que éste pueda determinar qué modelos de contagio resultan compatibles con dichas observaciones y cuáles son los que mejor se ajustan a las mismas; de esta forma, el simulador podría potencialmente ayudar a discernir entre diversas hipótesis relativas al modo de contagio de nuevos virus. El trabajo se desarrollará en colaboración con el Instituto Aragonés de Ciencias de la Salud, lo que permitirá el desarrollo de un trabajo más cercano a las necesidades reales y poder acceder a datos que alimenten al simulador desarrollado.
Herramientas de Apoyo a la Docencia
1.- Herramienta para el aprendizaje del diseño de almacenes de datos
Objetivo: se desarrollará una herramienta que facilitará al estudiantado la realización de esquemas de almacenes de datos (esquemas en estrella) y el aprendizaje de los conceptos relacionados. Además, la herramienta servirá de soporte para la documentación asociada al diseño y permitirá la exportación del esquema a SQL y su explotación utilizando diversos Sistemas Gestores de Bases de Datos (SGBD) existentes. La herramienta DBDAp, que puede utilizarse como base para el desarrollo del trabajo, soporta el diseño de almacenes de datos pero carece de funcionalidades avanzadas y puede mejorarse en diversos aspectos. Como parte de las funcionalidades a considerar, se analizará el interés de desarrollar un asistente (por ejemplo, un chatbot) que oriente en la realización de esquemas en estrella apropiados y en la detección de posibles problemas. Asimismo, se añadirá soporte para definir y gestionar múltiples esquemas en estrella simultáneos (múltiples data marts, con dimensiones conformadas, integrados en un almacén de datos).
Herramientas previas relacionadas: DBDAp.
2.- Herramienta para el aprendizaje del diseño físico de bases de datos relacionales
Objetivo: se desarrollará una herramienta que facilitará al estudiantado el aprendizaje de técnicas de diseño físico de bases de datos relacionales. La herramienta incluirá, entre otras, funcionalidades para la definición de estrategias de partición y de estimación de costes para evaluar las mejores opciones existentes. Se integrará con una herramienta desarrollada previamente para el apoyo a la docencia de bases de datos (diseño conceptual y lógico). Asimismo, se considerará la posibilidad de extenderla para el diseño de bases de datos distribuidas; para ello se podrá integrar con una herramienta previa desarrollada para facilitar el aprendizaje de álgebra relacional y la optimización de consultas, extendiéndola a entornos de bases de datos distribuidas.
3.- Herramienta para el aprendizaje del modelo objeto/relacional
Objetivo: se desarrollará una herramienta que facilitará al estudiantado el aprendizaje de los conceptos del modelo objeto/relacional (SQL-99), permitiendo la traducción automática de esquemas conceptuales a esquemas objeto/relacionales apropiados, así como la generación de código SQL adaptado a diversos gestores de bases de datos objeto/relacionales, entre otras funcionalidades. Se integrará con una herramienta desarrollada previamente para el apoyo a la docencia de bases de datos (diseño conceptual y lógico).
Proyectos en Empresa o en Colaboración con Otras Entidades
Previamente se han citado varios trabajos que se desarrollarían en colaboración con otras entidades:
-"Anonimización eficiente de datos de salud utilizando técnicas de aprendizaje automático".
-"Simulación de propagación de virus".
A continuación se mencionan otros.
1.- Desarrollo de aplicación web para búsqueda y consulta de formularios de mantenimiento
Objetivo: se desarrollará una aplicación web que facilite la búsqueda y consulta de formularios en el contexto de una empresa de mantenimiento. La empresa dispone de miles de formularios de inspección en ficheros PDF. Cada formulario ha sido generado a partir de ciertas plantillas. La empresa dispone igualmente de una serie de ficheros CSV en formato tabular que corresponden a los formularios completados para cada plantilla. Cada fichero CSV contiene una serie de columnas que corresponden a los campos del formulario, de forma que las filas del fichero CSV contienen los valores de los campos de cada formulario completado. El objetivo es desarrollar una aplicación web que permita la búsqueda avanzada y filtrado de formularios en función de campos y plantillas para la consulta de cada uno de los valores de los campos y/o del fichero original en formato PDF. Las actividades a desarrollar incluyen: diseño de una base de datos que contiene los metadatos de cada formulario; diseño de la base de datos de ficheros PDF (o estrategia de almacenaje); carga de metadatos en base de datos a través del procesado de los ficheros CSV; desarrollo de aplicación web para consulta de formularios.
2.- Análisis y diseño de un almacén de datos para una institución universitaria
Objetivo: en este trabajo se diseñará e implementará un prototipo de almacén de datos para una institución universitaria, tomando como inspiración fundamentalmente los requisitos de análisis de datos y condicionantes de la Universidad de Zaragoza. Se irá abordando de forma incremental el diseño de diversos "data marts" de interés, enfocados en distintos procesos de negocio, estableciendo prioridades para su desarrollo (con objeto de asegurar que los que se consideren más relevantes se cubran de forma adecuada en el trabajo). Se compararán los "data marts" desarrollados con lo disponible actualmente en el portal de datos abiertos DATUZ, analizando las diferencias y proponiendo (si fuera relevante) posibles extensiones y/o mejoras a uno u otro diseño. También se considerará la posibilidad de abordar algún "data mart" adicional que no esté disponible actualmente en DATUZ. En este trabajo es especialmente relevante el esfuerzo de análisis y de propuesta de soluciones que sean adecuadas no solamente desde el punto de vista teórico sino principalmente desde la perspectiva práctica, teniendo en cuenta todo el contexto de recolección de datos y de explotación. Se utilizará como herramienta de apoyo DBDAp, con la posibilidad de realizar pequeños ajustes y adaptaciones de la herramienta si es necesario, y tecnologías de almacenes de datos.
3.- Soporte para la toma de decisiones en entornos de smart farming
Objetivo: desarrollar un prototipo de aplicación de Smart Farming que integre grandes cantidades de datos de fuentes diversas (datos crudos de sensores, imágenes de satélite, datos procesados resultados de modelos de IA, etc.) y presentarlos a un usuario vía interfaz Web de manera que este los pueda utilizar para tomar decisiones sobre sus cultivos.
En la actual coyuntura social, política, económica y ecológica tomar decisiones adecuadas marca la diferencia entre la sostenibilidad o no de los actores (personas, entidades, etc.) involucrados en las mismas. Esto es particularmente importante en el sector agrario por el impacto directo que sus acciones tienen en el medio ambiente (biodiversidad, cambio climático, gestión eficiente de recursos -agua-, etc.), la sociedad (fijación de población rural, garantizar la cantidad y calidad de alimentación del número creciente de habitantes, etc.) y la sostenibilidad de las propias explotaciones (reducción de tareas innecesarias para reducir los costes, etc.). En consecuencia, dotar a los agricultores y ganaderos de herramientas que les permitan tomar las decisiones más eficientes y eficaces se convierte en una necesidad. Prueba de ello es la acuñación por la comunidad científica y profesional del término Smart Farming para agrupar al conjunto de herramientas que permiten soportar la toma de decisiones.
El foco de este TFG se centra en el desarrollo de un prototipo y una interfaz amigable para el agricultor, más que en la aplicación de técnicas de aprendizaje automático, si bien como parte del proyecto se podría abordar alguna tarea relacionada con minería de datos y aprendizaje automático.
Previsión de tecnologías a utilizar: base de datos relacionales y no relacionales, Python y entornos de desarrollo, tecnologías para la gestión de datos de GIS, Android y/o frameworks de desarrollo para aplicaciones móviles).
Lugar de realización: Zaragoza.
4.- Aplicación móvil basada en la localización para interiores
Proyecto a realizar en la empresa Davisa Informatica S.L. Contacto: Jorge Moliné.
Objetivo: en este proyecto se desarrollará una aplicación móvil que ofrecerá al usuario diversos servicios de navegación e información en el interior de un centro comercial (rutas, puntos de interés, ofertas procedentes de establecimientos cercanos, soporte para búsquedas, etc.). La aplicación se desarrollará para dispositivos Android. Como ayuda para el desarrollo del proyecto, se contará con un prototipo previo desarrollado en C++ que podría servir de inspiración.
Otros Proyectos
1.- Desarrollo de una app de código abierto de apoyo a decisiones de alimentación
Objetivo: se desarrollará una aplicación móvil de código abierto que ayude a los/as usuarios/as a tomar decisiones de alimentación adecuadas. Como parte del proyecto NEAT-AMBIENCE, se desea explotar datos para ayudar a las personas a tomar mejores decisiones. En concreto, en este trabajo se pone el foco en la alimentación de las personas, que pueden tener algún tipo de intolerancia alimenticia (a la lactosa, a la fructosa, al sorbitol, etc.) o simplemente beneficiarse de controlar la ingesta de determinados elementos (por ejemplo, carbohidratos fermentables / FODMAP) por cuestiones de salud. La app permitirá integrar diversas bases de datos de alimentos de forma personalizada (a elección del usuario), así como otra información externa de potencial interés, y permitirá a los/as usuarios/as consultar el contenido de distintas sustancias en los alimentos, llevar un control de los consumos estimados de dichas sustancias, ofrecer recomendaciones y alternativas, etc. Asimismo, se considerará la posibilidad de integrar un diario de alimentación que, junto con la identificación de síntomas digestivos, permita tratar de inferir posibles alimentos que actúen como disparadores de malestar a nivel digestivo.
2.- Desarrollo de una herramienta de apoyo a la elaboración de horarios y calendarios de exámenes de una titulación
Objetivo: se desarrollará una herramienta que sirva de apoyo a la elaboración de los horarios de una titulación (por ejemplo, un grado), así como a la planificación de los calendarios de exámenes. Para la elaboración de los horarios, la herramienta considerará las restricciones existentes (horarios, disponibilidad de laboratorios para la realización de prácticas, etc.) así como las posibles dependencias con otras titulaciones (por ejemplo, en el caso de Programas Conjuntos o asignaturas vinculadas, comunes a varias titulaciones) y permitirá exportar las propuestas de horarios en diversos formatos (incluyendo Excel). Para la planificación de los calendarios de exámenes, se tendrán en cuenta las restricciones fijadas por la normativa de evaluación, así como otras preferencias a tratar de respetar, incluyendo preferencias de asignaturas concretas (por ejemplo, asignaturas que prefieren tener el examen al comienzo de la banda de exámenes, para tener más tiempo para corregir, y asignaturas que prefieren tener el examen al final, por ejemplo porque antes de hacer el examen sea necesario corregir muchos trabajos). Se incorporarán funcionalidades de detección de posibles problemas o situaciones no deseables o mejorables. Se analizará también la posibilidad de generalizar la herramienta para la gestión de horarios de varias titulaciones simultáneamente (por ejemplo, horarios de un centro o facultad), considerando la disponibilidad de espacios existentes.
3.- StyleAdviser: herramienta para mejorar el estilo de documentos escritos
Objetivo: se desarrollará una aplicación que ayudará a depurar y mejorar el estilo de un documento escrito, analizando aspectos como el abuso de la voz pasiva, uso de paréntesis, y diversas medidas de legibilidad. Previamente al desarrollo de la herramienta, se examinarán otras alternativas disponibles comercialmente, como StyleWriter, Writer's Workbench, ClearEdits, o el simple analizador de estadísticas de legibilidad de Microsoft Word. La herramienta desarrollada permitirá trabajar con diversos formatos de documento (al menos texto plano y fuentes Latex, y opcionalmente también otros como Word y PDF). Asimismo, se considerará la incorporación de un corrector gramatical y ortográfico que pueda integrarse como plugin en algún editor popular. Inicialmente se considerán textos escritos en inglés, aunque podría analizarse también la posibilidad de realizar el trabajo de forma que pudiera funcionar con varios idiomas (castellano e inglés) o bien centrar la herramienta en textos en castellano en lugar de textos en inglés, considerando las preferencias de la persona que realice el trabajo.