News

The article "GSITK: A sentiment analysis framework for agile replication and development", by Oscar Araque, J. Fernando Sánchez-Rada, and Carlos A. Iglesias has been published in the SoftwareX journal (1.959 impact factor, JCR Q3 2020). The paper describes the GSITK software, which is a framework to perform a wide variety of sentiment analysis tasks including dataset acquisition, text preprocessing, model design, and performance evaluation.

The full paper can be openly accessed at this URL.

 

Abstract:

GSITK is a framework to perform a wide variety of sentiment analysis tasks, including dataset acquisition, text preprocessing, model design, and performance evaluation. The framework is oriented to both researchers and practitioners, easing the replication of previous sentiment models, as well as offering implementations of common tasks. This is achieved by building several abstractions on top of popular libraries such as scikit-learn and NLTK. In this way, GSITK allows users to implement complex sentiment pipelines using comprehensible Python code. The framework is Open Source and has been used successfully in several research projects and competitions.

Ha sido aprobada la solicitud de un Proyecto de Innovación Educativa de aprendizaje basado en retos en la Convocatoria de 2021-2022 de “Ayudas a la Innovación Educativa y a la Mejora de la Calidad de la Enseñanza” de la Universidad Politécnica de Madrid.

El proyecto se centrará en mejorar la experiencia tanto de alumnos como de profesores en la enseñanza de asignaturas prácticas relacionadas con programación.

Aprender a programar requiere una combinación de aprendizaje de conceptos generales, conceptos específicos del lenguaje o plataforma utilizados, y mucha práctica por parte del alumno. Sin embargo, enlazar las clases teóricas con los elementos prácticos es un reto para los docentes. El enfoque tradicional consiste en complementar las clases teóricas con ejercicios para los alumnos. Esos ejercicios son corregidos ya sea de manera manual o a través de herramientas como tareas autocorregidas en moodle.

Ese enfoque tiene dos problemas. Por un lado, existe una separación muy clara entre clases teóricas y actividades prácticas. Por otro lado, la necesidad de recurrir a herramientas como moodle para la evaluación significa que el bucle de realimentación con el alumno es más lento. Además, diseñar y configurar este tipo de tareas puede ser costoso, lo que en la práctica implica que el número de tareas de este tipo es muy reducido.

Una alternativa a este enfoque es el uso de material que combina elementos teóricos con partes interactivas y prácticas. Uno de los entornos más extendidos en este ámbito son los Jupyter Notebooks. En el grupo de “Aplicación de Tecnologías Inteligentes a la Educación en Ingeniería” hemos migrado gradualmente varios cursos de materiales tradicionales(transparencias, documentos) a formato de Jupyter Notebook. Los Notebooks resultantes intercalan documentación, elementos guiados que permiten a los alumnos probar por sí mismos y código de autoevaluación. Ese código permite a los alumnos detectar sus errores e iterar rápidamente, sin salir del entorno de Jupyter. Una vez completadas las tareas, los alumnos guardan el notebook y lo entregan a través de Moodle. Los profesores pueden posteriormente evaluar las entregas manualmente o mediante tests más exhaustivos que los de autoevaluación.

No obstante, existen dos limitaciones. Por un lado, separar el contenido completo (con soluciones oficiales) del que se les comparte a los alumnos puede resultar tedioso, y un error puede llevar a liberar la solución a los alumnos. Por otro lado, evaluar de forma exhaustiva los notebooks entregados puede ser costoso. Existen herramientas para generar tareas de evaluación, pero no están integradas adecuadamente con la plataforma de aprendizaje usada en la universidad (moodle). En este proyecto, proponemos la integración del enfoque de enseñanza basado en Jupyter Notebooks con herramientas que permitan la evaluación automatizada de las entregas de los alumnos. El objetivo es facilitar la creación de material didáctico autocontenido que combine los conceptos teóricos con la experimentación autónoma por parte del alumno.

Esperamos que proporcionar un entorno de creación de contenido híbrido autoevaluable y evaluable de forma externa promueva el uso de este tipo de material en el aula. Basándonos en la experiencia en cursos similares, ese tipo de contenido tiene una acogida fantástica entre los alumnos, y facilitar su creación sólo puede contribuir a aumentar el contenido y mejorar su calidad.

The article "Transfer Learning with Social Media Content in the Ride-Hailing Domain by Using a Hybrid Machine Learning Architecture", by Álvaro de Pablo, Oscar Araque, and Carlos A. Iglesias has been published in the Electronics journal (2.397 impact factor, JCR Q3 2020). This work is a product of the Cabify-UPM Chair (Cátedra Cabify-UPM))

The full paper can be found at this URL.

 

Abstract:

The analysis of the content of posts written on social media has established an important line of research in recent years. The study of these texts, as well as their relationship with each other and their dependence on the platform on which they are written, enables the behavior analysis of users and their opinions with respect to different domains. In this work, a hybrid machine learning-based system has been developed to classify texts using topic modeling techniques and different word-vector representations, as well as traditional text representations. The system has been trained with ride-hailing posts extracted from Reddit, showing promising performance. Then, the generated models have been tested with data extracted from other sources such as Twitter and Google Play, classifying these texts without retraining any models and thus performing Transfer Learning. The obtained results show that our proposed architecture is effective when performing Transfer Learning from data-rich domains and applying them to other sources.

 

El 20 de Diciembre de 2021, por Resolución del Rector de la Universidad Politécnica de Madrid, se ha premiado al Profesor Óscar Araque con el Premio al Artículo Científico más citado de una Tesis Doctoral desarrollada y defendida en la UPM en su edición 2021. El artículo por el cual se ha recibido el galardón es "Enhancing deep learning sentiment analysis with ensemble techniques in social applications", publicado en la revista Expert Systems with Applications (JCR Q1 2017, 3.768), y forma parte de la tesis de Óscar Araque.

A día de hoy, esta publicación tiene:

On 26/11/2021 the awards for the best doctoral theses and master's theses awarded by the Colegio Oficial de Ingenieros de Telecomunicación (COIT) in 2020 and 2021 were presented. In this edition two members of the GSI have been awarded:

    - Mr. Óscar Araque, ISDEFE Awards for the Best Doctoral Thesis in Security and Defense.
    - D. Diego Benito, IN-NOVA Award for the Best Master's Thesis in Applications and Services for Cyber Defense and Cyber Intelligence.