Design and Implementation of a Scraping system for Sport News

Javier Ochoa. (2017). Design and Implementation of a Scraping system for Sport News. Final Career Project. ETSI Telecomunicación, Universidad Politécnica de Madrid.

Abstract:
Hoy en día tenemos acceso a un gran número de medios de comunicación publicados en Internet así como en medios sociales. Esto nos permite realizar diferentes análisis, tales como el origen de las noticias, o evaluar la objetividad de los medios.En este proyecto tenemos como objetivo realizar un análisis del tratamiento que hacen diferentes medios de las noticias deportivas. Con este objetivo, el proyecto se centrará en la obtención de análisis de noticias deportivas para su posterior análisis. Los objetivos del proyecto son: 1. Diseñar e implementar un sistema de recuperación de noticias deportivas. 2. Evaluar la objetividad de dichos medios respecto de su opinión sobre equipos y jugadores, permitiendo un análisis tanto de un hecho concreto como su sentimiento en el tiempo. Las tareas que realizará el proyecto son: 1. Revisar sistemas de agregación de noticias deportivas empleando APIs disponibles o técnicas de scraping. 2. Diseñar el sistema de scraping de noticias, centrado en noticias deportivas. 3. Integrar los sistemas recopilados en un sistema de análisis de textos basado en una plataforma de big data. 4. Crear una aplicación web que permita ver los análisis. 5. Evaluar el sistema.