EuroSentiment. Language Resource Pool for Sentiment Analysis in European Languages

Status

Finished

Proposed start date

2012-09-03

Proposed end date

2014-09-03

Description

Durante los últimos años, ha habido un gran aumento en el uso de las redes sociales y los blogs para que los ciudadanos y los consumidores expresar ampliamente sus opiniones sobre diferentes temas como la política, la sociedad y los medios de comunicación, a través de estos canales. Sin embargo, el desarrollo de sistemas de análisis de los sentimientos de estas opiniones se ve obstaculizada por las dificultades de acceso y obtener los recursos lingüísticos necesarios, por varias razones: (i) el lenguaje propietarios de los recursos temores de perder competitividad, (ii) la falta de recursos de idiomas convenidos esquemas de sentimiento magnitudes de análisis y no normalizados formeasuring fuerza sentimiento, (iii) los altos costos de adaptación de los recursos existentes para el análisis del lenguaje sentimiento, (iv) redujo la visibilidad, accesibilidad e interoperabilidad de los recursos lingüísticos. El proyecto tiene como objetivo desarrollar un gran banco de datos compartidos para los recursos lingüísticos destinados a ser utilizados por los sistemas analizadores, con el fin de agrupar juntos los recursos dispersos. Uno de los objetivos es extender el dominio del análisis WordNet sentimiento. El proyecto también especifica un esquema para el análisis de sentimiento y normalizar la fuerzas usadas como métricas sentimiento. La distribución de los recursos se apoyará en un auto-sostenible y rentable frameworkbased en un modelo de gobierno de la comunidad, ofreciendo a los contribuyentes la posibilidad de explotar comercialmente los recursos que proporciona. El proyecto se estructura alrededor de los siguientes pasos:

  • definición de un esquema común para garantizar la interoperabilidad
  • adquisición y limpieza de recursos lingüísticos
  • despliegue de los recursos y la validación a través de manifestantes mineros de opinión en el hotel y dominios electrónicos.

Los usuarios son B2B incluyendo los desarrolladores de servicios, proveedores de contenido, los propietarios de LR. El banco de datos cubre 6 idiomas: Inglés Alemán Italiano Portugués catalán y español.

Código proyecto: SME-DCL  296277

Socios:

  • Paradigma Tecnológico (coordinador)
  • DERI
  • Expert System
  • Foundazione Bruno Kessler
  • Sindice
  • UPM