数据描述
Contexto
El Procesamiento del Lenguaje Natural es una de las áreas de la inteligencia artificial muy estudiada hoy en día que tiene entre otros objetivos el entendimiento del lenguaje natural. El NLP esta avanzando cada día más pero se centra mucho en la lengua inglesa. Con este dataset se pretende aportar a la comunidad un pequeño corpus en Español con tweets escritos por políticos/as Españoles/as de los partidos PSOE, PP, VOX, Unidas Podemos y Ciudadanos.
Contenido
El dataset (copus) esta formado por:
- cuenta: Nombre de la cuenta de twitter (haseada) que escribe el tweet.
- partido: Partido político al que pertenece el usuario
- timestamp: Instante en el que se publicó el tweet.
- tweet: Contenido textual del tweet.
Agradecimientos
Inspiración
Con este dataset espero que los usuarios de Kaggle de habla hispana se animen a compartir conocimiento de Procesamiento de Lenguaje Natural por medio de Notebooks y que podamos aprender sobre NLP en Español.
验证报告
以下为卖家选择提供的数据验证报告:
