Topic modeling en twitter: determinación de la agenda política peruana en el periodo de enero a setiembre del 2018

Jesús Eduardo Gamboa Unsihuay

Resumen


El objetivo de esta investigación fue determinar los temas abordados por los distintos grupos de la clase política peruana a través del análisis de los contenidos compartidos por sus miembros en sus cuentas de Twitter, en el periodo de enero a setiembre del 2018, haciendo uso de la técnica de minería conocida como modelo de temas (Topic Modeling) y el modelo de asignación latente de Dirichlet. Se encontró que tres cuartas partes de los contenidos textuales se refieren a la gestión del Poder Ejecutivo y Legislativo, las actividades partidarias de Fuerza Popular y los grupos parlamentarios de izquierda, la corrupción judicial, las funciones de representación parlamentaria y eventos que sucedieron durante los meses de verano; asimismo, se encontraron diferencias en los temas de mayor divulgación entre los grupos políticos. Luego de contrastar dichos hallazgos con los acontecimientos ocurridos en la realidad, se concluyó que la metodología propuesta permite efectivamente detectar los tópicos de la agenda política a partir de un gran volumen de textos.


Palabras clave


minería de texto; segmentación; modelamiento de temas; Twitter; agenda política; Perú.

Texto completo:

PDF HTML

Referencias


Alvarado, J.; Carrillo, A.; Forero, J.; Caicedo, L.; Urueña, J. 2016. Análisis de sentimiento político en twitter para las elecciones de la alcaldía de Bogotá 2015. En: XXVI Simposio Internacional de Estadística, Colombia, 8-12 ago, 2016.

Arun, R.; Suresh, V.; Madhavan, C.; Murty, M. 2010. On Finding the Natural Number of Topics with Latent Dirichlet Allocation: Some Observations. En: Zaki, M.J. et al. (Eds.). Advances in Knowledge Discovery and Data Mining. Springer, Alemania. 391-402 p.

Blei, D.; Ng, A.; Jordan, M. 2003. Latent Dirichlet Allocation. Journal of Machine Learning Research (3): 993-1022.

Cao, J.; Xia, T.; Li, J.; Zhang, Y.; Tang, S. 2009. A density-based method for adaptive LDA model selection. Neurocomputing (72): 1775 – 1781.

Cardenas, R.; Bello, K.; Coronado, A.; Villota, E. 2015. Labor market demand analysis for engineering majors in Peru using Shallow Parsing and Topic Modeling. Machine Learning Summer School. Japón.

Darling, W. 2011. A Theoretical and Practical Implementation Tutorial on Topic Modeling and Gibbs Sampling. Reporte técnico. Disponible en http://u.cs.biu.ac.il/~89-680/darling-lda.pdf

Deveaud, R.; Sanjuan, E.; Bellot, P. 2014. Accurate and Effective Latent Concept Modeling for Ad Hoc Information Retrieval. Revue des Sciences et Technologies de l’Information - Série Document Numérique (17): 61-84.

Presentan moción de vacancia contra PPK por “incapacidad moral”. 2018. Correo, Lima, Perú; 8 marzo. Disponible en https://goo.gl/MX9n1s

PPK: presentan moción de vacancia presidencial. 2017. El Comercio, Lima, Perú; 15 diciembre. Disponible en https://goo.gl/cwvvGx

El diálogo entre Kenji, Bocángel y Mamani. 2018ª. El Comercio, Lima, Perú; 21 marzo. Disponible en https://goo.gl/fxuzGG

Osmán Morote, el cabecilla de Sendero que deja el penal de Ancón. 2018b. El Comercio, Lima, Perú; 18 abril. Disponible en https://goo.gl/7tXzLS

Audios complican situación de jueces y miembros del CNM. 2018c. El Comercio, Lima, Perú; 20 julio. Disponible en https://goo.gl/nujjmh

Pugna entre Ejecutivo y FP se reaviva: Vizcarra y Fujimori frente a frente. 2018d. El Comercio, Lima, Perú; 28 agosto. Disponible en https://goo.gl/BMGTb1

Martín Vizcarra: “Los cuatro proyectos de reforma tienen que aprobarse”. 2018e. El Comercio, Lima, Perú; 19 setiembre. Disponible en https://goo.gl/24UrJj

Odebrecht: Jorge Barata revela aportes a PPK, Fuerza Popular, Nacionalistas y Apra. 2018. Gestión, Lima, Perú; 28 febrero. Disponible en https://goo.gl/k9SuHW

Agricultores de papa se van otra vez a la huelga. 2018a. La República, Lima, Perú; 31 enero. Disponible en https://goo.gl/e7PCki

Congreso aceptó renuncia de PPK. 2018b. La República, Lima, Perú; 23 marzo. Disponible en https://goo.gl/SNihbK

Eyvi Ágreda: Murió la joven que fue quemada en Miraflores. 2018c. La República, Lima, Perú; 1° junio. Disponible en https://goo.gl/rQfjBB

José Luis Cavassa habría trabajado para partido PPK en campaña de 2016. 2018d. La República, Lima, Perú; 7 setiembre. Disponible en https://goo.gl/mZ1iRM

A 51 se eleva la cifra de muertos tras accidente en Pasamayo. 2018a. Perú21, Lima, Perú; 3 enero. Disponible en https://goo.gl/2xSgQG

Así se desarrolló la ‘Marcha por la Vida’ en Lima. 2018b. Perú21, Lima, Perú; 5 mayo. Disponible en https://goo.gl/zgUjh8

Datum. 2018c. Credibilidad de políticos desciende a niveles alarmantes, advierten. Perú21, Lima, Perú; 14 ago. Disponible en https://goo.gl/ytao8z

Fang, A.; Ounis, I.; Habel, P.; Macdonald, C.; Limsopatham, N. 2015. Topic-centric Classification of Twitter User’s Political Orientation. In: 6th Symposium on Future Directions in Information Access, Grecia.

Farías, M. 2017. Twitter como vía para mediar los conflictos sociales: análisis del caso #Conga, Perú. Tesis de licenciatura. Universidad de Piura, Piura. Perú. 89 p.

Fowks, J. 2017. Protesta masiva en Lima contra Kuczynski por el indulto a Fujimori. El País, Lima, Perú; 29 dic. Disponible en https://goo.gl/SbhqQt

Greene, D.; Cross, J. 2017. Exploring the Political Agenda of the European Parliament Using a Dynamic Topic Modeling Approach. Political Analysis (25): 77-94.

Griffiths, T.; Steyvers, M. 2004. Finding scientific topics. National Academy of Sciences of the United States of America (101): 5228-5235.

Grimmer, J. 2009. A Bayesian Hierarchical Topic Model for Political Texts: Measuring Expressed Agendas in Senate Press Releases. Political Analysis (18): 1-35.

Grün, B.; Hornik, K. 2011. Topicmodels: An R package for fitting topic models. Journal of Statistical Software (40): 1-30.

Heinrich, G. 2008. Parameter estimation for text analysis. Reporte técnico. Disponible en http://www.arbylon.net/publications/text-est.pdf

Hidalgo, M. 2017. La vacancia de PPK se resuelve el próximo jueves 21. El Comercio, Lima, Perú; 16 dic. Disponible en https://goo.gl/GJKnnP

Linares, R.; Herrera, J.; Cuadros, A.; Alfaro, L. 2015. Prediction of tourist traffic to Peru by using sentiment analysis in Twitter social network. In: Latin American Computing Conference, 19-23 oct, 2015. Lima, Perú.

Mateo, J. 2016. Análisis de contenidos en Social Media: Clasificación de mensajes e identificación de influyentes en el Banco Central Europeo (BCE). Trabajo de máster. Universidad Complutense de Madrid, Madrid, España. 71 p.

Montesinos, L. 2014. Análisis de sentimientos y predicción de eventos en Twitter. Tesis de pregrado. Universidad de Chile, Santiago de Chile. Chile. 60 p.

Pla, F.; Hurtado, L. 2014. Political Tendency Identification in Twitter using Sentiment Analysis Techniques. In: 25th International Conference on Computational Linguistics, 23-29 agosto, 2014. Irlanda.

Presidencia del Consejo de Ministros. 2018. Decreto Supremo que convoca a Elecciones Regionales y Municipales 2018; 4 ene. Disponible en https://goo.gl/xKjcrE

Ramos, I. 2018. Vizcarra convoca a referéndum para combatir la corrupción en Perú. Diario Financiero, Lima, Perú; 10 oct. Disponible en https://goo.gl/Bu1JQe

SBS [Superintendencia de Banca y Seguros]. 2018. SBS Informa. Boletín Semanal N° 021. Disponible en https://goo.gl/AGvHLi

Sigueñas, M. 2016. Técnicas de Minería de Textos para el Análisis de Discursos y Documentos. Disponible en https://goo.gl/i79hg8

Vilcachagua, P. 22 de enero de 2018. Papa Francisco en el Perú: Lo que nos dejó la visita del Sumo Pontífice. Perú21. Disponible en https://goo.gl/xX1dan

Vílchez, C.; Alhuay, J. 2016. Use of text mining for understanding Peruvian students and faculties’ perceptions on bibliometrics training. In: 3rd Annual International Symposium on Information Management and Big Data, 1-3 set, 2016. Lima, Perú.

Vollenweider, C. 2018. 2018: El año de la crisis peruana. Disponible en http://www.celag.org/2018-el-ano-crisis-peruana/

Yano, T.; Cohen, W.; Smith, N. 2009. Predicting response to political blog posts with topic models. Proceedings of Human Language Technologies. In: The 2009 Annual Conference of the North American Chapter of the Association for Computational Linguistics, 1° jun., 2009. Estados Unidos.




DOI: http://dx.doi.org/10.21704/ac.v80i2.1446

Enlaces refback

  • No hay ningún enlace refback.


Copyright (c) 2020 Jesús Eduardo Gamboa Unsihuay

 width=

 La revista Anales Científicos de la Universidad Nacional Agraria La Molina esta trabajo está licenciado bajo una Licencia Internacional Creative Commons Atribución-NoComercial 4.0.

 

ISSN:  2519-7398 (electrónico); 0255-0407 (impreso)
DOI: http://dx.doi.org/10.21704/ac
Dirección: Av. La Molina s/n La Molina. Oficina de Gestión de la Investigación. Universidad Nacional Agraria La Molina. Lima, Perú.
Apartado postal: 12-056 - La Molina / Lima – Perú. 


Revista Anales Científicos
Universidad Nacional Agraria La Molina
Teléfonos (51-1)-614-7800 anexos 179 
Contacto: analescientificos@lamolina.edu.pe