Aplicación de tecnologías NLP para un estudio sobre el discurso misógino en Youtube

Bookmark (0)
Please login to bookmark Close

Este Trabajo de Fin de Grado se centra en el uso de tecnologías de procesamiento de lenguaje natural (NLP) y análisis de sentimientos para el análisis de discursos en Internet, en concreto, los discursos misóginos en la red social Youtube. En un contexto donde el contenido digital y las redes sociales juegan un papel fundamental en la configuración de opiniones y actitudes, es crucial comprender cómo se manifiestan y proliferan las expresiones de odio y discriminación. Gracias a los avances de los últimos años en dichas tecnologías podemos ofrecer un análisis profundo de dichos discursos.
Con la ayuda de la API de Youtube se ha podido crear un dataset de cientos de miles de comentarios encontrados en los diferentes vídeos de los dos youtubers antifeministas más reconocidos en Youtube España (Roma Gallardo y Un Tio Blanco Hetero). Este corpus, junto con el uso de librerías de clasificación de texto basados en aprendizaje automático como Pysentimiento o Bertopic, nos ayudará a determinar si el contenido antifeminista tiene una respuesta misógina y negativa por parte de la audiencia.
En conclusión, este trabajo demuestra el potencial de las tecnologías de procesamiento del lenguaje natural para contribuir al análisis de discursos en plataformas de redes sociales, ofreciendo una herramienta valiosa tanto para la investigación académica como para la práctica de la moderación de contenidos.
Abstract:
One of the most remarkable events in the last years of Internet is the rise of social media platforms, offering a space for users to post and discuss their opinions about different social aspects. The growth of the use of these platforms has amplified the dissemination of various forms of online harassment, including misogyny. The aim of this study is exploring the use of NLP technologies to identify and analyze misogynistic speeches and behaviors in the comments section from two of the most famous anti-feminist channels in Youtube Spain. Taking advantege of the Youtube API we are able to build a dataset of this comments, which are going to be processed by different NLP and sentiment analysis libraries as Pysentimiento along with the implementation of topics analyzer as Bertopic, with the aim of showing how this advanced technologies are capable of making deep linguistic analysis to detect patterns and prevalence of misogynistic language.

​Este Trabajo de Fin de Grado se centra en el uso de tecnologías de procesamiento de lenguaje natural (NLP) y análisis de sentimientos para el análisis de discursos en Internet, en concreto, los discursos misóginos en la red social Youtube. En un contexto donde el contenido digital y las redes sociales juegan un papel fundamental en la configuración de opiniones y actitudes, es crucial comprender cómo se manifiestan y proliferan las expresiones de odio y discriminación. Gracias a los avances de los últimos años en dichas tecnologías podemos ofrecer un análisis profundo de dichos discursos.
Con la ayuda de la API de Youtube se ha podido crear un dataset de cientos de miles de comentarios encontrados en los diferentes vídeos de los dos youtubers antifeministas más reconocidos en Youtube España (Roma Gallardo y Un Tio Blanco Hetero). Este corpus, junto con el uso de librerías de clasificación de texto basados en aprendizaje automático como Pysentimiento o Bertopic, nos ayudará a determinar si el contenido antifeminista tiene una respuesta misógina y negativa por parte de la audiencia.
En conclusión, este trabajo demuestra el potencial de las tecnologías de procesamiento del lenguaje natural para contribuir al análisis de discursos en plataformas de redes sociales, ofreciendo una herramienta valiosa tanto para la investigación académica como para la práctica de la moderación de contenidos.
Abstract:
One of the most remarkable events in the last years of Internet is the rise of social media platforms, offering a space for users to post and discuss their opinions about different social aspects. The growth of the use of these platforms has amplified the dissemination of various forms of online harassment, including misogyny. The aim of this study is exploring the use of NLP technologies to identify and analyze misogynistic speeches and behaviors in the comments section from two of the most famous anti-feminist channels in Youtube Spain. Taking advantege of the Youtube API we are able to build a dataset of this comments, which are going to be processed by different NLP and sentiment analysis libraries as Pysentimiento along with the implementation of topics analyzer as Bertopic, with the aim of showing how this advanced technologies are capable of making deep linguistic analysis to detect patterns and prevalence of misogynistic language. Read More