Esta investigación presenta una metodología innovadora para monitorizar conversaciones sobre desinformación en redes sociales a partir de técnicas computacionales de dos disciplinas: Procesamiento del Lenguaje Natural y Análisis de Redes Sociales. Mediante la aplicación de modelos de lenguaje y grafos, se generan modelos que permiten entender el ecosistema completo de las falsedades, su evolución a lo largo del tiempo y sus desmentidos en estas plataformas sociales.
Mediante las palabras claves extraídas de enunciados de información falsa (claims) verificados por fact-checkers, este trabajo ha obtenido los posts a lo largo del tiempo sobre una falsedad en redes sociales y los ha convertido en embeddings semánticos a través de modelos de lenguaje. Sobre estos posts, se aplican modelos entrenados en tareas de Natural Language Inference con el objetivo de evaluar su nivel de alineamiento con el texto original. Esto permite saber si ambos expresan lo mismo, lo contrario o neutralidad entre sí, identificando el papel de cada contenido dentro de la conversación sobre desinformación.
Con estos tres indicadores, unidos a distintos metadatos descargados de la red social, esta tesis plantea una serie de métodos para analizar toda la conversación existente alrededor de una determinada desinformación. Mediante la generación de grafos, estos contenidos sobre la información falsa se estructuran en nodos (los posts en sí) y sus conexiones (republicaciones y respuestas), visualizados en función a su alineación con el claim y ordenados cronológicamente. De esta manera, se consigue explorar el ciclo de vida de esta pieza de desinformación en la red social desde su origen, incluyendo los usuarios que la comparten, sus distintas formas o los desmentidos lanzados hacia ella (por ejemplo, por los fact-checkers).
Este trabajo intenta realizar un importante progreso en el fact-checking semiautomático, donde la integración de modelos de lenguaje y otros métodos de inteligencia artificial, lejos de sustituir la rutina profesional de los fact-checkers, trata de ayudarlos. Mediante una combinación con técnicas de Análisis de Redes Sociales y visualizaciones en forma de grafos, el objetivo de esta investigación es proporcionar una herramienta que permita entender mejor los mecanismos bajo los cuales se genera desinformación y se disemina, así como ayudar a detectarla y prevenirla.
ABSTRACT
This research presents an innovative methodology for monitoring conversations that include disinformation in social networks based on computational techniques from two disciplines: Natural Language Processing and Social Network Analysis. Through the application of language processing and graphs, models are generated to monitor the entire ecosystem of falsehoods, their evolution over time and their denials on these social platforms.
By searching through a series of keywords extracted from false information statements (claims) disproved by fact-checkers, this work has obtained the posts over time about a falsehood in social networks and has converted them into semantic embeddings through language models. Models trained in Natural Language Inference tasks are applied on these posts to evaluate their level of alignment with the original text. This allows us to know whether both express the same, the opposite or neutrality to each other, identifying the role of each content within the conversation about misinformation.
With these three indicators, together with different metadata downloaded from the social network, this thesis proposes a series of methods to analyse all the existing conversation around a given piece of disinformation. Through the generation of graphs, these contents about false information are structured in nodes (the posts themselves) and their connections (reposts and responses), visualised according to their alignment with the claim and ordered chronologically. In this way, it is possible to explore the life cycle of this piece of disinformation in the social network from its origin, including the users who share it, its different forms or the disavowals launched towards it (for example, by the fact-checkers).
This work attempts to make important progress in semi-automatic fact-checking, where the integration of language models and other artificial intelligence methods, far from replacing the professional routine of the fact-checkers, tries to help them. Through a combination of Social Network Analysis techniques and graph-based visualisations, the aim of this research is to provide a tool to better understand the mechanisms under which disinformation is generated and disseminated, as well as to help detect and prevent it.
Esta investigación presenta una metodología innovadora para monitorizar conversaciones sobre desinformación en redes sociales a partir de técnicas computacionales de dos disciplinas: Procesamiento del Lenguaje Natural y Análisis de Redes Sociales. Mediante la aplicación de modelos de lenguaje y grafos, se generan modelos que permiten entender el ecosistema completo de las falsedades, su evolución a lo largo del tiempo y sus desmentidos en estas plataformas sociales.
Mediante las palabras claves extraídas de enunciados de información falsa (claims) verificados por fact-checkers, este trabajo ha obtenido los posts a lo largo del tiempo sobre una falsedad en redes sociales y los ha convertido en embeddings semánticos a través de modelos de lenguaje. Sobre estos posts, se aplican modelos entrenados en tareas de Natural Language Inference con el objetivo de evaluar su nivel de alineamiento con el texto original. Esto permite saber si ambos expresan lo mismo, lo contrario o neutralidad entre sí, identificando el papel de cada contenido dentro de la conversación sobre desinformación.
Con estos tres indicadores, unidos a distintos metadatos descargados de la red social, esta tesis plantea una serie de métodos para analizar toda la conversación existente alrededor de una determinada desinformación. Mediante la generación de grafos, estos contenidos sobre la información falsa se estructuran en nodos (los posts en sí) y sus conexiones (republicaciones y respuestas), visualizados en función a su alineación con el claim y ordenados cronológicamente. De esta manera, se consigue explorar el ciclo de vida de esta pieza de desinformación en la red social desde su origen, incluyendo los usuarios que la comparten, sus distintas formas o los desmentidos lanzados hacia ella (por ejemplo, por los fact-checkers).
Este trabajo intenta realizar un importante progreso en el fact-checking semiautomático, donde la integración de modelos de lenguaje y otros métodos de inteligencia artificial, lejos de sustituir la rutina profesional de los fact-checkers, trata de ayudarlos. Mediante una combinación con técnicas de Análisis de Redes Sociales y visualizaciones en forma de grafos, el objetivo de esta investigación es proporcionar una herramienta que permita entender mejor los mecanismos bajo los cuales se genera desinformación y se disemina, así como ayudar a detectarla y prevenirla.
ABSTRACT
This research presents an innovative methodology for monitoring conversations that include disinformation in social networks based on computational techniques from two disciplines: Natural Language Processing and Social Network Analysis. Through the application of language processing and graphs, models are generated to monitor the entire ecosystem of falsehoods, their evolution over time and their denials on these social platforms.
By searching through a series of keywords extracted from false information statements (claims) disproved by fact-checkers, this work has obtained the posts over time about a falsehood in social networks and has converted them into semantic embeddings through language models. Models trained in Natural Language Inference tasks are applied on these posts to evaluate their level of alignment with the original text. This allows us to know whether both express the same, the opposite or neutrality to each other, identifying the role of each content within the conversation about misinformation.
With these three indicators, together with different metadata downloaded from the social network, this thesis proposes a series of methods to analyse all the existing conversation around a given piece of disinformation. Through the generation of graphs, these contents about false information are structured in nodes (the posts themselves) and their connections (reposts and responses), visualised according to their alignment with the claim and ordered chronologically. In this way, it is possible to explore the life cycle of this piece of disinformation in the social network from its origin, including the users who share it, its different forms or the disavowals launched towards it (for example, by the fact-checkers).
This work attempts to make important progress in semi-automatic fact-checking, where the integration of language models and other artificial intelligence methods, far from replacing the professional routine of the fact-checkers, tries to help them. Through a combination of Social Network Analysis techniques and graph-based visualisations, the aim of this research is to provide a tool to better understand the mechanisms under which disinformation is generated and disseminated, as well as to help detect and prevent it. Read More


