El presente Trabajo de Fin de Grado tiene por objeto el estudio del author profiling como disciplina dentro del procesamiento del lenguaje natural, con especial atención a su evolución reciente en el marco de las competencias PAN (Plagiarism Analysis, Authorship and Social Software Misuse), celebradas entre los años 2020 y 2024. El objetivo principal consiste en analizar de forma sistemática los enfoques metodológicos aplicados en dichas ediciones, identificando patrones tecnológicos, estrategias recurrentes y su rendimiento relativo en tareas de clasificación de autor, verificación de autoría, detección de cambios de estilo y análisis moral. La investigación se apoya en 40 trabajos seleccionados en función de su rendimiento técnico y relevancia documental. A partir de un proceso de revisión cualitativa y análisis comparativo, se realiza una clasificación de modelos en cuatro grandes categorías: enfoques tradicionales, redes neuronales clásicas, arquitecturas basadas en transformers y sistemas híbridos. El estudio revela la progresiva consolidación de modelos preentrenados de gran escala (LLMs) y la aplicación de técnicas de few-shot learning en entornos con recursos limitados. El trabajo concluye con una reflexión crítica sobre los desafíos éticos asociados al perfilado automatizado de autoría y propone una línea futura de investigación centrada en el análisis moral del discurso digital
El presente Trabajo de Fin de Grado tiene por objeto el estudio del author profiling como disciplina dentro del procesamiento del lenguaje natural, con especial atención a su evolución reciente en el marco de las competencias PAN (Plagiarism Analysis, Authorship and Social Software Misuse), celebradas entre los años 2020 y 2024. El objetivo principal consiste en analizar de forma sistemática los enfoques metodológicos aplicados en dichas ediciones, identificando patrones tecnológicos, estrategias recurrentes y su rendimiento relativo en tareas de clasificación de autor, verificación de autoría, detección de cambios de estilo y análisis moral. La investigación se apoya en 40 trabajos seleccionados en función de su rendimiento técnico y relevancia documental. A partir de un proceso de revisión cualitativa y análisis comparativo, se realiza una clasificación de modelos en cuatro grandes categorías: enfoques tradicionales, redes neuronales clásicas, arquitecturas basadas en transformers y sistemas híbridos. El estudio revela la progresiva consolidación de modelos preentrenados de gran escala (LLMs) y la aplicación de técnicas de few-shot learning en entornos con recursos limitados. El trabajo concluye con una reflexión crítica sobre los desafíos éticos asociados al perfilado automatizado de autoría y propone una línea futura de investigación centrada en el análisis moral del discurso digital Read More


