Agrupar temáticamente antes de clasificar: un enfoque para mejorar la detección automatizada de narrativas desinformativas
An exploratory evaluation of thematic clustering as a preprocessing stage in the automated detection of climate disinformation
DOI:
https://doi.org/10.62269/cavcaa.54Palabras clave:
desinformación climática, agrupamiento temático, clasificación narrativa, inferencia de lenguaje natural, modelos de lenguaje preentrenadosResumen
Este estudio explora el impacto del agrupamiento temático y del filtrado geográfico estratificado como fase previa en la detección automatizada de posturas narrativas frente a la desinformación climática en medios digitales. A partir de 50 bulos verificados y 2.395 noticias publicadas en español, se empleó un enfoque no supervisado para organizar los contenidos en dos clústeres semánticos diferenciados. Posteriormente, se aplicó un modelo de inferencia de lenguaje natural (NLI) utilizando formulaciones representativas de los bulos climáticos, para clasificar las noticias en las categorías de apoyo, refutación o neutralidad. La evaluación se desarrolló en tres escenarios experimentales, con muestras etiquetadas manualmente. Los resultados muestran que la organización temática previa, especialmente cuando se combina con un filtrado semántico por similitud, contribuye a mejorar la precisión narrativa del sistema.













