Topic modelling
Este prototipo permite explorar el corpus desde el punto de vista de los temas (o tópicos) que se encuentran más presentes en él. Cada burbuja representa un tema. Al hacer clic en una de ellas, el gráfico muestra las palabras reunidas bajo el mismo tema por su pertenencia al mismo campo semántico. Por ejemplo, el tema 6 está relacionado con la realeza; el tema 2, con los romances caballerescos; el tema 3, con la religión; el tema 9, con la guerra; el tema 4, con el amor, etc.
Este trabajo exploratorio se realizó en el marco del hackathon organizado por el proyecto Visual Contagions (17-19 de junio de 2024, Universidad de Ginebra). Aunque el prototipo fue producido en un tiempo limitado (dos días), este demuestra la viabilidad y el interés de un enfoque de este tipo para un corpus mediano de impresos. También nos permite plantearnos nuevas vías de investigación para el análisis de esta literatura, en particular con vistas a ampliar el corpus para incluir más datos de épocas distintas.
El código R utilizado para desarrollar esta visualización está disponible en GitHub.
Diseño científico: Marina Berazategui, Simon Gabay, Pauline Jacsont, Elina Leblanc, Fassaleh Taal
Desarrollo: Simon Gabay
Incorporación al sitio web: Elina Leblanc