Objetivos y opciones científicas
Esta página presenta un estudio de nuestro corpus desde el punto de vista de los topónimos. Nuestros objetivos son 1) enriquecer nuestras ediciones digitales con información geográfica, 2) desarrollar un mapa interactivo que permita explorar dichos lugares, y 3) analizar estadísticamente los lugares identificados.
Los topónimos se detectaron automáticamente utilizando el marco Flair, y después los enriquecimos manualmente con información nueva para ayudarnos a alcanzar nuestros objetivos. Para una presentación detallada del proceso técnico y las herramientas utilizadas, consulte la página Aspectos técnicos.
Al tener en cuenta la antigüedad de nuestro corpus y la utilización de un repositorio moderno (Wikidata) para geolocalizar los topónimos, tuvimos que tomar una serie de decisiones para conciliar estos dos aspectos y poder localizar los lugares en un mapa:
- Nombres antiguos: si su forma moderna existe en Wikidata, le asignamos las coordenadas geográficas asociadas a la denominación moderna (por ejemplo, Golfo de Lepanto = Golfo de Corinto); si las denominaciones antiguas están presentes en Wikidata, asignamos las coordenadas correspondientes (por ejemplo, Castilla Vieja, Tracia).
- Si una región y una ciudad tienen el mismo nombre y no es posible diferenciarlas, utilizamos las coordenadas geográficas de la ciudad.
- En el caso de los nombres de calles, barrios o plazas, si el texto lo permite, los hemos asociado a las coordenadas de una ciudad específica.
- Algunos lugares no aparecen en el mapa, bien porque son inclasificables, como Calidonio o Lacerda, bien porque son ambiguos, como la calle Limones o la Torre de San Pablo, que pueden corresponder a varios lugares. La lista de estas localidades figura en el índice.
Análisis general del corpus
Los gráficos y las tablas se han elaborado con la herramienta R. Los datos proceden del análisis de los topónimos del corpus Moreno. A continuación, estos topónimos se cruzaron con otros datos, como la fecha de publicación o el nombre del editor. El código está disponible en Github.
Este gráfico pone de manifiesto la variedad de topónimos mencionados en el corpus. Mientras que España destaca por aparecer más de 200 veces, la frecuencia de otros topónimos disminuye rápidamente y se caracteriza por esta larga sucesión, con lugares mencionados 1 o 2 veces en el corpus. Sólo el 25 % de los lugares se citan más de 4 veces. La mitad de los lugares se citan menos de 2 veces.
Los topónimos más comunes
Análisis específicos
Distribución de topónimos por fecha de publicación
Clave de lectura: De todas las apariciones del lugar de Valencia, el 68,4 % tuvieron lugar entre 1850 y 1859.
Distribución de los lugares según el aspecto sagrado/profano del texto
Clave de lectura : Roma representa el 13,8 % de los topónimos citados en los textos sagrados (sobre la base de topónimos citados más de 20 veces).