Kurzbeschreibung des Projekts (Deutsch)

Das Projekt hat zum Ziel, der internationalen Öffentlichkeit ein umfangreiches, wissenschaftlich fundiertes und semantisch strukturiertes Datenarchiv zum mittelalterlichen Spanisch einfach und schnell im Internet unter dem Namen Diccionario del Español Medieval electrónico (DEMel) frei zugänglich zu machen – und damit die Ergebnisse eines über 25-jährigen Forschungsprojekts zu publizieren.

Als Grundlage dient das bislang nicht publizierte äußerst umfangreiche Datenarchiv, des zum Ende 2007 aus finanziellen Gründen eingestellten Diccionario del Español Medieval (DEM) (26 veröffentlichte Faszikel von „A“ – „almohatac“). Das Datenarchiv deckt eine umfassende Textbasis von über 600 Werken bzw. Text- und Dokumentsammlungen aus der Zeit des 10. bis zum beginnenden 15. Jahrhunderts ab. Es besteht aus ca. 900.000 Karteikarten, davon 700.000 so genannten Belegkarten, auf denen die mittelalterlichen Wortformen mit ihrem jeweiligen Verwendungszusammenhang und der Datierung sowie grammatischen, semantischen und etymologischen Informationen notiert sind. Auf manchen Karteikarten befinden sich mehrere dokumentierte Wortformen (Belege), so dass sich bei 33.000 erfassten Lemmata eine Summe von knapp über 1.000.000 Belegen ergibt. Die übrigen ca. 200.000 so genannten „Sekundär“-Karten enthalten Verweise auf etymologische Forschungsliteratur und weitere Fachliteratur, bibliographische Daten u. a.

Die Sammlung liegt bisher nur in Papierform („Zettelkasten“) vor. Die Verfügbarmachung des Archivs ist umso relevanter, als es bisher kein umfassendes historisches Wörterbuch zum mittelalterlichen Spanisch gibt. Durch die Digitalisierung und Online-Stellung soll das Material langfristig gesichert und der internationalen Wissenschaftsgemeinschaft frei zugänglich gemacht werden. Die hierfür notwendigen Arbeitsschritte bestehen in der Digitalisierung der Karteikarten, der Entwicklung einer Datenbankstruktur, der Erfassung der auf den Karteikarten enthaltenen Informationen und der Bereitstellung einer webbasierten Nutzeroberfläche.

Das auf diese Weise aufbereitete elektronische Archiv DEMel ermöglicht die komfortable Durchsuchbarkeit und einen raschen Zugriff auf eine große Fülle altspanischer Belege und viele zusätzliche Informationen, z.B. zu Wortart, Bedeutung, Datierung u.a. Die breite thematische Fächerung der zugrundeliegenden Texte (Belletristik, religiöse und juristische Schriften, Sachtexte zu Astronomie, Mineralogie, Botanik u.a.) ermöglicht es, bisher nicht erfasste Bestandteile des mittelalterlichen Wortschatzes zu beschreiben, was das DEMel sowohl für Hispanisten als auch für Wissenschaftler anderer Fachgebiete zu einer wertvollen Informationsquelle macht und eine hervorragende Ausgangsbasis für weiterführende Forschungen z. B. auf dem Gebiet der Arabistik, Judaistik, Soziologie, Theologie, des Mittellateins und der Rechtsgeschichte bietet. Die Veröffentlichung des Materials von A–Z stellt somit ein dringendes Desiderat dar.

Brief description of the project (English)

The project aims at offering a broad, international public free and efficient access to an extensive data archive of medieval Spanish (Diccionario del Español Medieval electrónico – DEMel) grounded on sound scientific research and organized according to semantic structure.                               

The archive is based on the extensive and hitherto unpublished data compiled during the preliminary work on the Diccionario del Español Medieval. (The DEM project, which produced 26 published fascicles, was ended in 2007 due to financial reasons). It draws on a broad range of 600 books or collections of texts and documents dating from the 10th to the beginning of the 15th century, and contains about 900,000 index cards. On approximately 700,000 of them (so-called “record”-cards) is listed the medieval word forms as well as information on context, date, grammar, semantic use and etymology. As more than one documented word form may be listed on a single index card, it comprises roughly 1.000,000 documented word forms grouped under 33,000 lemmata. The remaining 200,000 so-called “secondary”-cards contain etymological references or refer to specific articles, glossaries and reviews etc.

Since the archive now only exists in paper form (index cards), the project will greatly facilitate public access to its database, an act of paramount importance given the absence of a complete historical dictionary of medieval Spanish. By digitalizing the data and publishing it online, the project will both guarantee the long-term storage of the data and make the archive accessible to the international research community. For this purpose it will be necessary to scan the index cards, to design a database structure, to enter the information on the cards into the database, and to provide a web-based user interface.

The resulting digital archive DEMel will make it easier and more efficient to search for word and phrase entries, and it will grant direct access not only to an enormous range of attested instances of word use in medieval Spanish but also to a large amount of linguistic information concerning, for example, element of speech, semantic acceptations, and the date of the attested forms.

The great diversity of genres and registers covered by the underlying corpus (literary texts, religious and legal documents, technical and scientific treatises on astronomy, mineralogy, medicine, pharmacy, botany, agriculture etc.) will provide a highly valuable and productive source for research in a large variety of fields – not only romance linguistics and literary studies, but also in cultural studies, history and sociology, theology, Islamic and Jewish studies, medieval studies and history of law. Moreover, its breadth of coverage will enable interested researchers – Hispanists as well as others – to investigate unexplored fields of the Spanish medieval lexicon, thus furthering interdisciplinary research. For this reason it is highly desirable to publish the entire material (from A – Z).

Breve descripción del proyecto (Español)

El objetivo de este proyecto es poner a disposición del público internacional, en una forma sencilla y rápida, un extenso archivo de datos en el internet, científicamente sólido y semánticamente estructurado sobre el español medieval bajo el nombre de Diccionario del Español Medieval electrónico (DEMel)– y de este modo, publicar los resultados adquiridos durante un proyecto de investigación de 25 años.

La base para este proyecto lo constituye el amplio archivo de datos hasta ahora no publicado, del cual –dentro del marco de los trabajos realizados hasta el 2007– se elaboró el Diccionario del Español Medieval (DEM) (26 fascículos publicados a partir de la letra „A“ – „almohatac“), pero que no fue terminado debido a la falta de financiamiento. El archivo de datos cubre una extensa base de textos de más de 600 obras o colecciones de textos y documentos del siglo X hasta inicios del siglo XV. Este archivo contiene 900.000 fichas, de las cuales 700.000 corresponden a las tan llamadas fichas de registro, en las que se encuentran anotadas las formas de palabras medievales con el contexto de su uso respectivo y su datación, así como informaciones gramaticales, semánticas y etimológicas. En algunas fichas se encuentran diversas formas de palabras documentadas (registros), de manera que con 33.000 lemas se registró la suma de casi 1.000.000 de registros. Las otras aproximadamente 200.000 fichas restantes, las llamadas fichas “secundarias” contienen referencias a la literatura de investigación etimológica y otra literatura especializada, datos bibliográficos, etc.

La colección se encuentra hasta ahora solo en papel („cajas con fichas“). La puesta a disposición del archivo es todavía aún más relevante, puesto que hasta ahora no existe ningun diccionario histórico sobre el español medieval que sea tan extenso. Mediante la digitalización y el acceso electrónico de este archivo se asegurará el material a largo plazo y se creará un acceso libre a la comunidad científica internacional. Los pasos de trabajos necesarios para este proyecto consisten en la digitalización de las fichas, el desarrollo de una estructura de base de datos, la elaboración de las informaciones contenidas en las fichas y la disposición de una interfaz de usuario en la web.

El archivo DEMel electrónico, preparado de esta manera, permite la búsqueda cómoda y el rápido acceso a la gran abundancia de registros medievales y a la gran cantidad de información adicional, por ejemplo, la clase de palabra, significado, datación, entre otros. La amplia diversidad temática de los textos (ficción, escrituras religiosas y jurídicas, textos factuales sobre astronomía, mineralogía, botánica, entre otros.) permite describir elementos del vocabulario medieval que hasta ahora no han sido recopilados, lo que hace que el DEMel sea una fuente de información tan valiosa tanto para los hispanistas como para los científicos de otros campos de especialización y ofrezca también una excelente base para otras investigaciones posteriores, por ejemplo, en el campo de los estudios árabes, judaicos, sociología, teología, latín medieval e historia legal. La publicación del material de A–Z representa de este modo un urgente desideratum.

Projektpartner / Miembros del proyecto
Forschungsstelle Rostock / Centro de investigación Rostock
  • Mathilde Heeren (student. Projektmitarbeiterin)
  • Eva Hinternesch (student. Projektmitarbeiterin)
  • Laura Noleppa (student. Projektmitarbeiterin)
Forschungsstelle Paderborn / Centro de investigación Paderborn

+ studentische Projektmitarbeitende (siehe Homepage der Forschungsstelle Paderborn)

Das Datenarchiv

Als Grundlage des Projekts dient das bislang nicht publizierte äußerst umfangreiche Datenarchiv, das im Rah­men der Arbeiten zum unvollendeten Diccionario del Español Medieval (DEM) erstellt wurde. Wäh­rend das Datenarchiv alle Lemmata umfasst, konnten von dem gedruckten Wörterbuch, das unter der wissenschaftlichen Leitung von Prof. Dr. Bodo Müller (Heidelberg, † 2013) in Kooperation mit dem Instituto de Estudios Medievales y Renacentistas (IEMYR) der Universidad de La Laguna (Teneriffa/Spanien) und mit Finanzierung durch die DFG (1979–1984) sowie durch die Heidel­berger Akademie vorbereitet wurde, zwischen 1987 und 2005 insgesamt nur 2 Bände mit je 10 Faszikeln sowie weitere 6 Faszikel bis zum Lemma almohatac publiziert werden.

Für den DEM wurde zwischen 1979 und 2005 eine umfassende Textbasis von über 600 Werken bzw. Text- und Dokumentsammlungen aus der Periode vom 10. bis zum beginnenden 15. Jahrhundert ausgewertet. Daraus entstanden ca. 700.000 Belegkarten, auf denen die mittelalterlichen Wortformen mit ihrem jeweiligen Verwendungszusammenhang notiert sind. Es können sich dabei auch gleich mehrere dokumentierte Wortformen (Belege) auf einer Karteikarte befinden, so dass sich eine Summe von knapp 1.000.000 Belegen ergibt. Neben der Fundstelle (Quellentext) und Datierung sind auf den Karteikarten Angaben zur Wortart (grammatische Informationen) und Bedeutungsangaben verzeichnet, darüber hinaus in einigen Fällen eine Sach­gebietszuweisung und Hinweise zur Wortgeschichte bzw. Etymologie. Diese Belege sind bereits einer Lemmatisierung unterzogen, so dass eine Liste von 33.000 Lemmata generiert wurde. Die Karteikarten wurden entsprechend alphabetisch in 370 Karteikästen sortiert. Außerdem gehören 102 Karteikästen mit ca. 200.000 „Sekundär“-Karten (Verweise auf etymologische und weitere Fachliteratur, bibliographische Daten u. a.) zu dem Datenarchiv.

Die breite thematische Fächerung (Literatur, Religion, Recht, Astronomie, Mineralogie, Medizin, Botanik etc.) ermöglicht es, bisher nicht erfasste Bestandteile des mittelalterlichen Wortschatzes zu beschreiben. Als Grundlagenwerk für die historische Sprachwissenschaft zur Erforschung der Herausbildung von Varianten und Bedeutungen, Arabismen und Hebraismen eröffnet das DEM-Datenarchiv einen Zugang zu wichtigen kulturhistorischen Einsichten. Ebenso ist es für das Verständnis aktueller Fragestellungen z. B. zur Entstehung des amerikanischen Spanischen, des Judenspanischen oder von Kreolsprachen unverzichtbar.

La base de datos – el archivo

La base para este proyecto lo constituye el extenso archivo de datos hasta ahora no publicado, del cual –dentro del marco de los trabajos– se elaboró el Diccionario del Español Medieval (DEM) no terminado. Mientras que el archivo de datos comprende lemas, se pudo publicar del diccionario impreso –el cual fue preparado bajo la dirección científica del Prof. Dr. Bodo Müller (Heidelberg, † 2013) en cooperación con el Instituto de Estudios Medievales y Renacentistas (IEMYR) de la Universidad de La Laguna (Tenerife/España) y con el financiamiento de la DFG (1979-1984), así como con la colaboración de la Academia de Heidelberg– entre 1987 y 2005, en total, solo 2 volúmenes con 10 fascículos, así como 6 fascículos hasta el lema almohatac.

Entre 1979 y 2005 se evaluó para el DEM una extensa base de textos de más de 600 obras o colecciones de textos y documentos que van de los periodos del siglo X hasta inicios del siglo XV. De ahí resultaron aproximadamente 700.000 fichas de registro, en las que se encuentran anotadas las formas de palabras medievales con el contexto de su uso respectivo. También se puede encontrar en una ficha diversas formas de palabras documentadas (registros), cuyo total asciende aproximadamente a 1.000.000 de registros. Junto a la referencia (fuente) y datación se registran en las fichas informaciones sobre la clase de palabra (informaciones gramaticales) y de significado, además, en algunos casos, se hace referencia al campo de investigación y se dan algunas indicaciones sobre la historia de la palabra o etimología. Estos registros ya se encuentran sometidos a una lematización, de modo que se creó una lista de 33.000 lemas. Las fichas fueron ordenadas alfabéticamente en 370 ficheros. Existen también 102 ficheros con aproximadamente 200.000 fichas „secundarias“ (referencia a la literatura etimológica y otras especialidades, datos bibliográficos, entre otros) que pertenecen al archivo de datos.

La amplia diversidad temática (Literatura, Religión, Derecho, Astronomía, Mineralogía, Medicina, Botánica, etc.) permite describir partes del vocabulario medieval hasta ahora no recopilados. Como una obra de base para la lingüística histórica en la investigación de la formación de variantes y significados, arabismos y hebraísmos, el archivo de datos DEM permite el acceso a importantes perspectivas histórico-culturales. Asimismo, es indispensable para la comprensión de planteamientos actuales, por ejemplo, el origen del español americano, del judeoespañol o de las lenguas criollas.

Digitalisierung

Die mit diesem Projekt beabsichtigte Online-Publikation des DEM-Datenarchivs hat gegenüber der traditionellen Papierform große Vorteile:

  • Die gedruckte Version des bislang unvollendet gebliebenen DEM ist in der Anschaffung sehr kostspielig und nur in wenigen Bibliotheken vorhanden. Das Archiv in Papierform ist ortsgebunden und nur nach Vereinbarung zugänglich. Die Digitalisierung und der open-access-Zugang machen dagegen die äußerst wertvollen Daten der nationalen und weltweiten Wissenschaftsgemeinschaft zugänglich.
  • Die publizierten Faszikel des DEM bilden nur einen kleinen Anteil des Archivs ab (bis zum Lemma almohatac). Die digitale Aufarbeitung des Archivs wird das komplette Material umfassen.
  • In der gedruckten Version des DEM sind nur ausgewählte Belegformen publiziert. Die Digitalisierung erlaubt es, alle Belegformen und Zusatzinformationen zugänglich zu machen.
  • Die digitale Erfassung in einer Datenbank erlaubt die automatische Durchsuchbarkeit.
  • Die wissenschaftlich wertvollen Daten werden langfristig gesichert.
  • Die digitalen Daten sind für eine weitere Bearbeitung handhabbar.

Von besonderem Interesse für künftige Nutzer des Archivs des Diccionario del Español Medieval electrónico (DEMel) sind – abgesehen von dem bislang von anderen Projekten oder Wörterbüchern nicht erreichten Umfang und der Vollständigkeit – die Fülle an lemmatisierten Belegen und insbesondere die Bereitstellung der jeweils zugehörigen Kontexte. Diese erhöhen in einzigartiger Weise die Aussagekraft der Belegdaten, da sie dem Nutzer neben Informationen über die typischen Verwendungszusammenhänge, syntaktischen Muster und Frequenz/Okkurenz auch kulturhistorische Hintergründe liefern. In diesem Zusammenhang ist besonders die Tatsache wichtig, dass das zugrunde gelegte Textkorpus nicht nur, wie sonst üblich, aus literarischen Texten besteht, sondern auch die für das mittelalterliche Spanisch besonders charakteristische Fülle an nicht-literarischen Textzeugnissen ausschöpft. Übersetzungen von arabischen Fachschriften zu unterschiedlichen Sachgebieten, hebräisch-spanische Bibelübersetzungen und infolge der Re-Christianisierung Spaniens entstandene sogenannte Fueros (Gesetzessammlungen für einzelne Herrschaftsgebiete) machen ca. drei Viertel des Gesamtkorpus aus

Digitalización

La publicación electrónica del archivo de datos DEM, que se pretende hacer con este proyecto, tiene muchas ventajas en relación con la forma tradicional impresa en papel:

  • La versión impresa del resto del DEM que hasta ahora no fue terminada representa en la adquisición un costo muy elevado. El archivo impreso en papel se encuentra sujeto al lugar y solo es accesible previo acuerdo. La digitalización y el acceso abierto permiten a la comunidad lingüística nacional e internacional acceder a datos muy valiosos.
  • Los fascículos publicados del DEM representan solo una parte pequeña del archivo (hasta el lema almohatac). La puesta en marcha digital del archivo comprenderá el material completo.
  • En la versión impresa del DEM se encuentran publicadas solo algunas formas escogidas de registros. La digitalización permite poner a disposición todas las formas de registros e informaciones adicionales.
  • La elaboración digital de una base de datos permite la búsqueda automática.
  • Los datos científicamente valiosos estarán guardados y asegurados a largo tiempo.
  • Los datos digitales son manejables para una posterior revisión y elaboración.

De especial interés para futuros usuarios del archivo del Diccionario del Español Medieval electrónico (DEMel) –independientemente de la dimensión hasta ahora no alcanzada de otros proyectos o diccionarios y de su finalización – son la abundancia de registros lematizados, especialmente, la disponibilidad de los contextos respectivos. Estos aumentan extraordinariamente la pertinencia de los registros, ya que ofrecen al usuario, junto a la información sobre los contextos típicos de uso, muestras sintácticas y frecuencia / ocurrencia, así como los fondos histórico-culturales. En este sentido, es especialmente importante el hecho de que el corpus textual utilizado no solo, como suele ser usual, consiste en textos literarios, sino también pone a disposición la abundancia de textos testimoniales no-literarios que son especialmente característicos para el español medieval. Las traducciones de revistas árabes en diversas materias, traducciones de la biblia del hebreo al español, y por consecuente, de los tan llamados fueros (compendios de leyes para cada dominio territorial) que surgieron en la re-cristianización de españa ascienden aproximadamente a tres cuartos del corpus total.

Veranstaltungen / Eventos

15.05.17, Universidad de Rostock

Inauguración oficial del proyecto / Offizielle Eröffnung des Projekts

Zum Vergrößern bitte aus das Bild klicken


En el aula magna con oradores invitados nacionales e internacionales
de las Universidades de Heidelberg, Trier y Tenerife. >Invitación<

In der Aula der Universität mit nationalen und internationalen Gästen der Universitäten Heidelberg, Trier und Teneriffa. >Einladung<

 

> Fotos

> Videorückblick der Universität Rostock

> Pressemitteilung der Universität Rostock


01.04.2017, LMU München/Múnich:

XXI. Deutscher Hispanistentag "Orte hispanischer Kultur in einer globalisierten Welt"


Conferencia del Prof. Dr. Rafael Arnold (Universidad de Rostock), de la Prof.a Dr.a Jutta Langenbacher-Liebgott (Universidad de Paderborn) y de D. M. A. Stefan Serafin (Universidad de Rostock) sobre el tema: "Una nueva fuente para la historia del léxico español: el DEMel"

Sección "Quellen zur Geschichte des spanischen Wortschatzes" bajo la dirección de Dolores Corbella (La Laguna), Alejandro Fajardo (La Laguna), Jutta Langenbacher-Liebgott (Paderborn)


16.03.2017, 10.00 horas, W1.101 – Universidad de Paderborn

Conferencia de la Profesora Dr.a Eva Güida (Universidad de Heidelberg)
sobre el tema: "Der Wortschatz des Altspanischen aus der Sicht des DEM: Ergebnisse und Perspektiven"


17.01.2017, 16.15 horas, H2.240, Universidad de Paderborn

Conferencia de la Profesora Dr.a Maria Teresa Echenique Elizondo (Universitat de València) sobre el tema: "Confluencia etimológica en vasco y románico: latinidad compartida"
Al anuncio


13.12.2016, 18.00 horas, H4.329 Universidad de Paderborn

Conferencia del Profesor Dr. Rafael Arnold (Universidad de Rostock) sobre el tema: "Lexicografía del judeoespañol"
Al anuncio


24.11.2016–25.11.2016, Universidad de Paderborn

4° Taller lexicográfico


Von der Karteikarte zum Digitalisat – Die ersten Schritte zum digitalen Altspanisch-Wörterbuch (DEMel) Al anuncio


20.06.2016, Universidad de Rostock

3° Taller lexicográfico


Im 3° Taller lexicográfico zum Diccionario del Español Medieval electrónico (DEMel) geht es nach Zusage der Förderung des Projekts seitens der Deutschen Forschungsgemeinschaft (DFG) nun darum, die gesamte Projektgruppe erneut zusammenzuführen und den Start des Forschungsprojekts zu planen. Mehr Informationen finden Sie hier.


26.06.2015, Universidad de Rostock

2° Taller lexicográfico


Am Freitag, den 26. Juni 2015, fand am Institut für Romanistik im Rahmen einer Tagung zum Digitalisierungsprojekt des Altspanisch-Wörterbuches (DEMel) ein Vortrag zu diesem Thema statt. Mehr Informationen finden Sie hier.


12.–13.12.2013, Universidad de Rostock

Atelier lexicographique – Taller lexicográfico


"Die Digitalisierungsprojekte Dictionnaire Étymologique de l'Ancien français und des Diccionario del Español medieval". Mehr Informationen finden Sie hier.

Anschrift

Postanschrift:

DFG-Forschungsstelle DEMel
Institut für Romanistik
Universität Rostock
August-Bebel-Str. 28
D-18051 Rostock

Besucheranschrift:

DFG-Forschungsstelle DEMel
Schwaansche Str. 5
Raum 207 (2. Etage)
D-18055 Rostock

Studentische Hilfskräfte gesucht

Studentische Hilfskräfte gesucht

Für das DEMel-Projekt werden studentische Hilfskräfte gesucht. Für weitere Infos einfach klicken.