Uralothek: Datenbasis und Abfragesystem zu dem Uralischen Etymologischen Wörterbuch von Rédei



Die UEDb ist eine XML-Datenbasis mit einer Benutzerschnittstelle von XSL-, HTML-, Java- und JavaScript-Modulen. Sie macht den Datenbestand des dreibändigen Uralischen Etymologischen Wörterbuches (Hauptherusgeber: Károly Rédei) auf elektronischen Medien abfragbar.
Die Authentizität der Daten war eine natürliche Anforderung, sie wurde aber angesichts der Menge und Vielfalt der Daten nicht immer voll erreicht. Besonders gravierend ist die Lücke von cc. 800 Zeilen, die bei der Datenkonversion von Word zu XML aus technischen Gründen ausgeklammert worden ist. Diese Zeilen fehlen und müssen eines Tages wieder herangezogen werden. Es ist möglich, daß darüber hinaus bei der Konversion auch andere ``Schäden'' entstanden sind, auch sie müssen korrigiert werden. Andererseits gab es einige technische Aspekte der Datenbankorganisation, die den ursprünglichen Daten neu zugefügt worden sind (z.B. laufende Nummer, oder die Farbunterlegung für Sprachenzweige und Dialektgruppen, u.ä.). Es wurde kein Wert darauf gelegt, erkannte Tippfehler zu reproduzieren. Die Struktur des Uralischen Etymologische Wörterbuches und die Struktur der Uralischen Etymologischen Datenbasis sind rein sachlich identisch. Es ergeben sich jedoch medienbedingte Unterschiede, die nicht ignoriert werden dürfen. (Vgl. Bátori2001 und Bátori2002b . Die Strukturierung in der UEDb ist monoton, explizit, einheitlich und festgelegt in der DTD.

Die Abfragesystem ist entscheidend von Ian Paakkanen implementiert worden.

Organisationsprinzipien

  1. Die Einträge haben eine explizite Identifikationnummer EINTRAG[@ID] (kurz: LE-Nr), mit deren Hilfe jeder Eintrag direkt angezeigt werden kann. Insgesamt sind es 1874 Einträge.
  2. Die Abkürzungen der Dialekte der uralischen Sprachen sind normiert und mit einer Klassifizierungsnummer (BLG[@DI="....."]) ergänzt, die die eindeutige Identifizierung der Dialekte in allen Sprachen ermöglicht. Die Nennung der Sprachen und der Dialektabkürzungen ist daher redundant.
  3. Die Quellen und die zitierte Literatur sind vereinheitlicht. Die in dem Vorwort zitierten Standardquellen und Abkürzungen in den Lexikoneinträgen können mit Mausklick dynamisch angezeigt werden.
  4. Lexeme und Texteme werden unterscheidet, weil bei den letzteren die Ermittlung der Stammform nicht automatisch vorgenommen werden kann. Zu Textemen werden die Belegformen gezählt, die aus mehreren Wörtern bzw. Stämmen bestehen, auch die Komposita zählen als Texteme.
  5. Stämme werden explizit gemacht, d.h. jeder Beleg hat einen Stamm, der, wenn nicht explizit bestimmt (wie bei den Textemen), mit dem Lexem identisch ist. Suffixe und Präfixe werden nach den Hinweisen im Kommentarteil abgetrennt

Struktur der Lexikoneinträge

Die Lexikoneinträge stehen in der Reihenfolge wie in UEWb und haben drei Attribute:

1. Sie sind mit einer Identifikationsnummer EINTRAG[@ID] versehen, die sich aus der Reihenfolge der Lexikonartikel im UEWB ergibt.

2. Die Homographennummer EINTRAG[@H] ist auf Null gesetzt bei Nicht-Homographen. Homographen werden durchnumeriert (mit H=9 als Maximum bei den LE-n 420-428: kur.)

3. Der binäre Marker für Rekonstruktionssicherheit EINTRAG[@VER] entspricht dem Fragezeichen im UEWB, wobei die Unterscheidung zwischen ``?'' und ``??'' nicht mehr gemacht wird.

Ein LE besteht aus vier Hauptteilen: Rekonstruktion, Vergleich, Kommentare und Literatur die hierarchisch noch weiter gegliedert sind.

Der Rekonstruktionsteil setzt sich im UEWB aus drei Teilenzusammen: rekonstruierte Lautsequenz, Bedeutung und Rekonstruktionsebene. Dahingegen werden in der UEDb Lautung und Bedeutung segmental als Tags realisiert, während die Rekonstruktionsebene zum Attribut ETEM[@RKN] wird: Das Attribut ETEM[@RKN] kann fünf einfache und neun zusammengesetzte (doppelte oder dreifache) Werte haben:

Einfach Doppelt Dreifach
Ur FU FU/Ur
FP FP/Ur FP/FU
FW FW/Ur FW/FU
FW/FP
Ug Ug/Ur Ug/FU FW/FU/Ur

Die fünf einfachen Attributwerte werden weiter (U und FU, sowie FP und FW) zusammengelegt, und bilden die drei Hauptabteilungen im UEWB, innerhalb deren der Stamm (=EINTRAG/ETEM/STAMM) als Sortierbegriff benutzt wird. Die Doppelformen sind so zu verstehen, daß bei diesen Rekonstruktionen die jeweils jüngere Ebene sicher ist und die jeweils ältere weniger sicher (?-Markierung im UEWb), also FU: sicher, U: unsicher. Nur ein einziger LE 493 (lowkk) enthält drei Rekonstruktionsebenen.

Der Vergleichsteil

Der Vergleichsteil enthält drei Ebenen, die im Wesentlichen dem Aufbau des UEWB-s folgen: Sprachen, Belege und linguistische Entitäten, wie Lexeme. Wichtig ist, daß es in der UEDb keine besondere Dialektebene gibt: Dialekte werden als Dialektzugehörigkeit aufgefaßt, d.h. sie werden nicht als eine besondere Ebene, sondern als Attribute der Belege (BLG[@DI]-Nummer) kodiert. Die Dialekte sind in der UEDb terminologisch vereinheitlicht und als 5-stellige numerische Werte den Belegen zugordnet (BLG[@DI]-Werte). Hier soll nochmals auf die Dialekt-Tabelle hingewiesen werden.

Unter dem Vergleichsknoten treten die 25 uralischen SPRACHEn auf. Das Element VERGLEICH wird nicht mit Attributen bereichert.

Dem Element SPRACHE wird der Sprachname als Attribute zugeordnet. (Zum Problem der Sprachen in UEDb vgl. Bátori demnächst).

Die Belege in der UEDb enthalten heterogene Informationen, aber prinzipiell sind sie einheitlich strukturiert: Ein Beleg besteht aus vier Elementen: Quelle(n), Stamm, Lexem und Bedeutung. Zentral ist die Lexem genannte Lautform und ihre Bedeutung. Dazu gehört zwingend eine Quelle.

Der Stamm ist in der UEDb supplementiv, wie auch die Zweitform oder die Entlehnungen, d.h. sie werden nur dann angegeben, wenn sie von der lexikalischen Basisform abweichen bzw. vorhanden sind. Die Felder STAMM und LEXEM haben ihre eigene Attribute. Um die funktionsgleichen Lautvarianten zu erfassen ist unterhalb der Stämme und Lexeme noch eine F(orm )-Element vorgesehen. Ein Überblick über Tags und Attribute mit ihren internen, genauen, verbindlichen Zuordnung vermittelt die DTD-Tabelle.

Lexeme haben die Attribute: WortArt, Grammatikalische Informationen, ReGiSter, TEXTEM (=Textbeleg), MORphologie und VARiation. Stämme haben die Attribute: WortArt, Grammatikalische Informationen, ReGiSter.

Die algorithmische Verarbeitung der Etymologien erfordert die Klärung von zwei Fragen im Voraus:

  1. Die Bestimmung der Stämme und
  2. Die genetische (dialektale und sprachliche) Bindung der Stämme.
Die Stämme sind die eigentlichen Vergleichsobjekte der Komparatistik. Das UEWB enthält aber zunächst Belegwörter und -texte, aus welchen die für den Vergleich geeigneten Stämme noch ermittelt werden müssen. Als Grenzfall ist es natürlich möglich, daß das belegte Wort und der Stamm zusammenfallen.

Die Belegwörter können aber auch Suffixe oder Präfixe enthalten, die noch vor dem Vergleich abgetrennt werden müssen. Die Moprphemegrenzen zwischen Stamm und Affix sind nicht immer klar.

Darüber hinaus müssen Lexeme und Texteme auseinandergehalten werden: Lexeme sind aus anderen Lexika übernommene Belege. Sie sind normierte Wörter. Texteme stammen typischerweise aus textlichen Quellen (nicht aus Wörterbüchern) und sie sind lexikographisch noch nicht ausreichend normiert. Die Notwendigkeit der Heranziehung von Textquellen ergab sich, weil manche uralischen Sprachen lexikographisch noch unzulänglich aufgearbeitet sind. Deshalb füllten die Herausgeber des UEWB-s die Lücken aus Textsammlungenen auf. Vgl. Projektinternes Papier: Stamm.

2. Leistung des Uralothek-Anzeigesystems

2.1 Formatgleiches Vorwärts- und Rückwärtsblättern

Mit den Knöpfen nächste und vorherige kann man einfach und bequem das Wörterbuch durchblättern und die Seiten anzeigen. Die Lexikoneinträge sind durchnummeriert (von 1 bis 1874) und die LE-Nummer dient dabei als Schlüssel, der auch gezielt eingegeben werden kann. Der Seitenanzeigemodus kann von verschiedenen Stellen erreicht werden:

  • Direkt, durch Eintippen der LE-Nummer,
  • Eintippen einer rekonstruierten Form oder einer belegsprachlichen Form (mit oder ohne virtuelle Tastaturen),
  • Auswählen eines Belegwortes von einer Belegwortliste per Mausklick,
  • Übernahme der rekonstruierten Form aus dem Inhaltsverzeichnis,
  • Übernahme der LE-Nummer nach konfigurativem Suchen.

    Das Anzeigefenster ist viergeteilt: Das Menue befindet sich rechts und die eigentliche Anzeige erfolgt im Hauptfenster, das relativ groß initialisiert wird. Oberhalb des Hauptfensters sind die Fensterformatierungen. Abgesehen von der Direktanzeige des XML-Kodes gibt es fünf Fensterformate:

  • Standard-Anzeigeformat (Quellen können per Mausklick angezeigt werden).
  • Maximale Anzeige der Informationen: Quellen, Wortarten, Stämme, Entlehnungen (falls vorhanden) und Unterscheidung von sicheren und unsicheren Angaben (durch Hintergrundfarbe).
  • Minimale Informationen: ohne Kommentarteil und ohne Bibliographieteil, aber mit Hintergrundfarben für die Sprach- und Dialektgruppen.
  • Sichere Belege: Anzeige der LE unter Weglassung der als unsicher eingestuften Belege.
  • Sichere Einträge: Anzeige der LE, die nur sichere Belege enthalten (bereits eine einzige Unsicherheit schaltet den Eintrag aus.) In diesem Modus ist es möglich, daß beim Blättern statt einer Seitenanzeige eine Meldung erscheint, in der erklärt wird, daß der fragliche LE nicht sicher ist.

    2.2 Belegsprachliche Suchwortlisten

    Die belegsprachlichen Suchwortlisten unterstützen den Benutzer in zweierlei Hinsicht:

    1. sie informieren den Benutzer, daß ein Wort in einer uralischen Sprache oder Dialektgruppe in der UEDb vorhanden ist und

    2. sie informieren den Benutzer über die Schreibweise des Wortes.

    Die Suchwortlisten werden aktuell generiert, daher erfolgt die erstmalige Anzeige während einer Sitzung mit einer Verzögerung. Die Belegwörter für alle Dialekte bzw. Sprachen werden erzeugt. Die Liste der Sprachen (komplettiert mit den Dialekten) kann angezeigt werden und die Sprach- bzw. Dialektnamen koönnen auch von hier eingegeben werden. Hierauf wird die alphabetisch sortierte Belegwortliste der ausgewählten Sprache angezeigt. Beim Anklicken des ausgewählten Belegwortes wird die Lexixonentrag angezeigt.

    Während Netscape alle diakritische Zeichen in den Belegwörtern korrekt anzeigt, ´ kann MS Internet Explorer hier die Unicode-Zeichen auf dem Bildschirm nicht wiedergeben. Die Internetzeichen sind aber korrekt vorhanden und nach der Lexikonsuche werden sie voll und korrekt auch von dem Internet Explorer angezeigt.

    2.3 Virtuelle Tastaturen

    Die virtuellen Tastaturen sind erforderlich um Fonts (diakritische Zeichen) einzugeben, die auf der Tastatur nicht vorhanden sind. Vgl. Projektinternes Papier: Sort. Zu der Eingabe von belegsprachlichen Wörtern und von rekonstruierten Formen werden normalerweise Diakritika benötigt.

    Mit Hilfe der Universaltastatur können sämtliche in der UEDb benutzten Zeichen eingegeben werden. Da diese Tastatur sehr groß ausfällt und ihre Handhabung etwas umständlich ist, sind auch kleinere virtuelle Tastaturen vorhanden: so z.B. Tastatur für die Phonemsammlung der Rekonstruktionen und für das Ungarische.

    2.4 Identifikationsnummer der uralischen Sprachen und ihrer Dialekte

    Über die bloßer Auflistung der uralischen Sprachen und ihrer Dialekte (zusammen mit ihren Kennnummern) hinaus, können Informationen über die einzelnen Sprachen und ihrer Dialekte auch aktuell in dem Informationsfenster gezeigt werden. Sprach- bzw. dialektspezifische Informationen sind die bereits geschilderten Suchwortlisten. Ausserdem ist es möglich die Anzahl der Belegungen und die in einer Sprache (bzw. in einem Dialekt) benutzten Fonts anzuzeigen. Die Dialektnummer werden in den Suchvorgängen in der Hinmtergrund intensiv verwendet.

    2.5 Anzeige der Quellen mit Mausklick

    Über die Auflistung aller in der UEDb benutzten Quellen hinaus können die Quellen des aktuellen Belegs angezeigt werden. Die Anzeige stützt sich auf die im Vorwort des UEWB-s vorhandenen Quellenangaben und auf die in den Wörterbuchartikeln selbst befindliche Fachliteratur. Drei Referenzarten werden benutzt:

  • Explizite, volle Nennung der referierten Fachliteratur in den Belegen.
  • Benutzung von Abkürzungen in den Belegen. Die Abkürzungen werden im Vorwort alphabetisch sortiert aufgelöst.
  • Impliziertes Referieren: in den Belegen wird keine Quelle explizit genannt, Das Fehlen der Quellenangabe bedeutet in diesem Fall, daß die sprach- oder dialektspezifischen Standardquellen benutzt worden sind. Im Vorwort des UEWB-s werden die impliziten Referenzen systematisch aufgeführt. In der UEDb können die drei verschiedenen Referenzarten im Informationsfenster einheitlich mit Mausklick angezeigt werden.

    2.5.1 Kodierung der Quellen
    QL=0 Defaultquellen (explizit nicht angegeben, eingesetzt durch XSL-)

    QL=1 Quelle in Abkürzungsverzeichnis ( verweiwst auf UEBIB.HTML)

    QL=3 Quelle mit "mitg"-Vermerk.

    3. Funktionen des Uralothek-Anzeigesystems

    Die Funktionen des Anzeigesystems sind natürlich bereits in der Strukturierung der Datenbestände von Krisztián Németh angelegt worden und später von Jan Paakkanen weiterentwickelt. Die jetztige, elegante und effiziente Benutzeroberfläche ist von Jérôme Diebold implementiert worden.

    3.1 Aufteilung des Fensters

    Das Anzeigefenster ist in vier Teilfenster aufgeteilt:

    Info Head
    Menue Display

    Alle vier Teile sind dynamisch ausgelegt und können beim Bedarf vergrößert werden, In dem Menuefenster sind 14 abrufbare Funktionen zu sehen.

    3.2 Funktionen in Uralothek

    3.2.1 UEDb-Info

    Hier können die Beschreibungen des Systems abgerufen werden.

    3.2.2 Inhaltsverzeichnis

    Inhaltsverzeichnis listet die 1874 Suchworte in UEDb auf. Da die Auflistung anhand der aktuellen Quellendatei erfolgt, dauert die Anzeige etwas länger, liefer aber Informationen auch über die Größe der Lexikoneinträge gemessen an der Zahl der Belegsprachen und Belege in den einzelnen Einträgen.

    3.2.3 Eintrags_Nr.

    Mit Hilfe der Eintragsnummer (1-1874) können die einzelnen Lexikoneinträge in dem Hauptfenster angezeigt werden. Das Format der anzeige kann mit Hilfe des Head-Fenster zwischen "Minimal", "Standard" und "Maximal" variiert werden. Wenn sonst nicht angegeben ist wird das Standard-Fenster eröffnet. In dem Maximal-Fenster werden auch die Entlehnungen angezeigt. Wenn man die unsichere (ursprünglich mit Fragezeichen versehene) Etymologien aussparen möchte, kann man die "nur sichere Belege" bzw. "nur sichere Einträge" anklicken. "raw.xml" zeigt die XML-Eepräsentation an. In dem Quellenformat können die Unicode-Zeichen nicht angezeigt werden. Die linke blaue Spalte im Displayfenster ist dynamisch und zeigt die Referenzen (Quellen und Fachliteratur zitiert in UEWb) in dem Info-Fenster links oben. Bei Anklicken der Dialekt-Namen, werden im Info-Fenster Informationen über die Belege des Dialekts angezeigt (Dialektnummer, Anzahl der betroffenen Einträge sowie die in dem Dialektbelegen benutzten Fonts). Das Minimalfenster ist auf den Vergleichsteil beschränkt. Angezeigt werden nur Formen und Bedeutungen, aber die Dialekte einer Sprache werden farbig unterlegt damit ihre Zusammengehörigkeit hervorgehoben wird. Die Anzeige der Kommentare ist provisorisch. Hier können z.Z. lediglich die Querhinweise aktiviert werden.

    3.2.4 Word-version

    Wenn das ursprüngliche Word-System installiert worden ist, kann es auch in XML-Rahmen gerufen werden. Hierdurch wird Vergleich (Kontrolle) mit (bzw. durch) der (bzw. die) vorherigen Word-Version ermöglicht.

    3.2.5 Suchwortlisten

    Suchwortlisten ermöglichen den Zugang zu den UEDb-Daten durch die effektiv vorhandenen Belege in den einzelnen Dialekten bzw. Sprachen. Zuerst wird in dem Head-Fenster ein Sprachfeld und ein Belegfeld eröffnet und in dem Hauptfenster die Liste der UEDb-Dialekte geglieder nach Sprachen. Die Liste enthält über die Dialektnamen (und -nummern) hinaus auch die Belegungsdichte der Dialekte. Bei Anklicken der ausgewählten Dialekt (Sprache), wird die Suchwortliste dynamisch erzeugt und bei Anklicken von "Wort auswählen", eine Pull-Down-Menue eröffnet. Hier werden alle Belege aus der Dialekt (Sprache) aufgelistet und bei Anklicken eines Wortes der Liste wird der betroffene Eintrag aus der UEDb (in Standard-Format) angezeigt. Die Liste in der Pulldown-Menue zeigt in Windows Internet Explorer die selbstgenerierten Unicode Fonts nicht an (im Gegensatz zu Netscape), nichtdestotrotz werden die Zeichen "verstanden" und in dem xml-formatierten Fenster korrekt angezeigt.

    3.2.6 Belegstrukturen

    Mit dieser Funktion kann man in einer Belegsprache (bzw. -dialekt) die Belegungen einer bestimmt Lautsequenz suchen und angezeigt bekommen. Beim Anklicken der Funktion erscheint oben ein Eingabefeld für die gesuchte Konfiguration und unten im Hauptfenster die Dialektliste. Die Sprache (bzw. Dialekt) wird ausgesucht, die Auswahl erscheint oben auch in dem Eingabefeld (als Dialektnummer zur Zeit).

    Die Suchstring kann entweder direkt eingegeben werden, (beispielsweise eine -rk- oder eine -kt- Verbindung) oder mit Hilfe einer virtuellen Tastatur, die die Dialektliste überschreibt (daher muss zuerst die Sprache (bzw. Dialekt) ausgesucht werden. Auch Listen von Fonts (im Sinne der sog. regular expressions) können definiert werden: Die Suchkette [ptkbdg][lľr] liefert alle Verschlusslaute gefolgt von Liquiden. Die Eingabe der Unicode-Zeichen ist mit der Tastatur möglich aber noch nicht optimal. Sprachspezifische Tastaturen (anstatt der jetztigen überdimensionalen Tabelle) wären handlicher, aber ihre Konstruktion ist aufwändig. Die Konfiguration wird in den Belegen der angegebenen Sprache gesucht. Das Suchergebnis wir in tabellarischer Form angezeigt, dabei werden die gefundenen Einträge sortiert nach der rekonstruioerten Form und durchnumeriert zusammen mit der gesuchten belegsprachlichen Formen und Bedeutung angezeigt. Der Knopf "Nur ganze Wörter" fügt die Abgrenzungssymbole Wortanfang: "^" und Wortende: "$" zu, wodurch nur volle Wörter gesucht werden (also bei der Eingabe ung. "hat", der Eintrag "hattyú" ausgespart bleibt. Die Angabe der Bedeutung ist als zusätzliche Einschränkung der Suche möglich aber nicht immer sinnvoll.

    3.2.7 Rekonstruktion

    Die Suche mit der rekonstruierten Form ist hat zwei Varianten: entweder wird das volle Wort gesucht oder eine charakterische Teilkette darin. Hier wird eine spezialisierte virtuelle Tastatur eröffnet, die nur die für die uralische (finnisch-ugrische) Rekonstruktionsprache angenommene Phoneme enthält (nach Rédei 1988, S. IX-X.). Hier sind die Phonemklassen systematisch zusammengestellt und können als fertige Klassen eingeklickt werden. (Die Phonemklassen ergeben sich als Zeilen- bzw. Spaltenbeschriftung.) Die Verarbeitung von Rekonstruktion ist eine vereinfachte Form der Verarbeitung der Belegstrukturen (3.2.6): Die Spezifikation der Belegsprache entfällt (die Suche erfolgt immer im Rekonstruktionsfeld) und die virtuelle Tastatur kann auf eine handliche Größe reduziert werden.

    3.2.8 Vergleich

    Die Funktion Vergleich stellt die Entsprechungen zweier uralischen Sprachen zusammen. Die Suche kann weiter moduliert werden:

    Die Sprachen können entweder von dem Stammbaum eingegeben werden, wo auch ihre genetische Beziehungen siehrtbar sind, oder von der gleicwertigen Auflistung. In beiden Fällen können sowohl Einzeilsprachen als auch Sprachzweige geholt werden.

    - Man kann alle etymologische Entsprechungen zusammenstellen. Für diesen Fall genügt die Nennung der zwei Sprachen (anklicken in dem Stammbaum: z.B.: Estnisch und MordwinischE).

    - Man sucht die Reflexe eines ursprünglichen Laut oder Lautverbindung, e.g. uralische inlautende lange t (-tt-), uralische Nasal + Affrikate- Verbindungen u.ä., also, eine spezifische Lautkonfiguration/Sequenz in der rekonstruierten Form in einem Sprachpaar: Finnisch und Ungarisch.

    - Man sucht die etymologischen Entsprechungen einer spezifischen Laut- oder Lautverbindung in der anderen Tochtersprachen: z.B. Was entspricht einem syrjänischen Mittelvokal im Ungarischen? (In dem Stammbaum zuerst Syrjänisch anklicken dann Ungarisch. Dann "Belegsprache" wählen (statt Rekonstruktion), Tastatur anfordern, Mittelvokal auswählen und absenden ("submit")).

    - Die Spezifikationen können gebündelt werden: z.B. Was entspricht einer permischen Mittelvokal im Ungarischen oder im Ugrischen? (Genauso wie beim obigen Syrjänischen Beispiel, statt Syrjänisch jedoch Permisch bzw. Ugrisch anklicken.)

    - Schließlich kann man auch hier gezielt lexikalische Entsprechungen suchen. Hierfür muss der Knopf "Nur ganze Wörter" angeklickt werden Die Eingabe der Unicode-Zeichen erfolgt mit virtuellen Tastaturen. Die Tastatur für die Rekonstruktionssprache steht permanent zur Verfügung: Wenn in dem Feld der rekonstruierten Form gesucht werden soll, wird automatisch diese Tastatur geöffnet. Die 25 Belegsprachen sollten theoretisch 25 verschiedene, eigene Tastaturen haben. Die Erstellung der Tastaturen ist eine aufwendige Angelegenheit und z.Z. stehen nur 2 einzelsprachliche Tastaturen (ungarisch und syrjänisch) zur Verfügung. Sie werden bei Ungarisch bzw. Syrjänisch automatisch eingeschaltet. Die übrigen Sprachen müssen z.Z. mit der weniger handlichen Universaltastatur bedient werden. Die Anzeige wird sortiert und durchnumeriert. Über die rekonstruierte Form hinaus werden die zwei verglichenen Belege angezeigt. Die Sprachnamen werden durch die Dialektnamen (wenn sinnvoll) komplettiert.

    3.2.9 Dialekte

    Die Funktion Dialekte ist ähnlich wie die Funktion Vergleich: hier können Dialekte von der Ddial-Liste direkt eingegeben werden und die Verarb eitung erfolgt wie oben bei Punkt 3.2.8.

    3.2.10 XQL-Suche

    XQL ist eine verbreitete, gut dokumentierte und transparente Abfragesprache. Eine nützliche tabellarische Zusammenfassung der Regular-Expression-Implementierungen ist bei Stephen B. Jenkins unter der obigen Adresse zu finden.

    Die Handhabung von XQL ist erforderlich und muss erlernt werden. Hier sind allerdings einige vorformulierten (und geprobten) XQL-Abfrage, die leicht und transparent geändert werden können und die Erweiterung des Suchspektrums ermöglichen. Im Eingabefeld (in Head-Fenster oben) muß er Benutzer eine Suchpfad angeben, die die gewünschten Einträge der UEDb enthält. Die genaue Struktur der UEDb geht aus de Data Type Definitions (abgekürzt: DTD) der UEDb hervor.

    Wenn der Benutzer den XQL-für-UEDb-Knopf anklickt, eröffnet sich ein neues Fenster mit einer Liste von exemplarischen Fragen. Die Fragen können entweder direkt übernommen werden, oder zuerst abgeändert und abgeschickt werden. Die exemplarischen XQL-Abfragen enthalten Variablen, die durch funktionsgleiche Namen leicht ersetzt werden können, wodurch ganze Klassen von Fragen gestellt werden kann. (Anstatt "Liv"-isch oder Rekonstruktionsebene "U"-ralisch kann man eine beliebige UEDb-Sprache (bzw. rekonstruktionsebene) eingeben).

    Auch Kombinationen sind möglich. Die Fragen sind beispielhaft. Sie zeigen dem Benutzer, wie er Fragen formulieren soll. Die XQL-Abfragen liefern eine Liste der einschlägigen Lexikoneinträge in einer normierten tabellarischen Form. Die Einträge können einzeln als Lexikonartikeln wie üblich auf dem Bildschirm angezeigt werden. Benötigen Sie einen Buchstaben mit diakritischen Zeichen, der auf der Standardtastatur fehlt, steht Ihnen eine virtuelle Tastatur zur Verfügung.

    3.2.11 Die UEDb-Unicode-Fontliste

    Der Benutzer kann hier zu den in der UEDb benutzten Unicode-Fonts systematischen Zugang finden:

    1. Er kann eine Beschreibung der Unicode Fonts anfordern.

    2. Er kann die Fonts in tabellarischen Form angezeigt bekommen und

    3. Er kann die Fonts in Tastaturen-Gestalt benutzen.

    Defaultmäßig wird die tabellarische Form angezeigt. Die Fonts sind hier in der Sortierfolge präsentiert. Sie werden in drei Gruppen aufgeteilt:

    1. Basisformen und diakritische Erweiterungen der lateinischen, griechischen und kyrillischen Buchstaben

    2. Besondere phonetische Zeichen

    3. Nicht phonetische Zeichen

    3.2.12 Literatur: Quellen und Referenzen der UEDb

    Die Literatur-Taste aktiviert die vereinheitlichte Quellen und die zitierte Literatur von UEWB. (Die Quellen sind in die ursprüngliche Abkürzungsliste eingearbeitet worden.) Nach der alphabetischen Auflistung folgt die Liste der Referenzen, die standardmäßig (ohne explizite Angabe) als Quellen benutzt worden sind. Die Liste ist vereinheitlich und normiert worden und wird für die automatische Quellenanzeige benutzt. Anschließend folgt eine Auflistung der Schriften und Publikationen, die in Zusammenhang des Datenbankaufbaus entstanden sind, die meistens auch elektronisch in Internet zur Verfügung stehen.

    3.2.13 Die UEDb Data Type Description: Die DTD-Übersicht

    Die DTD-Graph zeigt den hierarchische Aufbau der Lexikoneinträge, aus welchen die XML-Datenbasis besteht. Den Knoten (den "Tags" nach XML-Terminologie) werden Merkmale (Attribute) zugeordnet. Die rot geschriebenen Tags in den Kästchen werden in der Datenbasis benutzt. Die ergänzende schwarze Buchstaben dienen nur der Orientierung.

    3.2.14 Reset-Taste

    Wenn das System mit einer Fehlermeldung stehenbleibt, hilft die Reset-Taste. Es ist möglich, daß Abfragekombinationen nicht zulässig sind, oder - bei XQL-Abfragen - tatsächlich ein Syntaxfehler vorlegt. Nach der Reset ruft man dieselbe Funktion nochmals. Wenn das System auch dann scheittert, liegt wahrscheinlich ein Fehler (oder Lücke) in den Programmen oder in den Style Sheets vor.


    Letzte Änderung: 9.06.2004 

    batori@.uni-koblenz.de