Uralothek -- Leistungsmerkmale

1. Virtuelle Tastaturen für phonologische Klassen

Die virtuellen Tastaturen sind als eine Hilfmittel entstanden, die ermöglichen sollten, die fehlenden diakritischen Zeichen oder Sonderzeichen mit einem Tastendruck einzugeben.
Beipielsweise sollte eine rekonstruierte Form mit einer Endung auf -ŋ$ (am Wortende) gesucht werden:

Vorgehen
1. Uralothek aktivieren
2. Rekonstruktion auswählen
3. Tastatur in Kopfteil anklicken
4. ŋ +  + $ die Tasten auf der VT betätigen
5. Suchergebnis: die gesuchten LE-Instanzen.
Weitere Beispiele: (Ungarisch) é, ü, á, usw.
Die erste Erweiterung entstand als eine zusätzliche Vereinfachung um Doppelbuchstaben oder Kodierungen mit einem einzigen Tastenberührung effizienter (schneller, weniger fehleranfällig) einzugeben. Uralothek:
1. Vergleich -- Sprache
2. Ungarische auswählen
3. Belegsprache in Headfeld anklicken
4. Tastatur rufen
5. Beispiel: cs-ü-cs-ö-k
Beispiele: Ung. sz, ny, cs -- &a_acute; u.ä.
Zusammenfassung der diakritischen Erweiterungen: Wenn die diakritischen Zeichen auf der Maschine schon gespeichert sind, kann mann die diakritischen Erweiterungen der einzelnen einfachen Basisbuchstaben speziell für die Suche zusammenfassen: univs.html:
Beispiele: alle a-a, alle é-s usw.
Man such alle a-s, gleichgültig ob lang uder alle s-Laute usw. Dies ist unpräzis, aber kann u.U. sinnvoll und notwendig sein
Schließlich man kann die phonologischen Klassen (einer Sprache) systematisch zusammenstellen und auf Tasten legen. Die Zusammenlegung der Klassen beeinträchtigt die Zugänglichkeit der einzelnen (singulären) Phoneme nicht: Die Konsonanten und die Vokale werden tabellarisch zusammengestellt und die Beschriftung der Tabellen sind die phonologischen Basiskategorien. Insoweit weitere Merkmale benötigt werden, werden sie aus der Basisklassen herausgefiltert. Die Übergabe der ausgewählten Gruppen erfolgt in zwei Schritten.
Die Phoneme sind sprachspezifisch also von Sprache zu Sprache verschieden, wobei natürlich die einzelnen Phonemsysteme einander überlagern. Da in der Uralothek die Belege sprachlich (und auch nach Dialekten) klassifiziert vorlegen, ist es möglich aus dieser Belegsammlung die sprachspezifische Phoneminventar herauszufiltern, sortieren und als sprachspezigfische Tastatur (mit Phonemklassen) anzubieten. Die einzelsprachlichen Phoneminventare und Tastaturen werden automatisch generiert.

2. Erfassung der genetischen Beziehungen zwischen den (uralischen) Sprachen

Die Verwandtschaftsbeziehungen zwichen den uralischen Sprachen stehen fest und werden einandern fachintern in einem interaktiven genetischen Stammbaum zugeordnet. Diese Repräsentation wird auch der Datenbasis zugänglich gemacht. hierdurch ist es möglich nicht nur die Sprachen abzufragen, die in dedr UEDb belegt sind sondern auch alle Sprachzweige: wie obugrisch, ugrisch, ostseefinnisch, wolgaisch, wolgafinnisch usw. Die ausgewählte Sprachgruppe (oder Einzelsprache) kann direkt von Sprachbaum her aktiviert werden.

3. Automatische Generierung der einzelsprachlichen Suchwortlisten.

Die einzelsprachlichen Belege sind in der Uralothek auch als Klasse isolierbar und können exzeptiert werden. Die einzelsprachlichen Beleglisten sind weiter nach Dialekten spezifiziert (ausgenommen Finnisch, Estnisch und Ungarisch) und die Belegwortlisten können auch dialektspezifisch erstellt werden. Auch die Anzahl der Belege wird ermittelt. Da die Dialekte auch geordnet und in Dialektgruppen zusammengefaßt sind, ist es möglich auch die Auflistungen der Dialektgruppen anzufordern (also Berg-Tscheremissisch, Nord-wogulisch oder Tundra-Nenetzisch usw. Die Generierung der Listen erfolgt automatisch in der Zeit der Systemgenerierung.

4. Gezielte Gegenüberstellung von zwei oder mehreren Sprachen nach einer phonologischen Konfiguration.

Man kann zwei Sprachen auswählen und auflisten, welche Etymologien in diesem Sprachpaar überhaupt belegt sind. Also:
Ungarisch - Syrjänisch,
Mordwinisch - Selkupisch usw.
Interessanter ist nicht alle etymologischen Entsprechungen auflisten zu lassen, sondern auch eine phonologische Konfiguration mit anzugeben:
z.B. intervokalisches langes -kk- in der rekonstruierten Form und dessen Reflexe in Mordwinisch und Syrjänisch.
Auch die Entsprechungen einer belegsprachliche Konfiguration können geprüft werden, z.B. Ungarisch: -ngy- in Lappischen.
Da die virtuelle Tastaturen auch hier zur Verfügung stehen, können auch Phonemklassen in Sprachpaaren geprüft bzw. getestet werden:
Beispiel: Entsprechungen von intervokalischen ostjakischen stimmlosen Spiranten im Tscheremissischen. (Dies ist wahrscheinlich die linguistisch interessanteste Abfragemöglichkeit.)
Man kann anstatt zwei auch drei und mehrere Sprachen (bzw. Sprachzweige) nach den obigen Schema testen. Die Antwortzeiten werden länger und die Treffer weniger zahlreich.
z.B. Ostseefinnisch Mordwnisch und Selkup -- mit rekonstruierten -mp-.
Die Anzeige der Erbegnisse erfolgt in tabellarischer Form. Die Listen werden sortiert und durchnummeriert. Angezeigt werden nur die relevanten Informationen, also die gefragten Lautformen.
Wenn mehrere Sprachen gefragt werden und sie nicht alle vorgefunden werden, werden die Teilmengen gebildet und systematisch festgehalten. Wenn die Abfrage lediglich eine Teilerfolg erzielt, kann der Benutzer sich diese Listen anzeigen lassen.

5. Freie Abfrage mit XQL-regular expressions

XQL bietet eine mächtige, sehr vielfältige Abfragemöglichkeit, aber erfordert Einarbeitung. Ursprünglich gab es lediglich hier ein Ratgeber und eine Liste von exemplarischen Anfragen, für potentielle Abfragetypen. Der Benutzer sollte dann analog zu den getesteten Musterfällen seine eigene Frage formulieren.
Besser verallgemeinert werden kann und benutzerfreundlicher ist die Abfragemöglichkeit mit einer Struktur-Tabelle (DTD). Der Benutzer kann auf der Mustertabelle einklicken, was er sehen möchte. Das System erzeugt die XQL-Suchkette für den angeforderten Knoten der UEDB-XML-Datei.
Alle Informationen (tags und attributs) aus dem UEDb können abgefragt werden Darauf soll der Benutzer bestimmen ebenfalls mit Hilfe der DTD-Tabelle bestimmen, wie seine Suchergebnisse präsentiert werden.

6. Generierung des UEDb-Uralothek-Systems.

Solange UEDb lediglich als eine Datenbasis angesehen war betrachteten wir die Stylesheets, die der Anzeige durchführten als eine Improvisation, die schnell geändert und -- z.B. bei Änderung der Kodierung -- nachgebessert werden könnte. Als die Anzeige-Routinen wuchsen, ergab sich ein Koordinierungsbedürfnis.
Das Uralothek-System enthält Routinen für Erneuerung des Systems.
Primär sind drei Dateien:
1. UEDB.XML -Basisdatei
2. TIMENRU_.TTF Fonts für die Wiedergabe der Diakritischen Zeichen
3. Die Liste der benutzten Quellen
Sekundär, d.h. abgeleitet sind die folgenden:
1. Die Liste der Dialekten mit der genetischen Gliederung
2. Die sprach- bzw. dialektspezifischen Suchwortlisten
3. Die sprach- bzw. dialektspezifischen Fontlisten
4. Die mit phonologischen Klassifizierung bereicherte Fontliste (für die automatische Generierung der Tastaturen)