1. Virtuelle Tastaturen für phonologische Klassen
- Die virtuellen Tastaturen sind als eine Hilfmittel entstanden,
die ermöglichen sollten, die
fehlenden diakritischen Zeichen
oder Sonderzeichen mit einem Tastendruck einzugeben.
Beipielsweise sollte eine rekonstruierte Form mit einer Endung
auf -ŋ$ (am Wortende) gesucht werden:
Vorgehen
- Uralothek aktivieren
- Rekonstruktion auswählen
- Tastatur in Kopfteil anklicken
- ŋ + + $ die Tasten auf der VT betätigen
- Suchergebnis: die gesuchten LE-Instanzen.
Weitere Beispiele: (Ungarisch) é, ü, á, usw.
- Die erste Erweiterung entstand als eine zusätzliche Vereinfachung
um Doppelbuchstaben oder Kodierungen mit einem einzigen Tastenberührung
effizienter (schneller, weniger fehleranfällig) einzugeben.
Uralothek:
1. Vergleich -- Sprache
2. Ungarische auswählen
3. Belegsprache in Headfeld anklicken
4. Tastatur rufen
5. Beispiel: cs-ü-cs-ö-k
Beispiele: Ung. sz, ny, cs -- &a_acute; u.ä.
- Zusammenfassung der diakritischen Erweiterungen:
Wenn die diakritischen Zeichen auf der Maschine schon gespeichert sind,
kann mann die diakritischen Erweiterungen der einzelnen einfachen
Basisbuchstaben speziell für die Suche zusammenfassen:
univs.html:
Beispiele: alle a-a, alle é-s usw.
Man such alle a-s, gleichgültig ob lang uder alle s-Laute usw.
Dies ist unpräzis, aber kann u.U. sinnvoll und notwendig sein
- Schließlich man kann die phonologischen Klassen (einer Sprache)
systematisch zusammenstellen und auf Tasten legen.
Die Zusammenlegung der Klassen beeinträchtigt die Zugänglichkeit
der einzelnen (singulären) Phoneme nicht:
Die Konsonanten und die Vokale werden tabellarisch zusammengestellt
und die Beschriftung der Tabellen sind die phonologischen Basiskategorien.
Insoweit weitere Merkmale benötigt werden, werden sie aus der Basisklassen
herausgefiltert. Die Übergabe der ausgewählten Gruppen erfolgt in zwei
Schritten.
- Die Phoneme sind sprachspezifisch also von Sprache zu Sprache verschieden,
wobei natürlich die einzelnen Phonemsysteme einander überlagern.
Da in der Uralothek die Belege sprachlich (und auch nach Dialekten)
klassifiziert vorlegen, ist es möglich aus dieser Belegsammlung die
sprachspezifische Phoneminventar herauszufiltern, sortieren und
als sprachspezigfische Tastatur (mit Phonemklassen) anzubieten.
Die einzelsprachlichen Phoneminventare und Tastaturen werden automatisch generiert.
2. Erfassung der genetischen Beziehungen zwischen den (uralischen) Sprachen
Die Verwandtschaftsbeziehungen zwichen den uralischen Sprachen stehen
fest und werden einandern fachintern in einem
interaktiven
genetischen Stammbaum
zugeordnet. Diese Repräsentation wird auch der Datenbasis zugänglich
gemacht. hierdurch ist es möglich nicht nur die Sprachen abzufragen,
die in dedr UEDb belegt sind sondern auch alle Sprachzweige: wie
obugrisch, ugrisch, ostseefinnisch, wolgaisch, wolgafinnisch usw.
Die ausgewählte Sprachgruppe (oder Einzelsprache) kann direkt von
Sprachbaum her aktiviert werden.
3. Automatische Generierung der einzelsprachlichen Suchwortlisten.
Die einzelsprachlichen Belege sind in der Uralothek auch als Klasse
isolierbar und können exzeptiert werden. Die einzelsprachlichen
Beleglisten sind weiter nach Dialekten spezifiziert (ausgenommen
Finnisch, Estnisch und Ungarisch) und die
Belegwortlisten können
auch dialektspezifisch erstellt werden. Auch die Anzahl der Belege
wird ermittelt.
Da die Dialekte auch geordnet und in Dialektgruppen zusammengefaßt
sind, ist es möglich auch die Auflistungen der Dialektgruppen
anzufordern (also Berg-Tscheremissisch, Nord-wogulisch oder
Tundra-Nenetzisch usw.
Die Generierung der Listen erfolgt automatisch in der Zeit der
Systemgenerierung.
4. Gezielte Gegenüberstellung von zwei oder mehreren Sprachen nach
einer phonologischen Konfiguration.
Man kann zwei Sprachen auswählen und auflisten, welche Etymologien
in diesem Sprachpaar überhaupt belegt sind.
Also:
Ungarisch - Syrjänisch,
Mordwinisch - Selkupisch usw.
Interessanter ist nicht alle etymologischen Entsprechungen auflisten
zu lassen, sondern auch eine
phonologische Konfiguration
mit anzugeben:
z.B. intervokalisches langes -kk- in der rekonstruierten Form und
dessen Reflexe in Mordwinisch und Syrjänisch.
Auch die Entsprechungen einer belegsprachliche Konfiguration können
geprüft werden, z.B. Ungarisch: -ngy- in Lappischen.
Da die virtuelle Tastaturen auch hier zur Verfügung stehen, können
auch Phonemklassen in Sprachpaaren geprüft bzw. getestet werden:
Beispiel: Entsprechungen von intervokalischen ostjakischen stimmlosen Spiranten
im Tscheremissischen.
(Dies ist wahrscheinlich die linguistisch interessanteste Abfragemöglichkeit.)
Man kann anstatt zwei auch drei und mehrere Sprachen (bzw. Sprachzweige)
nach den obigen Schema testen. Die Antwortzeiten werden länger und die
Treffer weniger zahlreich.
z.B. Ostseefinnisch Mordwnisch und Selkup -- mit rekonstruierten -mp-.
Die Anzeige der Erbegnisse erfolgt in tabellarischer Form. Die Listen
werden sortiert und durchnummeriert. Angezeigt werden nur die relevanten
Informationen, also die gefragten Lautformen.
Wenn mehrere Sprachen gefragt werden und sie nicht alle vorgefunden werden,
werden die Teilmengen gebildet und systematisch festgehalten. Wenn die Abfrage lediglich
eine Teilerfolg erzielt, kann der Benutzer sich diese Listen anzeigen lassen.
5. Freie Abfrage mit XQL-regular expressions
XQL bietet eine mächtige, sehr vielfältige Abfragemöglichkeit, aber
erfordert Einarbeitung. Ursprünglich gab es lediglich hier ein Ratgeber
und eine Liste von exemplarischen Anfragen, für potentielle Abfragetypen.
Der Benutzer sollte dann analog zu den getesteten Musterfällen seine
eigene Frage formulieren.
Besser verallgemeinert werden kann und benutzerfreundlicher ist die Abfragemöglichkeit
mit einer Struktur-Tabelle (DTD). Der Benutzer kann auf der Mustertabelle
einklicken, was er sehen möchte. Das System erzeugt die XQL-Suchkette für den
angeforderten Knoten der UEDB-XML-Datei.
Alle Informationen (tags und attributs) aus dem UEDb
können abgefragt werden
Darauf soll der Benutzer bestimmen
ebenfalls mit Hilfe der DTD-Tabelle bestimmen, wie seine Suchergebnisse
präsentiert werden.
6. Generierung des UEDb-Uralothek-Systems.
Solange UEDb lediglich als eine Datenbasis angesehen war betrachteten
wir die Stylesheets, die der Anzeige durchführten als eine Improvisation,
die schnell geändert und -- z.B. bei Änderung der Kodierung --
nachgebessert werden könnte. Als die Anzeige-Routinen wuchsen,
ergab sich ein Koordinierungsbedürfnis.
Das Uralothek-System enthält Routinen für Erneuerung des Systems.
Primär sind drei Dateien:
1. UEDB.XML -Basisdatei
2. TIMENRU_.TTF Fonts für die Wiedergabe der Diakritischen Zeichen
3. Die Liste der benutzten Quellen
Sekundär, d.h. abgeleitet sind die folgenden:
1. Die Liste der Dialekten mit der genetischen Gliederung
2. Die sprach- bzw. dialektspezifischen Suchwortlisten
3. Die sprach- bzw. dialektspezifischen Fontlisten
4. Die mit phonologischen Klassifizierung bereicherte Fontliste
(für die automatische Generierung der Tastaturen)