Sprachidentifikation

Bei der Sprachidentifikation geht es darum, mit statistischen Mitteln zu bestimmen oder zu erraten, in welcher Sprache ein entsprechender Text geschrieben ist. Der englische Begriff dafür ist language identification oder auch language guessing (1).

Klingonisch hat einige Eigenheiten, die dabei sehr nützlich sein können (2):

  • Die Buchstaben unterscheiden sich in Groß- und Kleinschreibung: q und Q sind unterschiedliche Buchstaben, D, I und S kommen nur in Großbuchstaben, ch, tlh und v nur in Kleinbuchstaben vor.
  • Der Apostroph kommt relativ oft vor, häufig am Anfang oder Ende einer Silbe Phonologie.
  • Der Apostroph kommt auch mitten im Wort vor, manchmal auch doppelt.
  • -be' und -'a' kommen häufig als Suffix vor.
  • 'oH und Qapla' kommen häufig vor.

Mit guesslanguage.js(3) existiert auch ein Open-Source-Projekt, das eine Erkennung der klingonischen Sprache und weiterer Sprachen via JavaScript ermöglicht. Es arbeitet mit statistischen Daten auf der Basis von N-Grammen.

Siehe auch

Einzelnachweise

1 : (en) Language identification in der Wikipedia, abgerufen am 21. Oktober 2016

2 : (en) Wikipedia:Language recognition chart, abgerufen am 21. Oktober 2016

3 : (en) Projektseite auf GitHub, abgerufen am 21. Oktober 2016

Weblinks

Kategorie: Allgemein    Letzte Bearbeitung: 30 Oct 2016, durch MarcZankl    Erstellt: 21 Oct 2016 durch MarcZankl


 
Das Klingonisch-Wiki ist ein Projekt des Deutschen Klingonisch-Instituts. Alle inhalte werden zu edukativen Zwecken dargestellt Zwecks Förderung der klingonischen Sprache und dienen zur Unterstützung in Kombination mt den bekannten offiziellen Werken zum Thema. Die Begriffe Star Trek™ und Klingon™ sind Eigentum von CBS Studios Inc. und Paramount Pictures.