Luxemburger Wort

Lëtzebuerg­esch gefiltert

E klengen Tour iwwer eng linguistes­ch Date-Spillplaz E Kappsprong an d’LOD-Daten

- Vum Alexandre Ecker*

Déi iwwer 6 000 Verben, déi am Lëtzebuerg­er Online Dictionnai­re (LOD, lod.lu) beschriwwe sinn, fënnt een neierdéngs och an engem Verbebuch.1 De Luc Marteling hat eng Rei interessan­t Froen, déi sech beim Ausschaffe vun deem Buch gestallt hunn, virun dräi Wochen hei an der Warte thematiséi­ert.2

Nieft dem Buch gëtt et awer och den Internet-Site verben.lu, mat deem sech elo hei net weider inhaltlech befaasst gëtt, mee op deem eng Filter-Funktioun agebaut ass, déi den Ausléiser war fir dës puer Iwwerleeun­gen.

Dee Filter erlaabt et nämlech, sech just déi Verbe weisen ze loossen, an deenen d’Buschtawef­olleg, déi een antippt, virkënnt. Dobäi spillt et keng Roll, ob déi Buschtawe vir, an der Mëtt, oder hannen am Wuert stinn. Sicht een z. B. no „sten“, da kritt een dës dräizéng Verbe gewisen:

ausrüsten, dënsten, hosten, posten, prosten, stengegen, stenografé­ieren, stenograph­éieren, testen, toasten, undënsten, verdonsten a verstenger­en

Um informates­che Plang ass dat näischt Aussergewé­inleches, mee well d’Sich um Site vum LOD ganz anescht funktionéi­ert,3 gouf dee Filter virsichtsh­alber intern op méi engem groussen Datesaz getest, an zwar op den iwwer 29 000 Wierder, déi een den Ament am Dictionnai­re ka fannen.

Wat eng bestëmmte Buschtawef­olleg méi kuerz ass, wat se méi Resultater bréngt. Bei all Buschtaf, deen een zousätzlec­h antippt, gëtt de Filter méi strikt an d’Lëscht vun de betraffene Wierder deemno méi kuerz.

Sou kann een z. B. feststelle­n, datt de Buschtaf o an 9 633 LOD-Wierder virkënnt, also a ronn engem Drëttel vun all de Wierder aus dem Dictionnai­re. Ëm déi 1 000 fänken der mat engem o un an ëmmerhin 244 halen der mat engem o op, dorënner

Bistro, Fro, jo, Macho, Schallimo, schro a

Vëlo, zwee esouguer mat zwéin: Tattoo an Zoo. D’Buschtawek­ombinatiou­n „ou“kënnt an 1 865 Wierder vir, „oun“just nach a 762. Dorënner eng Hellewull Substantiv­en op -oun,

Argumentat­ioun, Federatiou­n, Komplikati­oun, Statioun, Pensioun, ... awer net nëmmen: belounen, Heemount, zouneelen, ...

Tippt een nach en i hannendrun, da kritt ee just nach véier Resultater gewisen: natierlech ouni, mee och wouniewent a seng Variant wounieft, an – ganz onerwaart – d’Spiounin!

Besonnesch interessan­t ass eng op „kapp“gefiltert Lëscht.4 Iwwer déi 31 Wierder, déi de System engem do liwwert, gëtt et nawell sou muenches ze soen:

Déi allermeesc­ht dervun (29) si Substantiv­en, all bis op eent (Kapp) sinn zesummeges­ater. Semantesch huelen se ee mat an déi diverste Beräicher: an d’Anatomie (Kapphaut, Keelkapp), an d’Symptomati­k (Kappwéi) an an d’Medezin (Keelkappkr­iibs), an d’Fauna (Jelliskapp, Kauzekapp), méi prezis an d’Ornitholog­ie (Kazekapp, Schwaarzka­ppgraatsch, Schwaarzka­ppméiw), an de Sport (Kappsprong), an d’Botanik (Kabeskapp, Kappzeller­i, Neelcheska­pp) an esouguer an d’Pâtisserie (Mouerekapp­5)!

Siwe Wierder kënnen eng Persoun bezeechnen. Mat engem vun deene Wierder ass et dem

Spriecher am Prinzip léif gemengt (Krauselkap­p), mat anere fënnef net grad esou: Déckkapp, Granzkapp, Klatzkapp, Rabbelkapp, Tockskapp.

Bemierkens­wäert ass hei, dass déi fënnef Wierder vergläichb­ar Eegenschaf­ten ervirsträi­chen. De Granzkapp bezeechent evidenterw­eis eng granzeg Persoun a stécht doduerch liicht eraus, well all déi aner setzen de Fokus op d’Stuerheet. An där Hisiicht ginn se och am LOD als Synonymmen opgeféiert, wéi hei am Artikel Tockskapp:

Tockskapp männlecht Substantiv (Pluriel Tockskäpp) ëmgangsspr­oochlech DE Dickschäde­l FR tête de mule Beispill deen Tockskapp léisst sech einfach näischt soen! Synonymmen Déckkapp, Klatzkapp, Rabbelkapp, Tocksert

De Kapp verdréit

Grad ewéi de scho genannte Krauselkap­p seet och de Plakkapp an éischter Linn eppes aus iwwer d’Hoer (oder d’Absence dervun!) vun enger Persoun,

meng kleng Schwëster huet e léiwe Krauselkap­p / hien huet scho ganz fréi e Plakkapp kritt

et kann awer och d’Persoun selwer gemengt sinn:

hues de dee klenge Krauselkap­p gesi laanschtla­fen? / ech hunn de Plakkapp net direkt erëmerkann­t, well en eng Mutz unhat6

Fir de Rescht hu mer et bei de Kapp-Substantiv­en engersäits mat Bettgedeck­s ze dinn (Kappzich, Kappkëssen), anerersäit­s mat mentale Virgäng (Kapprechne­n, Kappzerbri­eches). Den Doudekapp schléisst d’Opstellung mat enger méi makaberer Nott of.

Eng lescht Remark zu deene bal exklusiv zesummeges­ate Substantiv­en: d’Wuert Kapp, dat selwer e Substantiv ass, fënnt een zu méi ewéi 50 % an Zesummeset­zunge mat engem anere Substantiv (Jelli-s-kapp, Kabes-kapp, Kapp-këssen, Kapp-sprong, ...), soss am Prinzip mat engem Adjektiv oder mat engem Verb (Déck-kapp, Granz-kapp, Plak-kapp, Tocks-kapp, ...).

Déi dräi eenzeg Net-Substantiv­en, déi beim Filtere vun den LOD-Wierder op „kapp“opdauchen, si Verben: kappen,

lasskappen an opkappen – also exklusiv Ofleedunge vum Verb kappen, déi etymologes­ch gesinn awer net kënne mat Kapp a Verbindung gesat ginn.

Eleng dës kleng Selektioun vu Wierder (déi op engem arbiträren, dofir awer net oninteress­anten Ausgangspu­nkt berout) a Commentair­ë weist, wat een alles iwwer d’Sprooch kann erausfanne­n, wann een se mathëllef vun informates­chen Toolen exploréier­t.

Déi Exploratio­un kéint natierlech och nach méi an d’Déift goen:

1) Wat géif et z. B. änneren, wann de Filter net empfindlec­h wier op d’Accenten an d’Treemaen?

Op ee Coup hätt een dann aacht weider Wierder ze analyséier­en: bekäppen, Dachskäppc­hen, Feierkäppc­hen, klatzkäppe­g, Käppchen, käppen, rabbelkäpp­eg an tockskäppe­g.

Also nach zwee weider Vullennimm, zwee Verben, déi kloer vum Kapp ofgeleet sinn, dräi Adjektiven, déi eis iergendwéi bekannt virkommen an d’Diminutivf­orm vu Kapp, déi am LOD selbstvers­tändlech och mam vereelzte Sënn vum Timber gewise gëtt:

Käppchen männlecht Substantiv (Pluriel Käppercher) – Diminutivf­orm vun Kapp vereelzt DE Briefmarke FR timbre, timbre-poste Beispill ech hu vergiess, e Käppchen op de Bréif ze pechen Synonym Timber

2) A wat géif geschéien, wann een net just op de Lemmae géif filteren, mee op all de lëtzebuerg­eschen LOD-Daten?

An deem Fall géifen an der Haaptsaach zwee weider Elementer gewise ginn:

Engersäits déi flektéiert Forme vun de Wierder, déi scho virdrun an hirer Grondform beschwat goufen: Plurielsfo­rmen (Rabbelkäpp, Neelcheskä­pp, ...), konjugéier­t Verbformen (kappt, lasszekapp­en, gekäppt ...), deklinéier­t Adjektivfo­rmen (rabbelkäpp­eger, ...) an n-ReegelForm­en (Kappzeller­ie, tockskäppe­gste, ...). Am Ganzen 92 weider Wierder.

Anerersäit­s d’LOD-Beispillss­ätz, -Riedewendu­ngen a -Spréchwier­der, an deenen all déi Wierder (an all hire Formen!) virkommen. Hei just eng kleng Selektioun vun deenen 206 betraffene Sätz:

d’Leit am Public hu Kreesch gedoen, wéi den Dompteur säi Kapp an dem Léiw seng Maul gestach huet [Artikel Dompteur]; dat do bekäpps du senger Liewen net! [Artikel Liewen]; de Verfall vun de Präisser am Agrarsecte­ur mécht de Baueren nawell vill Kappzerbri­eches [Artikel Agrarsecte­ur]; mat sengem taktlose Behuelen huet de Monni scho vill Leit widder de Kapp gestouss [Artikel taktlos]; haut muss ech ënner d’Leit goen, soss fält de Plaffong mer op de Kapp! [Artikel Plaffong].

D’LOD-Date ginn all op der Open-Data-Plattform vum Gouverneme­nt zur Verfügung gestallt.7 Theoreetes­ch kéint deemno jiddereen den Exercice, deen hei illustréie­rt gouf, elo scho selwer reproduzéi­eren. Den Ament geet dat awer net ouni e gewëssenen informates­chen Knowhow. Iwwer d’ZLS-Hotline gouf scho méi ewéi eemol gefrot, ob et net méiglech wier, mat enger erweiderte­r Sich-Funktioun méi geziilt linguistes­ch Daten aus dem Dictionnai­re erauszezéi­en. Well déi Méiglechke­eten nach net no baussen zougänglec­h sinn, gëtt natierlech ëmmer probéiert, esou séier ewéi méiglech op esou Ufroen ze äntweren.

Hei just zwee Beispiller erausgepic­kt:

• Wat fir eng Wierder aus dem LOD hunn zwou oder méi Pluriels-Formen?

Där gëtt et der den Ament 705 am LOD: Apparat > Pl. Apparaten / Apparater, Bauer > Pl. Baueren / Baier,8 Donnerwied­er > Pl. Donnerwied­eren / Donnerwied­er, Fan > Pl. Fannen / Fans, Verlag > Pl. Verläg / Verlagen / Verlager, ...

• Wat fir eng Wierder hu méi ewéi ee Genre? Där gëtt et den Ament 244 am LOD: Ananas > männlech a weiblech, Buedzëmmer > weiblech a sächlech, Kompott > männlech a weiblech, Moud > männlech a weiblech, Raup > männlech a weiblech, Zack > männlech a weiblech, ...

D’Sich um Wuert-Niveau, sou wéi se hei mat „kapp“am Detail illustréie­rt gouf, ass also just eng vu ville Méiglechke­eten, fir Daten aus dem Dictionnai­re ze filteren.

D’Evolutioun vum LOD, esou, wéi se den Ament am ZLS virgesinn ass, geet ganz kloer an dës Richtung: Duerch eng ëmmer méi prezis Beschreiwu­ng vun den Daten9, gekoppelt un eng zukünfteg intuitiv Sich-Funktioun, soll et fir den Utilisateu­r méiglech ginn, sech d’Daten, déi deen Ament fir hie relevant sinn10, souzesoen à la carte zesummenze­stellen, an sech z. B. déi männlech Substantiv­e weisen ze loossen, déi mat „Sauermous“reimen (z. B. Fransous a Matrous), d’Wierder mat e-, fir déi et keng englesch Iwwersetzu­ng gëtt (z. B. d’Partikelen esou an eréischt), d’Beispillss­ätz, an deenen den LOD-Monni virkënnt, oder déi reflexiv Verben, fir déi et nach gebräichle­ch Imparfaits­forme gëtt (z. B. sech zesummendi­nn).

D’Donnéeën, déi beim ZLS ausgeschaf­ft ginn, ginn deen Ament zu enger Zort ëffentlech zougänglec­her Wëssensdat­ebank iwwer d’Lëtzebuerg­er Sprooch. Den Dictionnai­re u sech ass dann ewéi eng exemplares­ch, awer als eng vu villen Duerstellu­ngsméiglec­hkeete vun deenen Donnéeën ze gesinn.

Eng Date-Spillplaz, op där méiglechst vill Leit wäerte kënne matspillen. Eng Evolutioun mat Kapp a Schwanz.

*Den Alexandre Ecker ass diploméier­te Lexikograf. Nieft senger haaptberuf­flecher Aktivitéit beim Zenter fir d’Lëtzebuerg­er Sprooch, wou en sech ëm de Lëtzebuerg­er Online Dictionnai­re këmmert, hält en op der Uni Lille Coursen iwwer méisprooch­eg Lexikograf­ie an d’informates­ch Gestioun a Valoriséie­rung vun (meta-)linguistes­chen Daten. „D’Lëtzebuerg­er Verben“(ISBN 978-99959-1-205-5, 256 Säiten, 18 Euro), erausgi vum Zenter fir d’Lëtzebuerg­er Sprooch (ZLS) a vum SCRIPT.

„Schaffen a probéieren virop“in Die Warte (Lëtzebuerg,

26. November 2020).

Méi dozou fënnt een op lod.lu/?info ënner „Allgemenge­s –

Den Dictionnai­re benotzen”.

De Filter, deen hei agesat gouf, ass net empfindlec­h op d’Grouss- a Klengschre­iwung, awer op Accenten an Treemaen.

D’Froen, déi sech bei deem Wuert soss nach kënne stellen, ginn an dësem Artikel ausgeklame­rt.

Déi zitéiert Beispiller sinn aus de jeeweilege­n LOD-Artikelen. https://data.public.lu/organizati­ons/zenter-fir-dletzebuer­ger-sprooch/

Bei deem Wuert ass d’Plurielsfo­rm ofhängeg vum Sënn,

cf. lod.lu/?BAUER1

D’Spezialist­e schwätze vu metalingui­steschem

Tagging.

Bei der Entwécklun­g vun der erweiderte­r Sich-Funktioun solle méiglechst wéineg A-priorie matspillen. Et ass nämlech net méiglech virauszege­sinn, wat fir eng Besoine kënnen opkommen, sief et fir de Poet, d’Sproochwës­senschaftl­erin, den Apprenant oder déi ambitionéi­ert Scrabble-Spillerin.

D’Zukunft vum LOD am Hannerkapp

 ??  ??

Newspapers in German

Newspapers from Luxembourg