Lëtzebuergesch gefiltert
E klengen Tour iwwer eng linguistesch Date-Spillplaz E Kappsprong an d’LOD-Daten
Déi iwwer 6 000 Verben, déi am Lëtzebuerger Online Dictionnaire (LOD, lod.lu) beschriwwe sinn, fënnt een neierdéngs och an engem Verbebuch.1 De Luc Marteling hat eng Rei interessant Froen, déi sech beim Ausschaffe vun deem Buch gestallt hunn, virun dräi Wochen hei an der Warte thematiséiert.2
Nieft dem Buch gëtt et awer och den Internet-Site verben.lu, mat deem sech elo hei net weider inhaltlech befaasst gëtt, mee op deem eng Filter-Funktioun agebaut ass, déi den Ausléiser war fir dës puer Iwwerleeungen.
Dee Filter erlaabt et nämlech, sech just déi Verbe weisen ze loossen, an deenen d’Buschtawefolleg, déi een antippt, virkënnt. Dobäi spillt et keng Roll, ob déi Buschtawe vir, an der Mëtt, oder hannen am Wuert stinn. Sicht een z. B. no „sten“, da kritt een dës dräizéng Verbe gewisen:
ausrüsten, dënsten, hosten, posten, prosten, stengegen, stenograféieren, stenographéieren, testen, toasten, undënsten, verdonsten a verstengeren
Um informatesche Plang ass dat näischt Aussergewéinleches, mee well d’Sich um Site vum LOD ganz anescht funktionéiert,3 gouf dee Filter virsichtshalber intern op méi engem groussen Datesaz getest, an zwar op den iwwer 29 000 Wierder, déi een den Ament am Dictionnaire ka fannen.
Wat eng bestëmmte Buschtawefolleg méi kuerz ass, wat se méi Resultater bréngt. Bei all Buschtaf, deen een zousätzlech antippt, gëtt de Filter méi strikt an d’Lëscht vun de betraffene Wierder deemno méi kuerz.
Sou kann een z. B. feststellen, datt de Buschtaf o an 9 633 LOD-Wierder virkënnt, also a ronn engem Drëttel vun all de Wierder aus dem Dictionnaire. Ëm déi 1 000 fänken der mat engem o un an ëmmerhin 244 halen der mat engem o op, dorënner
Bistro, Fro, jo, Macho, Schallimo, schro a
Vëlo, zwee esouguer mat zwéin: Tattoo an Zoo. D’Buschtawekombinatioun „ou“kënnt an 1 865 Wierder vir, „oun“just nach a 762. Dorënner eng Hellewull Substantiven op -oun,
Argumentatioun, Federatioun, Komplikatioun, Statioun, Pensioun, ... awer net nëmmen: belounen, Heemount, zouneelen, ...
Tippt een nach en i hannendrun, da kritt ee just nach véier Resultater gewisen: natierlech ouni, mee och wouniewent a seng Variant wounieft, an – ganz onerwaart – d’Spiounin!
Besonnesch interessant ass eng op „kapp“gefiltert Lëscht.4 Iwwer déi 31 Wierder, déi de System engem do liwwert, gëtt et nawell sou muenches ze soen:
Déi allermeescht dervun (29) si Substantiven, all bis op eent (Kapp) sinn zesummegesater. Semantesch huelen se ee mat an déi diverste Beräicher: an d’Anatomie (Kapphaut, Keelkapp), an d’Symptomatik (Kappwéi) an an d’Medezin (Keelkappkriibs), an d’Fauna (Jelliskapp, Kauzekapp), méi prezis an d’Ornithologie (Kazekapp, Schwaarzkappgraatsch, Schwaarzkappméiw), an de Sport (Kappsprong), an d’Botanik (Kabeskapp, Kappzelleri, Neelcheskapp) an esouguer an d’Pâtisserie (Mouerekapp5)!
Siwe Wierder kënnen eng Persoun bezeechnen. Mat engem vun deene Wierder ass et dem
Spriecher am Prinzip léif gemengt (Krauselkapp), mat anere fënnef net grad esou: Déckkapp, Granzkapp, Klatzkapp, Rabbelkapp, Tockskapp.
Bemierkenswäert ass hei, dass déi fënnef Wierder vergläichbar Eegenschaften ervirsträichen. De Granzkapp bezeechent evidenterweis eng granzeg Persoun a stécht doduerch liicht eraus, well all déi aner setzen de Fokus op d’Stuerheet. An där Hisiicht ginn se och am LOD als Synonymmen opgeféiert, wéi hei am Artikel Tockskapp:
Tockskapp männlecht Substantiv (Pluriel Tockskäpp) ëmgangssproochlech DE Dickschädel FR tête de mule Beispill deen Tockskapp léisst sech einfach näischt soen! Synonymmen Déckkapp, Klatzkapp, Rabbelkapp, Tocksert
De Kapp verdréit
Grad ewéi de scho genannte Krauselkapp seet och de Plakkapp an éischter Linn eppes aus iwwer d’Hoer (oder d’Absence dervun!) vun enger Persoun,
meng kleng Schwëster huet e léiwe Krauselkapp / hien huet scho ganz fréi e Plakkapp kritt
et kann awer och d’Persoun selwer gemengt sinn:
hues de dee klenge Krauselkapp gesi laanschtlafen? / ech hunn de Plakkapp net direkt erëmerkannt, well en eng Mutz unhat6
Fir de Rescht hu mer et bei de Kapp-Substantiven engersäits mat Bettgedecks ze dinn (Kappzich, Kappkëssen), anerersäits mat mentale Virgäng (Kapprechnen, Kappzerbrieches). Den Doudekapp schléisst d’Opstellung mat enger méi makaberer Nott of.
Eng lescht Remark zu deene bal exklusiv zesummegesate Substantiven: d’Wuert Kapp, dat selwer e Substantiv ass, fënnt een zu méi ewéi 50 % an Zesummesetzunge mat engem anere Substantiv (Jelli-s-kapp, Kabes-kapp, Kapp-këssen, Kapp-sprong, ...), soss am Prinzip mat engem Adjektiv oder mat engem Verb (Déck-kapp, Granz-kapp, Plak-kapp, Tocks-kapp, ...).
Déi dräi eenzeg Net-Substantiven, déi beim Filtere vun den LOD-Wierder op „kapp“opdauchen, si Verben: kappen,
lasskappen an opkappen – also exklusiv Ofleedunge vum Verb kappen, déi etymologesch gesinn awer net kënne mat Kapp a Verbindung gesat ginn.
Eleng dës kleng Selektioun vu Wierder (déi op engem arbiträren, dofir awer net oninteressanten Ausgangspunkt berout) a Commentairë weist, wat een alles iwwer d’Sprooch kann erausfannen, wann een se mathëllef vun informateschen Toolen exploréiert.
Déi Exploratioun kéint natierlech och nach méi an d’Déift goen:
1) Wat géif et z. B. änneren, wann de Filter net empfindlech wier op d’Accenten an d’Treemaen?
Op ee Coup hätt een dann aacht weider Wierder ze analyséieren: bekäppen, Dachskäppchen, Feierkäppchen, klatzkäppeg, Käppchen, käppen, rabbelkäppeg an tockskäppeg.
Also nach zwee weider Vullennimm, zwee Verben, déi kloer vum Kapp ofgeleet sinn, dräi Adjektiven, déi eis iergendwéi bekannt virkommen an d’Diminutivform vu Kapp, déi am LOD selbstverständlech och mam vereelzte Sënn vum Timber gewise gëtt:
Käppchen männlecht Substantiv (Pluriel Käppercher) – Diminutivform vun Kapp vereelzt DE Briefmarke FR timbre, timbre-poste Beispill ech hu vergiess, e Käppchen op de Bréif ze pechen Synonym Timber
2) A wat géif geschéien, wann een net just op de Lemmae géif filteren, mee op all de lëtzebuergeschen LOD-Daten?
An deem Fall géifen an der Haaptsaach zwee weider Elementer gewise ginn:
Engersäits déi flektéiert Forme vun de Wierder, déi scho virdrun an hirer Grondform beschwat goufen: Plurielsformen (Rabbelkäpp, Neelcheskäpp, ...), konjugéiert Verbformen (kappt, lasszekappen, gekäppt ...), deklinéiert Adjektivformen (rabbelkäppeger, ...) an n-ReegelFormen (Kappzellerie, tockskäppegste, ...). Am Ganzen 92 weider Wierder.
Anerersäits d’LOD-Beispillssätz, -Riedewendungen a -Spréchwierder, an deenen all déi Wierder (an all hire Formen!) virkommen. Hei just eng kleng Selektioun vun deenen 206 betraffene Sätz:
d’Leit am Public hu Kreesch gedoen, wéi den Dompteur säi Kapp an dem Léiw seng Maul gestach huet [Artikel Dompteur]; dat do bekäpps du senger Liewen net! [Artikel Liewen]; de Verfall vun de Präisser am Agrarsecteur mécht de Baueren nawell vill Kappzerbrieches [Artikel Agrarsecteur]; mat sengem taktlose Behuelen huet de Monni scho vill Leit widder de Kapp gestouss [Artikel taktlos]; haut muss ech ënner d’Leit goen, soss fält de Plaffong mer op de Kapp! [Artikel Plaffong].
D’LOD-Date ginn all op der Open-Data-Plattform vum Gouvernement zur Verfügung gestallt.7 Theoreetesch kéint deemno jiddereen den Exercice, deen hei illustréiert gouf, elo scho selwer reproduzéieren. Den Ament geet dat awer net ouni e gewëssenen informateschen Knowhow. Iwwer d’ZLS-Hotline gouf scho méi ewéi eemol gefrot, ob et net méiglech wier, mat enger erweiderter Sich-Funktioun méi geziilt linguistesch Daten aus dem Dictionnaire erauszezéien. Well déi Méiglechkeeten nach net no baussen zougänglech sinn, gëtt natierlech ëmmer probéiert, esou séier ewéi méiglech op esou Ufroen ze äntweren.
Hei just zwee Beispiller erausgepickt:
• Wat fir eng Wierder aus dem LOD hunn zwou oder méi Pluriels-Formen?
Där gëtt et der den Ament 705 am LOD: Apparat > Pl. Apparaten / Apparater, Bauer > Pl. Baueren / Baier,8 Donnerwieder > Pl. Donnerwiederen / Donnerwieder, Fan > Pl. Fannen / Fans, Verlag > Pl. Verläg / Verlagen / Verlager, ...
• Wat fir eng Wierder hu méi ewéi ee Genre? Där gëtt et den Ament 244 am LOD: Ananas > männlech a weiblech, Buedzëmmer > weiblech a sächlech, Kompott > männlech a weiblech, Moud > männlech a weiblech, Raup > männlech a weiblech, Zack > männlech a weiblech, ...
D’Sich um Wuert-Niveau, sou wéi se hei mat „kapp“am Detail illustréiert gouf, ass also just eng vu ville Méiglechkeeten, fir Daten aus dem Dictionnaire ze filteren.
D’Evolutioun vum LOD, esou, wéi se den Ament am ZLS virgesinn ass, geet ganz kloer an dës Richtung: Duerch eng ëmmer méi prezis Beschreiwung vun den Daten9, gekoppelt un eng zukünfteg intuitiv Sich-Funktioun, soll et fir den Utilisateur méiglech ginn, sech d’Daten, déi deen Ament fir hie relevant sinn10, souzesoen à la carte zesummenzestellen, an sech z. B. déi männlech Substantive weisen ze loossen, déi mat „Sauermous“reimen (z. B. Fransous a Matrous), d’Wierder mat e-, fir déi et keng englesch Iwwersetzung gëtt (z. B. d’Partikelen esou an eréischt), d’Beispillssätz, an deenen den LOD-Monni virkënnt, oder déi reflexiv Verben, fir déi et nach gebräichlech Imparfaitsforme gëtt (z. B. sech zesummendinn).
D’Donnéeën, déi beim ZLS ausgeschafft ginn, ginn deen Ament zu enger Zort ëffentlech zougänglecher Wëssensdatebank iwwer d’Lëtzebuerger Sprooch. Den Dictionnaire u sech ass dann ewéi eng exemplaresch, awer als eng vu villen Duerstellungsméiglechkeete vun deenen Donnéeën ze gesinn.
Eng Date-Spillplaz, op där méiglechst vill Leit wäerte kënne matspillen. Eng Evolutioun mat Kapp a Schwanz.
*Den Alexandre Ecker ass diploméierte Lexikograf. Nieft senger haaptberufflecher Aktivitéit beim Zenter fir d’Lëtzebuerger Sprooch, wou en sech ëm de Lëtzebuerger Online Dictionnaire këmmert, hält en op der Uni Lille Coursen iwwer méisproocheg Lexikografie an d’informatesch Gestioun a Valoriséierung vun (meta-)linguisteschen Daten. „D’Lëtzebuerger Verben“(ISBN 978-99959-1-205-5, 256 Säiten, 18 Euro), erausgi vum Zenter fir d’Lëtzebuerger Sprooch (ZLS) a vum SCRIPT.
„Schaffen a probéieren virop“in Die Warte (Lëtzebuerg,
26. November 2020).
Méi dozou fënnt een op lod.lu/?info ënner „Allgemenges –
Den Dictionnaire benotzen”.
De Filter, deen hei agesat gouf, ass net empfindlech op d’Grouss- a Klengschreiwung, awer op Accenten an Treemaen.
D’Froen, déi sech bei deem Wuert soss nach kënne stellen, ginn an dësem Artikel ausgeklamert.
Déi zitéiert Beispiller sinn aus de jeeweilegen LOD-Artikelen. https://data.public.lu/organizations/zenter-fir-dletzebuerger-sprooch/
Bei deem Wuert ass d’Plurielsform ofhängeg vum Sënn,
cf. lod.lu/?BAUER1
D’Spezialiste schwätze vu metalinguisteschem
Tagging.
Bei der Entwécklung vun der erweiderter Sich-Funktioun solle méiglechst wéineg A-priorie matspillen. Et ass nämlech net méiglech virauszegesinn, wat fir eng Besoine kënnen opkommen, sief et fir de Poet, d’Sproochwëssenschaftlerin, den Apprenant oder déi ambitionéiert Scrabble-Spillerin.
D’Zukunft vum LOD am Hannerkapp