Lemma (lexicografie)

Van Wikipedia, de gratis encyclopedie
Spring naar navigatie Spring naar zoeken

Het lemma ( oude Griekse λῆμμα lēmma , eigenlijk 'wat is genomen', 'wat is geaccepteerd'; Meervoud: lemma's [1] ) is de basisvorm van een woord in de lexicografie en taalkunde , d.w.z. de woordvorm waaronder een term in een naslagwerk kan worden gevonden ( nominale vorm , citatievorm).

Lemma, lexeem en citatievorm

Het lemma is de invoer of het sleutelwoord in een woordenboek ( lexicon , encyclopedie ). [2] Het wordt zowel de basisvorm van een woord als de citatie of basisvorm van een lexeem genoemd . [3] [4] De werkwijze van het bepalen hoe preciezer lemma heet lemma selectie of lemmatisering.

Een lexeem - een linguïstische betekeniseenheid - zou in principe op elke manier kunnen worden genoemd, aangezien het wordt geabstraheerd als een linguïstische eenheid van verschillende vormen, maar zelf geen specifieke vorm heeft die het onderscheidt van andere vormen. Lexemen worden meestal genoemd naar een conventioneel bepaalde vorm, die dan de citatievorm (ook: basisvorm , trefwoord ) van dit lexeme wordt genoemd:

  • In het Duits is de citatievorm voor zelfstandige naamwoorden meestal de nominatief enkelvoud (bijv. droom ), voor werkwoorden de infinitief aanwezig actief (bijv. droom ).
  • In het Latijn is de citatievorm voor werkwoorden het paradigma (voorbeeld), dat een reeks van bepaalde modi (infinitief, indicatief, conjunctief) en tijden (tegenwoordige tijd, perfectie ...) specificeert, wat vooral handig is bij onregelmatige werkwoorden . Deze volgorde is in de meeste woordenboeken: 1e persoon enkelvoud indicatief tegenwoordige actief, 1e persoon enkelvoud indicatief perfect actief, actief supinum I of deelwoord perfect passief (PPP) onzijdig en tenslotte infinitief tegenwoordig actief. Het paradigma voor "brengen, dragen" is bijvoorbeeld: fero , tuli , latum , ferre . In leerboeken daarentegen komt de infinitief present active eerst.

Taalkundige naslagwerken gebaseerd op het woord ( lexica , thesauri , etymologische werken) gebruiken alle lexemen als lemma's, terwijl naslagwerken die meer geïnteresseerd zijn in conceptuele lemmaselectie ( specialistische lexicons , specialistische woordenlijsten , encyclopedieën en dergelijke) de voorkeur geven aan het eenvoudigste zelfstandig naamwoord als de citaatvorm - vooral in het Duits: "de droom", "droom", "de droom" en "de gedroomde" worden bijvoorbeeld samengevat onder een gemeenschappelijke lemma- droom , voor zover het dezelfde kwestie betreft. Hier wordt over het lemma meestal gesproken als een descriptor .

Het volgende voorbeeld laat zien dat de keuze van de citatievorm afhankelijk is van het type naslagwerk:

  • Het woord "muizen" valt onder het lemma muis .
    Deze benadering selecteert een normaal woordenboek, aangezien "muis" de basisvorm is van het meervoud "muizen".
  • In de biologie wordt het woord "muis" geclassificeerd onder de lemma muizen .
    In een biologisch leerboek wordt het muizengeslacht als overkoepelende term gebruikt. Het taxonomische citatieformulier muizen geeft aan dat er veel verschillende soorten muizen zijn en niet alleen “de muis”. De kijk op biologie verschilt van de omgangstaal, die alles wat op een muis lijkt een "muis" noemt.
  • Voor computermuizen is muis het lemma in een leerboek; In een universeel woordenboek kan het item bijvoorbeeld Mouse (Computer) zijn .
    Computermuizen kunnen er anders uitzien en verschillen in details, maar de overeenkomsten worden als belangrijker ervaren dan de verschillen wanneer ze in het woordenboek worden geclassificeerd. Daarom wordt het lemma, in tegenstelling tot in de biologie, in het enkelvoud gebruikt.

lemmatisering

De lexicografische reductie van de verbogen vormen van een woord tot een basisvorm, d.w.z. de definitie van de basisvorm van een lexeem en de rangschikking van de lemma's wordt ook wel lemmatisering genoemd . Een deelverzameling van direct opeenvolgende lemma's vormt een Lemmastrecke .

Onder lemmatisering wordt ook verstaan ​​het bepalen (of terugbrengen) van een volledige vorm naar het bijbehorende lemma. Dit proces is belangrijk afhankelijk van de toepassing in de spraaktechnologie . Bij gebruik van statistische modellen is bijvoorbeeld de lemmatisering van een zeer klein tekstcorpus soms geschikt om de frequentie van individuele lexemen te verhogen en daarmee statistische ruis te verminderen. De volledige vormen van het corpus worden vóór de statistische evaluatie vervangen door hun lemma. Als de woordvormen 'met', 'meet', 'meets' en 'meet' bijvoorbeeld eerder een keer in het corpus bestonden, is er na de lemmatisering alleen het lemma 'meet' - zij het met een frequentie van vier. Het lexeem "meet" heeft dus een potentieel veel hoger gewicht in het lichaam dan de individuele volledige vormen vóór lemmatisering hadden.

Lemma selectie

Voorafgaand aan de lemmatisering wordt een lemma selectie uitgevoerd waarbij wordt besloten welke soorten lemma's moeten worden opgenomen in het lexicon. Lemma selectie is noodzakelijk omdat een volledige lemmatisering van alle woorden, delen van woorden en groepen van woorden in een taal is vervelend. Een criterium voor het opnemen van een lemma in een lexicon is de tijdspanne waarin de term in de betreffende taal bestaat.

Lemma-selectie is nauw verbonden met de trefwoorden van de gebruikte teksten - wat niet nodig is in het geval van algemene taalwerken omdat de volledige woordenschat moet worden ontwikkeld, maar is heel relevant in technische en andere lexicons van groepstalen , en met de kwestie van synoniemen , homoniem en de polysemen .

Zie ook

literatuur

  • Patrick Brandt, Rolf-Albert Dietrich, Georg Schön: taalkunde. Een rode draad voor het leren van de Duitse taal (= Uni-Taschenbücher 8331). 2e, herziene en bijgewerkte druk. Böhlau, Keulen / Weimar / Wenen 2006, ISBN 978-3-8252-8331-5 (UTB) / ISBN 978-3-412-00606-8 (Böhlau).
  • Winfried Ulrich: Woordenboek van taalkundige basistermen (= Hirts' indexboeken ), 5e, volledig herziene editie. Borntraeger, Berlijn / Stuttgart 2002, ISBN 3-443-03111-0 .
  • Hadumod Bußmann (Ed.), Hartmut Lauffer: Lexicon of Linguistics, met 14 tabellen, 4e, herziene en bibliografisch aangevulde editie. Kröner, Stuttgart 2008, ISBN 978-3-520-45204-7 .

web links

WikiWoordenboek: Lemma - uitleg van betekenissen, woordoorsprong, synoniemen, vertalingen

zwellen

  1. Duden: Lemma
  2. ^ Patrick Brandt, Rolf-Albert Dietrich, Georg Schön: Taalkunde. 2006, blz. 151.
  3. Lemma, lemmatisering. In: Helmut Glück (Ed.), Met de medewerking van Friederike Schmöe : Metzler Lexikon Sprache. 3e, herziene druk. Metzler, Stuttgart / Weimar 2005, ISBN 3-476-02056-8 .
  4. Lemma. In: Winfried Ulrich: Woordenboek van taalkundige basistermen. 2002.