Morphèmes, morphologieLes différents types de morphèmes
On répartit traditionnellement les morphèmes en deux groupes : les morphèmes lexicaux et les morphèmes grammaticaux. Pour opérer cette distinction, plusieurs critères sont possibles :
Dans certaines traditions linguistiques, on utilise le terme "lexème" pour désigner ce que nous appelons ici "morphème lexical", et "morphème" pour ce que nous nommons ici "morphème gramatical". Nous nous en tiendrons par la suite à nos termes initiaux. Cette distinction entre morphèmes lexicaux et grammaticaux est sans doute plus une affaire de degré que de coupure franche. Certaines prépositions comme "dans", par exemple, ont une sémantique plus riche que d'autres comme "de", et on peut discuter de leur classification. Ce découpage présente aussi l'inconvénient de laisser de côté une famille de mots qui jouent un rôle fondamental dans le TALN à l'heure actuelle : il s'agit des entités nommées. On nomme ainsi depuis quelques années la classe des expressions qui désignent soit des "noms propres" (de lieux, de personnes, d'organisations, etc.), soit des "valeurs numériques" (dates, nombres, etc.). Ces mots ou groupes de mots ont longtemps été oubliés des classifications parce qu'ils ne figurent pas dans les dictionnaires usuels. Mais de nombreux textes (par exemple, les articles de presse) en sont truffés, et ils contribuent au sens de ces textes de façon déterminante. Toutes les applications de fouille de textes fondées sur le sens se doivent donc de les identifier et de les prendre en compte. Cela justifie qu'ils font l'objet de recherches intensives depuis quelques années. Nous y reviendrons plus loin. Il ne fait pas de doute que les entités nommées appartiennent à une liste ouverte : tout le monde peut inventer le nom de sa nouvelle société, voire le prénom qu'il donne à ses enfants. Mais le caractère référentiel de ces expressions est un problème connu en logique depuis longtemps comme délicat. Nous préférerons donc les considérer comme à une classe à part.
|