Le dictionnaire d'extensions d'abréviations


Cordial, depuis sa première version, intègre un dictionnaire d'abréviations. Ce dictionnaire, s'il est actif, est consulté lors de la correction orthographique, de sorte que des abréviations comme "abrév." ou "ind." sont reconnues comme des mots à part entière et ne sont donc pas signalées comme des mots inconnus.


Le dictionnaire d'extensions d'abréviations que nous proposons dans la version 2008 vous permet d'associer à chaque abréviation l'extension de cette abréviation, par exemple "abréviation" pour "abrév." ou "indéfini" pour "indéf.".


Ce dictionnaire a été constitué à partir du dépouillement de l'ensemble du corpus utilisé pour les ressources linguistiques (entre autres pour l'extraction du contexte et des compositions de mots), c'est-à-dire à partir de plus de 1,2 milliard de mots. A ce corpus ont été ajoutées plusieurs centaines d'annonces immobilières et d'offres d'emploi. Ainsi ce dictionnaire d'extensions d'abréviations donne une image fidèle des abréviations et apocopes d'usage courant. Les abréviations du type SMS (koi, dsl, etc.), assez fréquentes dans les courriels et les forums de discussion n'ont pas été conservées (il faudrait un dictionnaire spécifique) mais les abréviations les plus courantes en prise de note ("bcp" pour "beaucoup", "tjrs" pour "toujours") ont été conservées.


Au final le dictionnaire contient 5206 entrées, c'est-à-dire 5206 abréviations, qui réfèrent à 7227 extensions, car à une abréviation correspondent parfois plusieurs extensions possibles, y compris un féminin ou un pluriel irrégulier.


Les mécanismes d'abréviation sont complexes. Dans les ouvrages comme les dictionnaires, l'abréviation doit permettre l'identification certaine du mot (ainsi "accroissement" sera abrégé "accroiss.", alors qu'on trouve également "acccr.", en particulier dans des légendes de graphes et tableaux). L'abréviation est alors presque toujours composée des premières lettres du mot et d'un point abréviatif, placé avant une voyelle. Mais les apocopes (débuts de mots sans point final comme "alu" ou "trauma") et les aphérèses (fin de mot sans point final comme "pitaine" pour "capitaine" ou "bus" pour "autobus") sont assez communes. On trouve également des acronymes lorsqu'ils ne qualifient pas des organismes ou entreprises (dans ce cas, ils se trouvent dans le dictionnaire d'extensions de sigles). Ainsi "laser" pour "Light Amplification by Stimulated Emission of Radiation" ou "zac" pour "zone d'aménagement concerté". Sont également proposés les symboles chimiques, les abréviations de mesure (généralement sans point final, comme "s" ou "W") ainsi que des abréviations familières comme "accro" ou "alcoolo".


Toutes les abréviations fournies figurent au minimum dans deux documents de notre corpus, certaines y figurent plusieurs milliers de fois. Ce dictionnaire n'a pas la prétention de fournir toutes les abréviations existantes ou possibles. Ainsi "anticonstitutionnellement", bien qu'il s'agisse du plus long mot en français, n'a jamais été trouvé abrégé dans notre corpus (le mot lui-même ne figure que 40 fois dans le corpus). En consultant ce dictionnaire d'abréviations, chacun peut toutefois bien observer les mécanismes adoptés généralement pour abréger et, de ce fait, pourra abréger correctement n'importe quel mot.