INTRODUCTION A LA LINGUISTIQUE

Ferdinand de Saussure, linguiste suisse considéré par plusieurs comme le « père » de la linguistique, a grandement contribué à l’établissement de la linguistique comme champ d’étude scientifique. Avec ses travaux du début du 20e siècle, il a défini ce champ d’étude comme une « science qui a pour objet la langue envisagée en elle-même et pour elle-même. » (P.Robert 1991)

1- Tout d’abord, la langue est considérée comme objet d'analyse scientifique en lui-même, hors de tout contexte social qui apporte souvent des jugements de valeur, comme le démontre la citation suivante de Martinet:

" Une étude est dite scientifique lorsqu'elle se fonde sur l'observation des faits et s'abstient de proposer un choix parmi ces faits au nom de certains principes esthétiques ou moraux." (Martinet cité dans Leclerc 1989:7)

C’est à la suite de cette définition, au début du début du 20e siècle, que la linguistique s’est établie comme discipline scientifique et qu'elle a commencé à se démarquer d’autres disciplines utilisant la langue comme la philologie (…science historique qui a pour objet la connaissance des civilisations passées par les documents écrits qu’elles nous ont laissés. (Dict. Ling Larousse)).

La linguistique se veut donc un outil de description scientifique neutre qui ne tient pas compte des valeurs personnelles associées à la perception d’une langue ou d’une population.

En accord avec cette visée, un certain nombre de questions seront soulevées ou traitées par la linguistique et par d'autres sciences connexes :

• Comment est-ce que les locuteurs produisent et perçoivent le langage et la langue?

Les analyses linguistiques ont donné lieu à l’établissement de 5 domaines distincts d’étude qui sont devenus les domaines d’analyse traditionnels de la linguistique. Le tableau ci-dessous présente une brève définition de chacune de ces sous discipline (l’étude approfondie de chaque sous discipline nécessitera une définition plus complète).

Domaines traditionnels de la linguistique, aussi appelés domaines « internes » de la linguistique :

• Sémantique : « étude du langage considéré du point de vue du sens. » (P. Robert 1991)

• Phonétique : « étude de la substance des unités vocales utilisées dans les langues humaines. » (Martin 1996 :2)

• Phonologie : « Science qui étudie les sons du langage du point de vue de leur fonction dans le système de communication linguistique ». (Dict. de linguistique Larousse)

• Morphologie : « Étude des formes des mots. » (Dict. de linguistique Larousse)

• Syntaxe : « Étude des règles qui président à l’ordre des mots et à la construction des phrases, dans une langue; (…) » (PRobert 1991)

Il est également important de noter que des études plus poussées en linguistique révélera que les frontières entres ces domaines ont tendance à s’estomper à la lumière de certaines théories (comme entre syntaxe et morphologie par exemple en grammaire générative).

Depuis ses débuts comme science reconnue, la linguistique s’est grandement diversifiée. Aux 5 champs d’étude principaux et traditionnels que sont la sémantique, la phonétique, la phonologie, la morphologie et la syntaxe, se sont ajoutés un bon nombre de sous domaines comme la neurolinguistique, la sociolinguistique, la psycholinguistique, etc. Dans la plupart des cas, ces sous domaines proposent un éclairage sur la nature et de l’utilisation de la langue et du langage nouveau et enrichi des connaissances prises dans un domaine connexe et tout à fait compatible avec la linguistique. Il est possible de faire une comparaison avec les domaines présentés ci-dessus en affirmant que les domaines présentés ci-dessous examinent la langue dans son contexte social.

• Sociolinguistique : l'étude des relations entre les phénomènes linguistiques et sociaux.

• Ethnolinguistique : l'étude de la langue en tant qu'expression d'une culture (en relation avec la situation de communication).

• Dialectologie : « (…) discipline qui s’est donné pour tâche de décrire comparativement les différents systèmes ou dialectes dans lesquels une langue se diversifie dans l’espace et d’établir leurs limites. » (Dict. de linguistique Larousse)

• Psycholinguistique : « L'étude scientifique des comportements verbaux dans leurs aspects psychologiques. » (Dict. de linguistique Larousse)

• Lexicologie : science des unités de signification (monèmes) et de leurs combinaisons en unités fonctionnelles (…) souvent étudiées dans leurs rapports avec la société dont elles sont l’expression. » (Dict. de linguistique Larousse) L’application de la lexicologie se nomme la lexicographie qui est la technique de confection des dictionnaires.

• L’aménagement linguistique: consiste en la mise au point d'un processus de décision sur la langue par un état ou un gouvernement, qui résulte en une politique linguistique.

• La neurolinguistique: science qui traite des rapports entre les troubles du langage (aphasies) et les atteintes des structures cérébrales qu’ils impliquent. (Dict. de linguistique Larousse)

• Analyse de discours : « (…) partie de la linguistique qui détermine les règles commandant la production des suites de phrases structurées. » (Dict. de linguistique Larousse)

1.1. Description versus prescription

Les définitions présentées ci-dessus ont comme point commun la description de l’utilisation de la langue, soit dans des circonstances différentes (dans des contextes différents comme en sociolinguistique par exemple) ou d’un point de vue particulier (comme la compréhension de la parole, en psycholinguistique par exemple). On tente de décrire le fonctionnement de la langue soit dans le but de comprendre son fonctionnement, soit pour comprendre le fonctionnement du cerveau, lieu des processus cognitifs et, par le fait même, d’utilisation de la langue.

Il est bien important de voir que le but poursuivi par les linguistes n’est pas de prescrire l’utilisation de la langue. Une telle approche mènerait le linguiste à relever les fautes d’orthographe, ou d’accord du participe passé en français par exemple. En réalité, lorsque les gens font ce que l’on appelle des « écarts de langage », ils révèlent souvent des caractéristiques très intéressantes d’une langue qui sont reliées aux exceptions grammaticales (verbales, accord des adjectifs par exemple) ou aux particularités dialectales de la variété qui est étudiée. Alors, lorsqu’un locuteur du français dit : « Ils jousent au hockey », il ne fait que généraliser le patron de conjugaison à un verbe irrégulier. Cette forme présente donc un intérêt certain d’un point de vue linguistique, car elle permet d’expliquer la structure des patrons de conjugaison.

Ceci étant dit, c'est un but tout à fait noble et valable de prescrire l’utilisation de la langue. Cette prescription est essentielle dans le but d’instaurer un standard en vue d’une intercompréhension entre toutes les communautés francophones. Par contre, et contrairement à l’opinion parfois véhiculée dans le public, cette responsabilité revient plutôt à ceux qui font les politiques linguistiques d’un pays ou état, de même qu’aux professeurs de langue plutôt qu’aux linguistes.

1.2. Grammaire et linguistique

La notion de "grammaire" est primordiale en linguistique. Contrairement à la définition plutôt traditionnelle, elle ne réfère pas à l'ouvrage de référence qui contient une liste de règles que l'on doit suivre pour faire des phrases bien formées en français. Elle réfère à toutes les règles de formation d'énoncés utilisées pour communiquer correctement dans une langue (et qui sont différentes d'une langue à l'autre). Plusieurs linguistes considèrent de nos jours la grammaire d'un locuteur comme étant un "modèle de compétence idéale qui établit une certaine relation entre le son et le sens." (Dict Ling Larousse)

L’une des préoccupations des linguistes est de comprendre le fonctionnement du langage d’un point de vue cognitif. Comme il est impossible, en pratique, de déterminer le fonctionnement exact du cerveau lorsque l’on utilise une langue (production ou compréhension), il est nécessaire de construire des modèles théoriques qui vont dupliquer ce fonctionnement. Le modèle parfait de fonctionnement du langage nous permettrait de dire que nous comprenons parfaitement et entièrement le fonctionnement de ce phénomène complexe, et ce, dans toutes les circonstances. Nous sommes encore loin d'avoir atteint ce but.

Les analyses ont donc pour but de construire des modèles théoriques ou de raffiner les modèles déjà existants. Ces analyses procèdent souvent à partir d’un ensemble d’énoncés (phrases, mots, etc.) duquel seront extraites un certain nombre de généralités. Cet ensemble d'énoncés contiendra des énoncés qui sont soit grammaticaux soit agrammaticaux, c'est-à-dire qui satisfont ou non aux règles de formation de phrases dans une langue donnée. Ces généralités permettront au linguiste de faire des abstractions sur un point théorique particulier.

Les analyses effectuées procèdent à l’aide d’une méthodologie rigoureuse qui permet de reproduire les résultats de façon constante. Cette méthodologie n’est pas étrangère à celle utilisée dans d’autres domaines scientifiques comme la physique ou la chimie. La méthodologie utilisée par le chercheur est en général approuvée par la communauté linguistique et considérée valable. On voit mal en effet un chimiste essayant de créer une nouvelle molécule avec une toute nouvelle méthodologie truffée d’erreurs et obtenant cette nouvelle molécule seulement dans 50% des cas.

Le linguiste, lui, a la tâche de déterminer les énoncés qui sont valides dans une langue, c'est-à-dire déjà été entendus ou qui sont conforme aux règles grammaticales d’une langue comme nous les connaissons. Ceci mène à la distinction entre les énoncés qui sont jugés grammaticaux, agrammaticaux, ou acceptables :

• Grammatical : qui respecte les règles de la grammaire d’une langue (par ex. : « Le petit chien joue dans le parc. »)

• Agrammatical : qui viole les règles de la grammaire d’une langue (par ex. : *« Petit le chien joue parc le dans. ») À noter que l’astérisque, « * », indique que l’énoncé est agrammatical.

• Acceptable : énoncés qui sont ou pourraient être compris ou produits par une les membres d’une communauté linguistique sans effort particulier sans nécessairement être grammatical. (par ex. : « J’ai acheté un échelle » –échelle est considéré comme féminin et non masculin, ce qui rend l'énoncé agrammatical mais néanmoins acceptable). Il existe plusieurs degrés d'acceptabilité.

À la suite des observations précédentes, nous pouvons considérer la linguistique comme étant:

• systématique: elle possède un aspect formel et théorique qui mène à l’élaboration de modèle langagiers,

• scientifique: procède d'une méthodologie rigoureuse et scientifique en vue d'élaboration de modèles théoriques,

• descriptive (et non prescriptive): son but est de décrire la langue en elle-même, son fonctionnement et son usage.

1.3. Distinction langue, langage, parole

Parmi les distinctions terminologiques proposées par Ferdinand de Saussure au début de siècle dernier, celles de langue, langage et de parole se sont révélées particulièrement pertinentes et elles sont toujours utilisées de nos jours.

Langage: faculté inhérente et universelle de l'humain de construire des langues (des codes) pour communiquer. (Leclerc 1989:15) Le langage réfère à des facultés psychologique permettant de communiquer à l’aide d’un système de communication quelconque. Le langage est inné.

Langue: système de communication conventionnel particulier. Par « système », il faut comprendre que ce n'est pas seulement une collection d'éléments mais bien un ensemble structuré composé d'éléments et de règles permettant de décrire un comportement régulier (pensez à la conjugaison de verbes en français par exemple). La langue est acquise.

Le langage et la langue s'opposent donc par le fait que l'un (la langue) est la manifestation d'une faculté propre à l'humain (le langage).

Parole: une des deux composantes du langage qui consiste en l'utilisation de la langue. La parole est en fait le résultat de l’utilisation de la langue et du langage, et constitue ce qui est produit lorsque l'on communique avec nos pairs.

Selon Saussure, la langue est le résultat d’une convention sociale transmise par la société à l'individu et sur laquelle ce dernier n'a qu'un rôle accessoire. Par opposition, la parole est l'utilisation personnelle de la langue (toutes les variantes personnelles possibles: style, rythme, syntaxe, prononciation, etc.).

Le changement de la langue relève d'un individu mais son acception relève de la communauté. ex.: le verbe « jouer » conjugué «jousent » est pour l'instant considéré comme une variante individuelle (parole), une exception, et il le demeurera tant qu'il ne sera pas accepté dans la communauté (les locuteurs du français québécois dans ce cas-ci).

1.4. La langue comme phénomène en évolution (diachronie-synchronie):

L'une des propriétés les plus importantes et les plus intéressantes du langage est sa capacité à se modifier sur une longue période de temps. Même si nous avons parfois l'impression que les divers outils de description linguistique (grammaire, dictionnaire) fixent la langue à jamais, elle est en constante évolution. L’étude de cette évolution appartient au domaine de la linguistique diachronique (du grec dia-chronos "à travers le temps").

Il est donc possible d’affirmer que, par analogie, la langue est vivante. Ceci veut dire que l’utilisation que nos grands-parents, ou nos arrière-grands-parents faisaient de la langue n’est pas exactement la même que celle que nous en faisons. Par exemple, il est facile de voir une série de nouveaux termes qui ont été introduits par l’avènement des ordinateurs dans notre monde moderne. Nous parlons maintenant de courriels, d’autoroute électronique, de téléchargement, de foire aux questions, etc. Projetée sur plusieurs centaines d’années, cette évolution crée des modifications importantes de la langue. Les plus incrédules pourront visionner un film comme "Les visiteurs" ou aller voir une pièce de Shakespeare pour voir la dichotomie entre l'état de la langue à plusieurs siècles d’intervalle.

Cependant, afin de faire l’étude d’une langue dans son évolution, il est nécessaire d’avoir une description de son état à un moment précis de son histoire (comme on peut superposer une série d'images pour en faire un film). Cette étude de la langue appartient la la linguistique synchronique (du grec sun-chronos "en même temps").

Dans ce premier cours d’introduction, nous ne traiterons majoritairement que des études synchroniques.

1.5. L’oral et l'écrit

L’approche analytique la plus commune au langage se fait généralement par sa forme écrite. Depuis que nous sommes touts petits, nous nous faisons corriger lorsque nous faisons une faute de grammaire, lorsque nous ne conjuguons pas correctement un verbe (ex.: ils jousent), lorsque nous utilisons un pluriel qui n'est pas exact (ex.: chevals), etc. Cependant, la linguistique ne s’intéresse que relativement peu à l’aspect écrit du langage et presqu'exclusivement à sa forme orale. Les raisons sont multiples, et en voici trois des plus importantes :

a) le langage dans sa forme orale est apparu bien avant l’écriture dans l’histoire de l’homme

b) le langage existe d'abord et avant tout sous forme orale; il est appris d’abord sous cette forme par tous les enfants pour être ensuite enseigné dans sa forme écrite. Cela donne d’ailleurs lieu à des situations cocasses à l’occasion alors que des formes avec ou sans article peuvent être confondues: ex.: de l’asphalt ~ ?de la sphalt. De plus, il est possible de maîtriser très bien une langue et d'en ignorer l'orthographe (analphabètes).

c) ce lien entre la langue écrite et la langue parlée, malgré le fait que c’en est un véritable, tend à diminuer avec le temps. L’orthographe s'est fixé plus ou moins avec l'arrivée de l'imprimerie, mais les prononciations ont continué d'évoluer. La forme écrite n'a pu rendre compte de tous les changements apportés à l'oral pour des raisons évidentes et tout à fait valables de normalisation. Pensons par exemple à la non prononciation des accents circonflexes (qui a maintenant disparu), la disparition des triphtongues (eau) et des diphtongues (au, eu, ou, ...), etc.

En conséquence, la linguistique s’intéresse beaucoup plus à la forme sonore ou orale du langage qu’à sa forme écrite et, dans ce cours, nous ne ferons référence qu’à la forme orale du français, sauf avis contraire.

1.6. Deux questions importantes

Cette question, pourtant si simple, ne connaît pas encore de réponse succinte. Il n'est possible d'y répondre qu'en amorçant une discussion de certaines notions linguistiques fondamentales.

En premier lieu, il est nécessaire de distinguer ce qu'est une langue et ce qu'est un dialecte. Il est relativement facile de comparer le français et le grec par exemple, ou le français et le japonais et d’affirmer que ces codes sont différents. Les interlocuteurs de ces langues auraient grande peine à se comprendre et il leur serait impossible d'engager une conversation sensée sur un sujet particulier.

Cependant, les frontières entre langues ne sont pas toujours aussi claires. Il existe des communautés linguistiques qui parlent des variétés de langues qui partagent un certain nombre de caractéristiques. Prenons l’anglais et le français par exemple. Pour des raisons historiques, une proportion significative du vocabulaire anglais est similaire à celui du français. Tout comme l’anglais de Grande Bretagne et celui du sud des Etats-Unis par exemple. Dans le premier cas, le reste des systèmes grammaticaux (système du verbe, syntaxe, etc.) sont suffisamment distincts pour justifier de les considérer comme deux langues distinctes, ce qui n’est pas le cas dans le deuxième exemple. Il est effectivement difficile d’imaginer que des locuteurs de l’anglais britannique et américain ne puissent se comprendre avec une relative aisance.

Qu’en est-il cependant de locuteurs qui peuvent se comprendre un tout petit peu? Prenons l’allemand et l’anglais. Il est tout à fait commun pour un locuteur de l’anglais d’entendre un texte en allemand et de comprendre certains mots (et même parfois l’essentiel d’un texte). De façon similaire, les locuteurs du français peuvent comprendre une bonne partie d’une conversation en espagnol et vice-versa. Devrions-nous en conclure que ces codes sont des dialectes d’une même langue, au même type que l’anglais de Terre-Neuve et celui d’Irlande? Certainement pas. Mais il est important de réaliser que la distinction entre langue et dialecte d’une même langue n’est pas toujours aussi claire que nous le désirons. Dans tous les cas, il est nécessaire de procéder à un examen minutieux des codes utilisés par une communauté linguistique avant de pouvoir affirmer qu’ils appartiennent à deux dialectes ou langues différents.

En deuxième lieu, quiconque désire déterminer avec exactitude le nombre de langues dans le monde se heurte à un obstacle de taille: l’absence de connaissances sur une majorité des langues sur la terre. Il existe en effet relativement peu d’information disponible sur les langues retrouvées en Afrique, en Amérique du Sud et en Nouvelle-Guinée par exemple. Ce manque de connaissances rend très difficile la différenciation entre dialectes et langues distinctes dans ces régions où certaines de ces langues sont parfois même connues sous différents noms.

En troisième lieu, l’identification de langues dépend également de considérations culturelles, historiques et politiques. Dans certains cas, une même langue sera considérée comme différente par deux états qui lui ont donné un nom différent. C’est le cas du malais et de l’indonésien qui sont respectivement les langues de la Malaisie et de l’Indonésie, et de l’hindi et de l’ourdou qui sont parlées en Indes et au Pakistan (Builles 1998 :48).

Pour ces raisons (et pour d'autres non présentées ici), il est très difficile de déterminer avec précision le nombre de langues parlées par la population mondiale. La plupart des estimations dénombrent entre 3000 et 8000 le nombre de langues sur la terre. Nous pouvons estimer raisonnablement le nombre de langues à environ 4000.

La seule façon de répondre de façon précise à cette question serait de retourner dans le temps. Comme c'est bien évidemment impossible à faire, il nous est obligé de spéculer à partir des indications qui ont résisté à l’épreuve du temps et qui sont encore disponibles pour examen.

L’écriture peut nous permettre de situer avec certitude qu’à un moment précis les hommes savaient écrire et qu’il utilisaient déjà un système de communication sophistiqué. Les plus vieux de ces documents, découverts sur les territoires et de l’Iran et de l’Iraq, datent environ de 3000 à 2000 ans avant notre ère. Cependant, il nous est impossible de dater l’apparition des langues qui n’ont jamais été écrites ou dont les supports visuels n’ont pas survécu au passage du temps, ou qui n’ont simplement pas été encore découverts. Qui plus est, considérant que les langues complexes ont certainement été parlées et utilisées bien avant qu’elles ne soient écrites, la datation de leur apparition est d’autant plus hasardeuse.

Une autre approche a été adoptée par certains chercheurs qui ont utilisé les connaissances physiologiques pour y arriver. Il est possible de postuler que l’apparition de la parole est reliée de très près à certains changements physiologiques de l’appareil articulatoire chez l’humain. Certains chercheurs ont porté attention particulièrement à la position basse du larynx chez certains squelettes humains qui serait apparue il y a environ entre 400000 et 300000 ans avant notre ère chez l’Homo sapiens.

Quoique prometteuses, ces pistes de recherche ont fourni des indications qui n’ont permis pour l’instant que l’élaboration d’hypothèses qui nécessitent vérification.

2. La sémiologie et la linguistique

La discipline scientifique qui étudie les systèmes de communication se nomme la sémiologie (du grec "semeion", qui signifie "signe"). Comme la définition provenant de la racine hellénique le suggère, ces systèmes de signification sont développés autours de la notion de signe, dont nous parlerons plus bas.

C’est Ferdinand de Saussure, linguiste genevois, qui a été le fondateur européen de la sémiologie. Selon lui, la meilleure façon d'étudier la nature de la langue est d'étudier ses caractéristiques communes avec les autres systèmes de signe. De plus, considérant que la langue sert d’abord et avant tout à communiquer avec ses pairs, il est donc logique, que, dans le but de décrire son fonctionnement, nous fassions des rapprochements plus ou moins nombreux avec les autres systèmes de communication développés par l’homme. Saussure prétend également que la sémiologie devrait avoir pour objet d'étude "la vie des signes au sein de la vie sociale". Les langues naturelles seront donc étudiées en tant que système de communication au même titre que les systèmes de communication des sourds-muets, les rites symboliques, les formes de politesses, la pantomime, la mode, les signaux visuels maritimes, les coutumes, etc.

Les études sémiologiques sont divisées entre deux branches distinctes de la sémiologie: l'une, la sémiologie de la signification (Rolad Barthes et ses disciples), et l'autre la sémiologie de la communication (Luis J. Prieto, Georges Mounin, Jeanne Martinet).

Avant de continuer, une précision terminologique s’impose. Le terme "sémiotique" a été proposé par Charles S. Peirce qui, à la même époque où Saussure tentait de fonder la sémiologie, a tenté aux États-Unis de proposer une théorie générale des signes. Son disciple, Charles Morris, a adopté le même projet qu'il a nommé Sémiotics (publié dans Signs, Langage and Behavior 1946). Ce terme est ensuite pénétré en France pour en venir à désigner un ensemble du domaine sémiologique (la sémiotique du code de la route par exemple). Finalement, en 1969, un comité international qui a donné naissance à l'Association internationale de sémiotique a proposé d'adopter les deux appellations recouvrant toutes les acceptions des deux termes.

Les deux types de sémiologie se distinguent par leur objectif général: dans la sémiologie de la communication, la communication doit être au centre de la sémiologie (la langue est fondamentalement un instrument de communication). En comparaison, dans la sémiologie de la signification, la sémiologie devient une partie de la linguistique à cause du fait que les objets, les images ou les comportements ne peuvent jamais signifier de façon autonome, sans l'utilisation de langage.

2.1. La boucle de la communication

Dans le but d'expliquer le fonctionnement du langage et de la langue, les linguistes se sont intéressés à la transmission de sens entre deux individus. Cette étude a d'abord été schématisée à l'aide de la "boucle de la communication", qui présente les principaux éléments impliqués dans une interaction:

Si les éléments ci-dessus sont présents non seulement chez l'émetteur mais également chez le récepteur, on obtient ainsi une boucle fermée qui illustre une communication bidirectionnelle:

Les linguistes ont ensuite essayé d'élargir ce schéma en éclaircissant certaines de ses fonctions et en essayant d'incorporer le rôle de certains autres facteurs.

2.2. Le schéma de la communication de Jakobson

Ce schéma plus complet permet d'identifier un plus grand nombre d'intervenants et de facteurs intervenant dans une interaction. Tous les facteurs identifiés dans ce schéma ont un rôle à jouer dans le cadre d'un interaction et ils influencent tous le message qui est transmis.

• DESTINATEUR ~ DESTINATAIRE: correspondent respectivement à l'émetteur et au récepteur. Dans le cas d'une interaction normale, la communication est bidirectionnelle lorsque deux personnes interagissent de façon courante. Dans les cas où la communication est institutionnalisée (implique une institution comme une administration publique, une télévision, une université), la communication est unidirectionnelle; une seule personne produit de la parole alors que l'autre écoute. Une hiérarchie plus ou moins rigide s'impose lors de ces interactions, comme c'est le cas dans la salle de classe, où le professeur enseigne et où vous écoutez.

• MESSAGE: le matériel transmis par l'interlocuteur, l'information transmise. Ce message varie énormément dans sa durée, sa forme et son contenu. Dans les interactions individualisées, le message est généralement adapté à l'interlocuteur. Dans des communication institutionnalisées, le message est plutôt rigide et standard.

• le CONTACT (canal): canal physique et psychologique qui relie le destinateur et le destinataire. La nature du canal conditionne aussi le message. Un canal direct (locuteurs en face à face) implique une réponse directe dans le même médium, qui est l'air ambiant dans ce cas.

Le canal peut être modifié pour vaincre en particulier l'effet du temps: l'écriture sur du papier (livres, journaux, magazines, etc.), bandes magnétiques, disques, support magnétique utilisant même le courrier électronique, etc.

• RÉFÉRENT: la situation à laquelle renvoie le message, ce dont il est question (le contexte). Il réfère aux informations communes aux deux locuteurs sur la situation au moment de la communication. Ces informations sont sous-entendues et elles n'ont pas besoin d'être répétées à chaque fois que l'on débute une interaction.

• le CODE: "un code est un ensemble conventionnel de signes, soit sonores ou écrits, soit linguistiques ou non linguistiques (visuels ou autre), communs en totalité ou en partie au destinateur et au destinataire." (Leclerc 1989:24) Code doit être compris par les deux locuteurs pour permettre la transmission du message. Dans certains cas, le message peut mettre en oeuvre plusieurs codes en même temps (langue orale, les gestes, l'habillement, etc.). Dans ces cas, redondance, complémentarité ou contraste peuvent être mis en jeu.

2.3. Les fonctions du langage

À ces facteurs de la communication correspond une fonction linguistique bien précise (en caractères plus petits dans le tableau ci-dessous):

• fonction RÉFÉRENTIELLE: l'une des trois fonctions de base (avec expressive et incitative). Correspond à la fonction première du langage qui est d'informer, d'expliquer, de renseigner. Elle renvoie au référent, à la personne ou au sujet dont on parle (utilisation de la 3e personne très souvent). Intimement relié à la véracité du message en question (peut être vrai ou faux).

• fonction EXPRESSIVE: centrée sur le destinateur qui manifeste ses émotions, son affectivité. Axée sur le « je ». Elle englobe égalementl'acquisition d'expressions, d'un style, d'une façon bien personnelle de s'exprimer. Les onomatopées, les jurons, les formes exclamatives en général, les adjectifs à valeur expressive, etc. Les traits non linguistiques du genre mimique, les gestes, le débit, les silences, ont aussi une fonction expressive.

• fonction INCITATIVE: axée sur le destinataire, donc sur le « tu». On vise ici à modifier le comportement du destinataire, pour ordonner, pour interdire, pour inciter. Pensons seulement à la publicité qui incite à acheter, aux politiciens qui incitent à voter, etc.

• fonction POÉTIQUE (ou esthétique): fonction où l'accent est mis sur le message dont la forme importe autant que le fond. La rime, la métaphore, l'antithèse, l'ironie, les jeux de mots font partie des procédés qui ont une fonction esthétique et qui font que le message comporte plus d'information que le message lui-même. C'est l'aspect ludique de la langue qui est utilisée très souvent sans que l'on s'en rende compte (par exemple, dans des expressions comme « à demande insolente, réponse tranchante » (rime volontaire), ou en anglais « righty tighty, lefty loosey»). Également, en français, il est possible de dire "Tu as les yeux bleus comme un ciel d'azur!" à son amie de coeur, et ce mesasge contient bien plus d'information que le seul fait de comparer ses yeux au ciel.

• fonction RELATIONNELLE (phatique): permet de maintenir et de développer des contacts entre individus.

ex.: on parle à quelqu'un au téléphone pendant 30 minutes à tous les soirs sans vraiment rien se dire, juste pour garder le contact, juste pour être sûr que nous sommes toujours en phase. C'est le cas de toute communication vide de son contenu, comme dans certaines réunions mondaines. De même, les formules de salutations comme « Comment allez-vous?» ou « Joyeux Noël » peuvent être produites simplement pour terminer une conversation sans le sens originel (on ne souhaite pas toujours un joyeux Noël ou une bonne journée à la personne à qui l'on parle).

• fonction MÉTALINGUISTIQUE: explication du code utilisé, des conventions que l'on utilise pour communiquer. Tous les ouvrages traitant du code, comme les grammaires ou les dictionnaires constituent et contiennent plusieurs exemples de messages à visée métalinguistique.

ex.: «Moi, par gauchiste, je veux dire tous ceux qui veulent changer quelque chose dans notre société, que ce soit par la violence ou par la persuasion... »

2.4. Critique du schéma

Tous les modèles théoriques sont sujets à la critique. La principale faiblesse de ce schéma est que les fonctions proposées existent rarement à l'état pur. Les messages font souvent appel à plusieurs fonctions de façon simultanée. La fonction d'un message serait donc celle qui domine et non seulement celle qui est ou celles qui sont présentes.

Deuxièmement, les fonctions du langage sont totalement laissées de côté, comme celles référant aux rapports sociaux établis à l'aide du langage. Les choix sociaux et même politiques effectués à la fois de façon consciente et même inconsciente par les individus ne sont pas analysés par le fameux schéma de Jakobson.

2.5. Signe linguistique

La sémiologie a beaucoup apporté à la linguistique par son étude des systèmes de communication. Un des premiers sujets d’étude qui a retenu l'attention des chercheurs est la constitution du CODE servant à communiquer oralement. La définition de ce code et de son usage par les communautés linguistiques constitue une des préoccupations principales de la linguistique.

La transmission de sens d'un individu à un autre repose sur l'existence du signe linguistique. Ferdinand de Saussure a été le premier à définir de façon précise cette notion importante, à l'aide des notions suivantes:

a) une partie matérielle: le SIGNIFIANT (image acoustique, image mentale du signe, la représentation mentale sonore)

b) une partie immatérielle: le SIGNIFIÉ (partie conceptuelle du signe --notion).

Le signe linguistique est donc le résultat de l'association d'un signifiant (aspect physique du sens) et d'un signifié (le sens). Il est difficile de concevoir l'un sans l'autre.

Le signifié est en réalité différent de la définition mais on l'utilise ici comme remplacement par souci de simplicité. Le signifié est constitué d'éléments de sens qu'on appelle les "attributs sémantiques" (concept tiré de la sémantique). Les attributs sémantiques d'un signifié se combinent pour créer le sens du signe. Ces attributs sont habituellement représentés par les linguistes sous forme de caractéristiques binaires (qui sont actives ou inactives, notées par "+" ou "-"). Le signifié de "table" pourrait ainsi comporter les attributs sémantiques qui suivent: [+meuble][+une surface plane horizontale] [+surface servant à manger]. En précisant que la table comporte une seule surface plane, on l'oppose à la bibliothèque qui en possède plusieurs. En précisant que c'est un meuble, on l'oppose au plancher, à la patinoire ou au plafond. (Beaudoin 2002)

À ces deux distinctions signifiant-signifié, il faut en ajouter une troisième. D'un côté, nous avons la réalité sonore (ou écrite mais qui ne fait que traduire la réalité sonore) dont nous parlons ([wazo]), d'un autre côté nous avons la NOTION de l'objet auquel on réfère. Cette notion existe dans l'esprit des locuteurs, et c'est ce qui leur permet de se comprendre. Cependant, nous n'avons pas parlé de l'objet lui-même, celui dont on parle. Il s’agit du référent (l'objet physique, matériel dont les locuteurs parlent).

Le rapport entre le signifié et le signifiant est non arbitraire et nécessaire car il fonde le signe lui-même. Par contre, le rapport entre une réalité elle-même et un signe (la signification) est, elle, arbitraire et elle est le résultat d'une convention entre les individus d'une communauté linguistique particulière. Ce rapport constitue la base de toute communication linguistique, alors que les mots, ou comme nous pouvons les appeler maintenant les signes, prennent vie lorsque le lien entre signifiant et signifié est effectué, ce qui nous donne une signification entre une image acoustique et une notion, une réalité mentale (signifié).

2.6. Caractéristiques du signe linguistique

À partir des observations précédentes, nous pouvons affirmer que le signe linguistique se définit par son caractère:

Comme nous l'avons mentionné auparavant, il n'y a pas de relation "naturelle" entre le mot (ou le signifiant) et la réalité physique qui lui est associée (le signifié).

Par exemple, le choix du mot "bureau" ne repose sur aucun critère qui aurait pu favoriser le choix d'un tel mot plutôt qu'un autre.

Une exception cependant: les onomatopées. Dans ce cas, les mots utilisés sont relativement proches du son que l'on veut décrire, et ce, dans toutes les langues. ex.: le chant du coq, le bruit de la vache, le jappement du chien.

Si ce lien obligé entre la réalité et le signe linguistique existait, tous les humains parleraient probablement la même langue. Ce caractère arbitraire du signe fait que l'on doive apprendre un large vocabulaire lorsqu'on apprend une langue, quelle soit maternelle ou seconde.

É videmment, ce caractère arbitraire du signe linguistique ne s'applique pas aux autres sortes de signes. Par exemple, les signaux routiers doivent se ressembler à cause du fait que l'action est la même dans toutes les langues. Par exemple, un panneau comportant un pain indiquera aux locuteurs de toutes les langues et cultures (ou presque) qu'il y a une boulangerie à proximité.

Pour que les membres d'une communauté se comprennent, il faut qu'ils s'entendent sur les mêmes conventions ou sur les mêmes signes. En conséquence, les signes sont considérés, comme nous avons dit précédemment, comme étant conventionnels, en cela qu'ils résultent d'une convention entre les membres d'une communauté. En fait, partager la même langue, c'est également partager un certain nombre de conventions.

Le signifiant se présente de façon linaire dans l'axe du temps. il nous faut du temps pour prononcer un mot, pour le réaliser de façon physique. De même, il y a un ordre qui est suivi lors de sa prononciation. Dans la réalisation du signifiant [wazo], il ne m'est pas permis de prononcer les sons dans un ordre différent de celui que nous avons ci-haut si je veux que les autres locuteurs me comprennent. Les signes forment donc une successivité et non une simultanéité. Par opposition, les signes routiers peuvent se substituer: "obligation de tourner" et "tourner à gauche".

2.7. Distinction signe ~ indice

Il est nécessaire de distinguer un signe d'un indice (signes non intentionnels): selon Prieto, il s'agit d'un fait immédiatement perceptible qui nous fait connaître quelque chose à propos d'un autre fait qui, lui, n'est pas immédiatement perceptible. Un indice est un phénomène naturel ou culturel, perceptible, involontaire ou non intentionnel et qui nous fait connaître quelque chose à propos d'un autre fait qui, lui, n'est pas immédiatement perceptible.

ex.: symptômes d'une maladie, traces dans la neige, nuages noirs à l'horizon, etc.

Cependant, si je m'entendais avec quelqu'un pour lui dire que s'il voit des traces de pas dans le sable, en route pour mon chalet, il comprendra que je suis arrivé. L'intention de signification est essentielle dans l'identification d'un signal. Il en va de même de la présence d'une canne blanche pour indiquer un aveugle, trois coups cognés à la porte, les numéros de salle dans un édifice public, etc.

L'indice se différencie donc du signe par le fait que sa première fonction n'est pas celle de signifier quelque chose. Il peut très bien avoir une signification, mais ce n'est pas sa fonction première. Les signaux de fumée, s'ils ne sont pas effectués en vue de communiquer avec quelqu'un d'autre, ne constituent pas un signe mais bien un simple indice qui nous indique qu'il y a un feu à quelque part.

Aussi, nous pouvons effectuer une autre distinction entre un signe et un signal: un indice produit spécifiquement en vue de transmettre un message (contient les signes linguistiques, les symboles, et les signes non linguistiques)

Si j'élève la voix, si je me mets à crier, vous pourrez bien relier cet indice à ma condition psychologique et prendre cet indice comme indication que je suis un peu fâché, que je ne suis pas de bonne humeur.

L'indice est donc non conventionnel, involontaire, diversement interprétable mais signifiant (revenir là-dessus plus tard, après l'explication du signe linguistique).

Autre exemple: le voisin qui s'achète une Rolls Royce ou une Ferrari. Au départ, le fait de posséder cette voiture est un indice de sa richesse. Par contre, si le voisin en question a l'intention de lancer un message bien précis à ses propres voisins, celui qu'il est vraiment riche, qu'il a réussit, qu'il est dans une classe à part, alors cette même voiture deviendra un signe. Nous sommes en présence d'un message qui a été transmis avec une intention bien claire de le communiquer.

2.8. Distinction signe ~ symbole ~ icone

Comme nous l'explique Charles Peirce, lorsque deux signes sont liés par leur signifiés, on parle alors de symbolisation (ou connotation), et donc de la construction d'un symbole. Le symbole résulte d'une relation conventionelle et arbitraire commune à plusieurs cultures. Le signe linguistique est, en fait, un type particulier de symbole.

• signaux routiers : cercle rouge avec une ligne transversale symbolise aussi une interdiction.

• les tours du WTC de New York symbolisaient la suprématie financière de cette ville

• la couleur bleu poudre, dans les forces armées, symbolise une force neutre (casques bleus)

• le champagne (marque Dom Pérignon) symbolise la richesse et le luxe extrême

Il est également possible de transmettre du sens en utilisant une icone qui est créée par un lien analogique avec la réalité. Il y a une grande quantité d'icones largement utilisées par nos sociétés modernes et qui sont reconnaissables par un grand nombre d'individus dans les sociétés modernes. Considérez, par exemple, les images suivantes:

Il est relativement facile d'identifier, d'après les icones présentés ci-dessus, les significations de clavier, de bar, de souris, d'imprimante, de restaurant et de loupe pour modifier la taille d'un objet. Ces significations sont évidentes à cause du lien analogique direct entre l'élément utilisé pour représenter la réalité et son rapport extrêmement étroit avec l'objet qu'il représente.

Les langues naturelles comme le français et l'anglais par exemple sont des systèmes de communication basés sur l'utilisation de signes plutôt que de symboles et d'indices.

2.9. Double articulation du langage

Cette relation entre le signifié et le signifiant nous amène à faire une autre distinction qui nous paraît importante du point de vue linguistique. Il s'agit de la double articulation du langage (deux types d'unités découpées sur deux niveaux distincts). Selon André MARTINET, la langue s'organise sur deux niveaux qui opèrent de façon différente. Pour lui, les unités qui s'enchaînent dans le discours ne s'enchaînent pas de la même façon et au même niveau.

a) des unités de première articulation: les morphèmes (unités minimales de signification). Ce sont des noms (arbre, crayon, maison, etc.), verbes (manger, écrire, rêver, etc.), adjectifs (bleu, grand, rapide, etc.), etc. On note aussi que les "parties de mots" (comme le "-ons" dans le verbe "mangerons", ou le "eur" dans "réparateur") qui ont une valeur grammaticale sont aussi appelées des morphèmes et qu'elles sont aussi porteuses de sens. En effet, à chaque fois qu'un verbe se termine par un "-ons", les locuteurs du français reconnaissent que le sujet est une première personne du pluriel ("nous"), peu importe le verbe.

Ce qu’il faut comprendre à ce moment et ce en quoi cette notion se rattache avec la sémiologie est que ces morphèmes sont constitués d'un signifiant ET d'un signifié.

L'analyse de la langue en morphèmes, champ d'étude fascinant, sera abordée de façon plus détaillée lorsque vous ferez de la morphologie dans le deuxième cours d'introduction offert au département (Fren 370).

b) des unités de seconde articulation: les phonèmes (unités minimales distinctives). Ce sont des sons distinctifs (ils changent le sens d'un mot (pont-bon, quand-banc) sans qu'ils n'aient de sens inhérent) propres à une langue.

Autre illustration de la double articulation du langage: Combien de mots d’une seule syllabe pouvez-vous former qui se terminent par le son « -on »? Un étudiant bien inspiré pourrait arriver à cette simple liste qui contient un bon nombre de mots différent seulement par leur première consonne et qui se terminent tous par le son "-on":

pont, bon, ton / taon , don / dont , con / qu’on , gong, font / fond , vont , son / sont , jonc , mon , non , long , rond…

La langue peut donc "optimiser" son système en formant un grand nombre de mots différents avec une seule modification (remplacer un seul son) plutôt que de créer un nouveau mot complètement différent à chaque fois. Ceci est possible seulement par l’existence d’unités sans sens (les sons, ou phonèmes) que l’on peut substituer les unes aux autres pour changer le sens d’un mot. Cette particularité de créer un système productif contenant deux niveaux d'organisation pour communiquer constitue une différence majeure entre les systèmes de communication utilisés entre animaux et ceux utilisés par les humains.

En résumé, lorsque nous parlons de double articulation du langage, nous parlons de deux niveaux d'organisation du langage:

a) première articulation, les morphèmes (qui ont un signifié et un signifiant)

2.10. Commentaire supplémentaire sur la sémiologie

Nous pouvons appliquer les notions de sémiologie précédentes de façon à définir les relations entre mots entre autres choses.

Même signifié, signifiant différent. (ennuyer / embêter; voiture / bagnole; manger / bouffer; etc.)

Signifiés opposés, signifiants différents (grand /petit; vendre / acheter; blanc / noir; etc.)

Homophones : Signifiés différents, signifiants semblables. (vert / verre / vers / vers / verre / etc.)

Indice : « Fait immédiatement perceptible qui nous fait connaître quelque chose à propos d’un autre fait qui ne l’est pas. » (Prieto, Sémiologie)

Signal : « Fait qui a été produit artificiellement pour servir d’indice. » (Prieto, Sémiologie)

Symbole : « Un symbole est la notation d'un rapport --constant dans une culture donnée-- entre deux éléments. » (Dict. de linguistique Larousse) Comme le signe linguistique, le symbole résulte d'une convention arbitraire.

Icone : « Signe dont le signifiant et le signifié sont dans une relation « naturelle » (ressemblance, évocation). » (PRobert)

2.11. Spécificité de la communication humaine

Les langues naturelles comme le français, l'espagnol, l'allemand, le mandarin et l'anglais, sont des systèmes de communication un peu au même titre que les systèmes comme le code de la route par exemple. Cependant, ils se différencient de ces autres systèmes par une caractéristique principale. Examinez le tableau ci-dessous qui résume les similarités et différences entre les deux systèmes:

Spécificités	Systèmes de communication	Langues naturelles
a. La transmission du sens	-nombreux systèmes de communication transmettent le sens voulu (ex.: code de la route, langue des sourds-muets, numéros de salle, etc.)	la langue sert à transmettre du sens -tout sens transmis n'est pas voulu: les accents nous trahissent
b. L'arbitraire	-de nombreux systèmes utilisent des signes arbitraires (code de la route, numéros de salle, code morse)	-la langue utilise aussi des signes arbitraires ("chat", "crayon", etc.) -la langue utilise aussi des signes moins arbitraires mais interprétables: par exemple: "Je suis intelligent."
c. Linéarité du message	-simultanéité permise (linéarité utilisée mais non requise): les codes visuels spécialement permettent de superposer des images	-linéarité obligée: il faut absolument mettre les sons les uns à la suite des autres, sinon le message sera incompréhensible
d. Le caractère discret du signe	d. Le caractère discret du signe -les systèmes utilisent habituellement des unités discrètes, en nombre fini	-les systèmes utilisent habituellement des unités discrètes, en nombre fini -la langue utilise des unités discrètes: les sons d'une langue sont en nombre limité -la langue utilise également des unités qui présentent un nombre théoriquement infini de variations
e. L'organisation interne du système	-les systèmes ne sont encodés qu'à un seul niveau (simple articulation)	-les langues sont encodées à deux niveaux (double articulation): les unités significatives et les unités distinctives a) sons: [p] + [a] + [R] + [l] = "parl" b) monèmes: "parl + ez" = "parlez"

2.12. Principales différences entre la communication animale et la communication humaine

Différences	Communication humaine	Communication animale
1. Déplacement	peut évoquer le passé, le futur, l'absent, l'hypothétique et l'impossible	énonce ce qui est lié au présent temporel et spatial (sauf abeilles)
2. Apprentissage	nécessaire	non nécessaire
3. Base	unités arbitraires (sans lien entre le mot et l'objet à décrire)	unités iconiques (avec lien entre le signifié et le signifiant)
4. Unités	discrètes (divisibles et combinables)	graduées (messages indivisibles et non combinables)
5. Mutualité	fréquente (les gens se répondent)	relativement rare
6. Mensonges, divagations	fréquents	cas sporadiques de mensonges et pas de divagation
7.Métacommunication	métacommunication (les gens expliquent ce qu'ils veulent dire ou corrigent les autres)	pas de métacommunication
8. Polysémie	prévalente (les mots peuvent avoir plusieurs sens)	monosémie

Parmi les caractéristiques présentées dans le tableau ci-dessus, il importe de porter une attention particulière au déplacement qui permet aux humains de parler du passé, du futur, d'imaginer, de supposer, etc. Cette caractéristique des langues naturelles, sur laquelle repose la littérature en général, est extrêmement importante car elle constitue l'une des manifestations les plus intéressantes de la langue.

La nature des unités utilisées se démarquent de celles utilisées par les animaux pour communiquer en ce sens qu'elles sont combinables et servent à former des messages qui peuvent être soit très simples soit très complexes (très longues phrases). Cette caractéristique nommée la double articulation est certainement la plus remarquable des systèmes de communication oraux propres aux humains.

Il est important d'ajouter que la plupart des signes linguistiques sont polysémiques. Prenons par exemple le mot « siège ». Le Petit Robert indique que le mot a trois sens principaux: a) « lieu où se trouve la résidence principale « d’une société, d’une organisation). », b) « lieu où s’établit une armée, pour investir une place forte », et c) « objet fabriqué, meuble disposé pour qu’on puisse s’y asseoir ». Il est donc très fréquent pour un mot d'avoir plus d'un sens (caractère polysémique).z

Finalement, les langues naturelles sont les seuls systèmes permettant la métacommunicaiton qui sert à la définition du code à l'aide du code lui-même. Par exemple, il est possible (et fréquent) pour quelqu'un de définir l'usage d'un terme particulier dans un texte technique par exemple. Cette situation se retrouve très souvent dans les volumes d'introduction à un nouveau champ d'étude nécessitant la définition de notions de base.

3. Morphologie

La morphologie est l'étude de la composition des mots. La composition des mots se fait à partir de plus petites entités appelées morphèmes. Le morphème est la plus petite unité lexicale ayant un sens spécifique, c'est-à-dire que chaque morphème est indivisible tout en ayant un sens particulier. Le mot "tables" comporte par exemple deux morphèmes: table (la base ou racine) et le pluriel (morphème grammatical). Ces morphèmes se lient habituellement de façon régulière, de sorte à ce qu'on pourrait théoriquement faire une liste des morphèmes et de certaines des règles pour aboutir à une liste des mots d'une langue donnée.

Le module morphologique de notre modèle langagier est ainsi le lieu où s'imprègne et se maintient l'information concernant les mots et les parties de mots potentiels et existants d'une langue donnée. On peut le comparer à un grand dictionnaire où seraient répertoriés toutes les parties de mots du français couramment utilisés.

Les articles d'un dictionnaire ont une organisation spécifique (chose souvent ignorée). Lorsqu'on ouvre le Petit Robert 1 sous l'entrée "conservateur", on voit d'abord l'entrée elle-même avec son féminin. Le champ suivant donne la prononciation en alphabet phonétique international (API) entre crochets. Viennent ensuite la nature syntaxique (le type de mot) et l'étymologie (l'origine). Le champ suivant détermine les différents sens que peuvent prendre le mot. Ce champ peut contenir plusieurs éléments numérotés. Si une caractéristique est commune à tous les sens donnés de l'entrée, elle sera donnée en premier, sans numérotation (ici "Qui conserve"). Les autres sens plus spécifiques suivent, avec la nature syntaxique si elle est différente ou plus spécifique que celle donnée au début. Notez qu'au sens numéro 2, le domaine d'usage est spécifié puisque cet usage est restreint à la politique. Suivant cette définition, on retrouve un losange vide qui indique les nuances de sens ou d'emploi. On retrouve finalement un losange dans lequel se retrouve un autre losange qui est plein; cette rubrique annonce les antonymes et les synonymes. Les quasi-synonymes et les mots proches sont souvent inclus dans la définition et sont habituellement précédés de "V." pour "voir". Ce renvoi est l'indication que le mot défini est sémantiquement proche du mot de renvoi. Une foule d'autres informations sont parfois données: spécificité régionale, statut d'emprunt ou d'anglicisme, les restrictions d'usage, citations et exemples, etc.

De même que le dictionnaire, le modèle lexical a probablement une structure qui lui est propre. Cependant, l'accès à cette organisation est limité. Certains chercheurs et chercheuses en linguistique élaborent des modèles spécifiques de ce que pourrait être cette organisation. Les méthodologies qui permettent de sonder le lexique mental sont variées et ce sujet dépasse les limites de ce cours.

Le module morphologique est constitué de morphèmes, qui sont des signes langagiers. Or, comme nous l'avons vu précédemment, un signe est constitué d'un signifiant et d'un signifié. Le mot "livre" a comme signifiant la représentation phonologique /livR/ pour un locuteur français. Son signifié contient certains attributs sémantiques tels que non animé, non humain, comptabilisable, non abstrait, manipulable etc. (on notera habituellement [-animé], [-humain], [+comptabilisable], [-abstrait], [+manipulable]...). La liste des attributs (ou traits sémantiques, ou sèmes, ou figures de contenu) d'un signe est parfois très longue. On appelle cette liste d'attributs le champ sémantique du signe.

On notera cependant que cette information, aussi étendue soit-elle, n'est pas suffisante pour permettre la construction de phrases. Il s'avère nécessaire d'intégrer de l'information sur les possibilités de combinaisons des unités. On sait par exemple que le préfixe "trans-" ne peut se combiner à "livre". Le mot "translivre" n'existe pas en français, et ne constitue pas un concept qui semble nécessaire; "trans-" veut dire "au-delà de", "à travers". Ce préfixe marque le passage, le changement. Le signifié de "trans-" devra comporter un attribut spécifiant sa nature syntaxique et spécifiant qu'il se combine avec soit un verbe (et pas n'importe lequel), soit un nom (sans doute un nom [-manipulable]). Chaque signe comportera donc la nature syntaxique à laquelle il appartient ainsi que les possibilités de combinaisons avec d'autres natures syntaxiques et les restrictions sémantiques limitant la formation de mots inacceptables.

C'est ainsi en comparant des caractéristiques sémantiques, catégorielles et les possibilités de combinaisons qu'on arrive à dire que des mots sont synonymes ou antonymes. L'ensemble des traits sémantiques d'un signe s'appelle le champ sémantique d'un signe ou d'un mot. Deux signes peuvent partager tous leurs traits sémantiques, la catégorie sémantique et leurs possibilités combinatoires; on parle alors de synonymes (ou de quasi-synonymes si leur usage diverge selon le contexte ou si leur traits sémantiques sont presque identiques, ce qui arrive dans 99% des cas). Si les champs sémantiques de deux mots sont presque identiques, qu'ils appartiennent à la même nature syntaxique et qu'ils ont les mêmes possibilités combinatoires mais que les différences sémantiques font référence à des concepts opposés, on parle alors d'antonymes. Par ailleurs, il est possible que des signes aient des signifiants identiques (qu'ils se prononcent pareillement) tout en ayant des sens différents; ces mots sont appelés homonymes et on dit alors qu'il y a polysémie (plusieurs sens). Malgré que ces mots soient prononcés (et souvent écrits) identiquement, nous ne pouvons dire qu'il s'agit d'un signe ayant plusieurs signifiés. Un signe ne peut avoir qu'un seul signifié. Il y a donc plusieurs signes distincts ayant des signifiants identiques mais des signifiés différents.

Il existe deux classes majeures de morphèmes: les morphèmes lexicaux (aussi appelés bases, racines ou lexèmes) et les morphèmes grammaticaux (ou morphèmes liés). Les morphèmes lexicaux sont les unités centrales des mots dans la plupart des langues parce qu'ils peuvent habituellement se retrouver seuls. Par exemple, "marche" est indivisible et a un sens propre, contrairement à "marcher" qui a le sens de faire une marche et qui est une combinaison de deux morphèmes (marche + -er). Les morphèmes grammaticaux dépendent au contraire des morphèmes lexicaux ("-er" tout seul ne peut être utilisé pour évoquer une action; il lui faut un radical). Il existe aussi trois types de morphèmes grammaticaux: les préfixes, les suffixes et les infixes. Le préfixe s'ajoute à l'avant du radical auquel il se lie (par exemple "in-" dans "inhabituel"). Le suffixe s'ajoute après le radical auquel il se lie (par exemple "-eur" dans "tricheur"). L'infixe, lui, est relativement rare; il se place soit de part de d'autre du radical soit en plein milieu du radical auquel il se lie (en bantoc, langue des Philippines, "fikas" veut dire "fort" alors que "fumikas" veut dire "être fort", "-um-" étant le morphème permettant de former un adjectif). On le retrouve surtout dans les langues agglutinantes, c'est-à-dire dans les langues dont les diverses parties de la phrase se collent ensemble pour constituer un seul long mot comportant divers morphèmes.

Parallèlement, il existe une division des morphèmes grammaticaux qui n'entre pas en conflit avec l'endroit où le morphème s'insère. Certains morphèmes sont dits dérivatifs alors que d'autres sont dits flexionnels. Les morphèmes dérivatifs, comme le nom l'indique, amènent une dérivation syntaxique du mot qu'ils forment, i.e., ils en changent la nature syntaxique ("-ment" change habituellement les adjectifs en adverbes). Les morphèmes flexionnels n'amènent pas cette dérivation (le morphème de genre féminin change la prononciation de façon diverse mais il ne change pas la nature syntaxique; les conjugaisons des différents temps, modes et personnes sont des flexions). Les morphèmes flexionnels sont moins nombreux mais ils ont un champ d'application plus étendu que les morphèmes dérivatifs et comportent moins d'exceptions.

Prenons par exemple le mot "anticonstitutionnellement", qui, en passant, est le mot le plus long en français courant. Il est constitué de plusieurs morphèmes: anti-constitu-tion-nelle-ment. Le radical est "constituer", que l'on retrouve isolément; ce verbe a la valeur d'établir légalement. Viennent ensuite le suffixe dérivatif "-tion" qui est un morphème de nominalisation (il change le mot en nom) et "-nelle", qui est un morphème d'adjectivation, (il change un mot en adjectif). Le morphème "constitution" est précédé du préfixe flexionnel "anti-" qui ajoute au sens du radical la notion de "qui est contraire à ou de". On note que anti- ne peut se lier à constitution directement parce qu'il ne se lie qu'aux adjectifs. Finalement, le suffixe dérivatif "-ment" vient s'ajouter à notre mot, étant le suffixe d'adverbialisation. Ainsi, si on peut avoir constitution, constitutionnel, anticonstitutionnel, constitutionnellement et anticonstitutionnellement de façon isolée, on ne peut avoir anticonstitution, constitutionment et encore moins anticonstitutionnement.

Comme on peut le voir, les morphèmes ne se lient pas aléatoirement. Ils fonctionnent selon des règles préétablies que nous appelons règles morphologiques. Ces règles sont spécifiques à chaque langue. En combinant les morphèmes, nous produisons cependant des mots difficiles à prononcer. Par exemple, pour construire l'antonyme de certains adjectifs, il faut ajouter la voyelle /i/ et allonger la consonne initiale de l'adjectif, comme dans "illégal" ou "irrégulier". Cette interaction entre les morphèmes et les sons donne naissance à un domaine relativement nouveau appelé la morphophonologie. Nous reviendrons sur ce sujet après avoir étudié la phonologie puisqu'il est nécessaire de comprendre la phonologie pour développer des règles morphophonologiques.

Les règles morphologiques et morphophonologiques s'appliquent à la plupart des mots. Ces règles évitent ainsi que l'on doive mémoriser des dizaines de milliers de mots isolés alors qu'on peut en apprendre quelques milliers et une centaines de morphèmes liés pour les combiner en des dizaines de milliers de mots. Il existe cependant des exceptions. Nous appelons ces exceptions des lexicalisations. La lexicalisation est l'acceptation d'un mot dans le vocabulaire d'une langue donnée comme entité propre. C'est le cas pour la féminisation de certains adjectifs en français. Alors que la règle générale est de prononcer la consonne finale de l'adjectif pour obtenir le féminin, on retrouve des mots comme "beau/belle", "vieux/vieille", etc. Les formes féminines et masculines sont donc simplement mémorisées puisqu'il ne semble pas y avoir de règle pouvant expliquer les différences ou les similarités.

4. Phonétique

La phonétique est la science des sons langagiers tels qu'ils existent dans la réalité et que nous appelons des allophones. Cette science peut être abordée sous trois aspects différents: la production du son (phonétique articulatoire), la transmission des sons par les airs (phonétique acoustique) et la réception de ces sons par l'oreille de l'interlocuteur (phonétique auditive). La phonétique auditive est rarement étudiée sauf pour l'élaboration de traitements orthophoniques et dans certains cours spécialisés. La phonétique acoustique permet une description précise des sons, mais la variation qui survient est telle qu'il est plus aisé de décrire les sons articulatoirement puis d'en vérifier la structure acoustique. La phonétique acoustique est étudiée dans des cours plus avancés et nous n'en verrons ici que des rudiments. Nous ne discuterons ici que de phonétique articulatoire, c'est-à-dire l'étude des sons décrits par l'endroit où ils sont habituellement produits dans l'appareil phonatoire (l'ensemble des parties du corps qui servent à produire des sons langagiers: larynx, pharynx, bouche, nez, lèvres). En effet, il existe plusieurs façons de prononcer tous les sons de toutes les langues connues. Cependant, il y a une certaine régularité dans la façon de les prononcer par la population générale. Nous utilisons ici l'alphabet phonétique international (API) pour représenter ces sons. Bien qu'il existe d'autres systèmes (le système américain entre autre), nous favorisons l'API parce qu'il est en voie de devenir le standard international et parce que c'est le système utilisé dans la plupart des dictionnaires (certains dictionnaires de langue anglaise utilisent le système américain). Le livre Phonetic Symbol Guide de G.K. Pullum & W.A. Ladusaw (1986; Chicago: The University of Chicago Press) donne une vue d'ensemble des systèmes les plus fréquemment utilisés depuis le milieu du 20e siècle.

Les sons sont, d'un point de vue acoustique, des ondes, des vibrations. La vibration est obtenue lorsque l'air contenu dans les poumons est contraint à passer dans le larynx (qui comprend les cordes vocales). Les cordes vocales sont deux pièces de muscles qui se tendent et s'étirent au besoin. Lorsque la pression d'air s'accumule sous les cordes vocales, elles sont forcées de s'ouvrir partiellement; leur tension naturelle les amène ensuite à se refermer. La vitesse à laquelle les cordes vocales s'ouvrent et se referment produit une vibration d'une hauteur variable (appelée la fréquence fondamentale), selon la taille de l'appareil phonatoire de la personne. Les hommes ont une fréquence fondamentale moyenne d'environ 150hz (un hertz équivaut à une vibration par seconde, donc 150 vibrations par secondes). Les femmes ont une fréquence fondamentale moyenne d'environ 250hz et les enfants d'environ 350hz.

Si le son produit par les cordes vocales était entendu directement, le son serait alors un son périodique qui ressemblerait à "eh" qui est grave et mal défini mais régulier. Pour produire les autres sons de la langue (appelés allophones), le son doit être transformé par les différentes parties de l'appareil phonatoire. Avant de nous avancer d'avantage dans la description des sons, spécifions tout de suite que les allophones sont divisés en deux classes majeures: les voyelles et les consonnes. Il existe deux différences essentielles qui distinguent les voyelles des consonnes. D'abord, les voyelles sont toujours prononcées avec la bouche relativement plus ouverte que pour les consonnes. Ensuite, la place que chacun prend dans la syllabe est différente: les voyelles constituent le centre, le noyau de la syllabe (sans voyelle, pas de syllabe) alors que les consonnes sont périphériques à la voyelle. Les voyelles et les consonnes sont décrites par des étiquettes différentes. Nous commencerons d'abord par décrire les consonnes puis les voyelles. Mentionnons aussi que nous étudierons ici les classes de sons plutôt que l'ensemble des variations possibles, ce qui est trop vaste pour un cours d'introduction. Il faut cependant se rappeler que la prononciation réelle des allophones est grandement variable. Vous remarquerez aussi que les allophones sont présentés entre crochets [ ], comme par exemple pour décrire le son [u] du mot "où". Nous verrons plus loin qu'un autre symbole est utilisé en phonologie, les barres obliques / /.

Le mode articulatoire définit le degré de contact entre les articulateurs qui existe durant la prononciation d'une consonne. Les occlusives sont des allophones qui impliquent une fermeture complète de la bouche. Les consonnes nasales sont des occlusives mais elles ont la particularité d'impliquer une ouverture de la cavité nasale. Ceci se produit parce que la luette est décollée de la paroi pharyngale, laissant ainsi l'air s'écouler librement par le nez. Toutes les consonnes nasales sont sonores en français comme en anglais. Les fricatives sont des consonnes dont la prononciation entraîne très peu d'espace entre le haut et le bas de la bouche, provoquant une vibration continue et donc un bruit de friction. Les latérales sont prononcées en établissant un contact avec le centre de la langue contre le haut de la bouche et en laissant passer l'air de chaque côté de la langue. Les glides sont des consonnes pour lesquelles l'air sort presque librement (on les appelle aussi des semi-consonnes ou des semi-voyelles). Elles ressemblent aux voyelles mais elles ont des fonctions syllabiques totalement différentes. De plus, l'air est légèrement plus entravé pour les glides que pour les voyelles.

Le lieu d'articulation définit l'endroit où se produit une consonne. Vous réalisez sans doute que la consonne [p] se prononce avec les lèvres. Il est parfois difficile de sentir l'endroit où se prononce la plupart des sons, mais l'habileté se développe avec la pratique. Le tableau de la page précédente présente les lieux d'articulation les plus importants pour le français et l'anglais. Les consonnes bilabiales sont prononcées avec les deux lèvres en contact. Le consonnes labio-dentales sont prononcées par un contact de la lèvre du bas avec les dents du haut. Les dentales impliquent un contact entre la langue et les dents du haut. Les alvéolaires sont prononcées par un contact entre la langue et les alvéoles (le renflement directement derrière les dents du haut). Les palatales impliquent la langue et le palais dur. Les vélaires sont prononcées par un contact entre la langue et le voile du palais (le palais mou). Les uvulaires sont prononcées par un contact entre la langue et l'uvule (la luette). Les glottales impliquent un resserrement des cordes vocales avec ou sans vibration.

La sonorité des consonnes porte sur la présence ou l'absence de vibrations des cordes vocales durant la prononciation des consonnes. Il y a des consonnes sonores et des consonnes sourdes. Les sonores impliquent la vibration des cordes vocales alors que les cordes vocales ne vibrent pas pour les sourdes . Si vous touchez votre pomme d'Adam en prononçant successivement les mots "vous" et "fou", vous constaterez qu'il y a de la vibration durant le [v] alors qu'il n'y en a pas durant la prononciation du [f]; le [v] est sonore alors que le [f] est sourd. Nous appelons ce phénomène "la sonorité d'une consonne".

Notons aussi que certaines des glides sont labialisées, c'est-à-dire que les lèvres sont projetées vers l'avant durant leur prononciation. Seul [j] n'est pas labialisée parmi les glides. Ce sont les seules consonnes ayant cette propriété (la labialisation) qui est habituellement réservée à certaines voyelles (et qu'on nomme alors "l'arrondissement").

Les consonnes de l'anglais sont comparables à celles du français. Nous nous limiterons ici à décrire les différences générales entre les allophones anglais et français.

D'abord, l'anglais n'a pas l'uvulaire [R], mais il a une glottale [h], qui se prononce par un resserrement des cordes vocales sans toutefois entraver complètement le canal d'air. Ensuite, le "r" anglais est totalement différent du [R] français. C'est une glide rétroflexe alvéolaire en anglais. La rétroflexion est le fait de courber la pointe de la langue vers le haut et l'arrière, donnant ainsi à la langue la forme d'une cuillère. Le [l] est aussi rétroflexe à la fin des syllabes en anglais. Les fricatives alvéolaires anglaises sont divisées en deux classes: les interdentales, où la pointe de la langue est légèrement placée entre les dents, et les alvéopalatales, qui se prononcent avec la pointe de la langue à l'arrière des alvéoles. Les occlusives sourdes ([p, t, k])sont aspirées en début de syllabe en anglais, c'est-à-dire qu'il y a une projection forcée de l'air lors de l'ouverture du canal d'air. La nasale palatale n'existe pas en anglais mais il y a une nasale vélaire qui lui ressemble beaucoup.

La classification des voyelles est différente de celle des consonnes. Comme je l'ai énoncé plus tôt dans cette section, la majeure différence phonétique entre les voyelles et les consonnes est que les voyelles sont produites avec la bouche relativement plus ouverte que les consonnes. Les glides sont souvent appelées semi-consonnes parce qu'elles sont à mi-chemin entre les voyelles et les consonnes; elles prennent cependant la place des consonnes dans la syllabe. On catégorise les voyelles selon quatre descripteurs: la nasalité, l'antériorité, l'aperture, et l'arrondissement.

La nasalité pour les voyelles est semblable à la nasalité pour les consonnes. L'ouverture de la luette permet le passage d'une partie de l'air dans le nez et ajoute ainsi une résonance nasale. Contrairement aux consonnes nasales, l'air passe aussi librement par la bouche pour les voyelles nasales. Peu de langues dans le monde utilisent la nasalité pour les voyelles, mais le français en est une. Quatre voyelles peuvent être nasales en français: une nasale antérieure non-arrondie, une nasale ouverte, une nasale postérieure et la nasale antérieure arrondie (cette dernière a disparu de certains dialectes européens). Étant donné qu'il n'y a que quatre voyelles nasales, il y a une certaine variation dans leur prononciation.

L'antériorité est le fait de prononcer une voyelle à l'avant du point central de la bouche. On fixe ce point central aux environs d'où se prononce le "e" de l'interjection d'hésitation "eh!". Ici encore, cet axe doit être perçu comme un continuum ayant à un bout les antérieures et à l'autre bout les postérieures. Au milieu se situe la catégorie "centrale'. Le français standard ne comporte pas de voyelle centrale, quoiqu'elle existe dans plusieurs dialectes nord-américains. L'anglais comporte le schwa de "the" et le v-inversé de "but".

L'aperture est l'ouverture relative de la bouche pour chacune des voyelles. Les voyelles fermées nécessitent une fermeture de la bouche presque aussi prononcée que pour une consonne fricative. Les voyelles ouvertes sont produites par l'abaissement de la langue tout au bas de la bouche. Les voyelles mi-ouvertes et mi-fermées sont entre les ouvertes et les fermées. Il faut ici prendre l'aperture comme un continuum, c'est-à-dire que le point milieu a été artificiellement fixé pour simplifier la catégorisation, mais qu'en réalité, il y a de la variation de ce point.

L'arrondissement est une catégorie similaire à la labialité des consonnes. Il s'agit de projeter les lèvres vers l'avant pour ouvrir la cavité labiale, ce qui ajoute une résonance plus grave. L'arrondissement a une grande importance en français, comme nous en discuterons en classe.

Il existe un type de voyelles qui ne se retrouve pas dans le tableau des voyelles: les diphtongues. Il s'agit de voyelles dont le degré d'aperture (et souvent aussi le lieu d'articulation) varie durant la prononciation de la voyelle. L'anglais américain possède trois diphtongues amenant une différence de sens. Le français standard n'en possède aucune, mais le français du Canada en a plusieurs qui varient selon la région et la classe socio-économique des locuteurs. Le mot "bière" prononcé [bjajR] est un bon exemple de diphtongue.

Les voyelles françaises sont plus difficiles à acquérir que les consonnes pour l'apprenant-e de langue seconde. Le principal problème est que les voyelles françaises sont relativement plus tendues que les voyelles de la plupart des autres langues. Par tendues, nous signifions que la tension dans les muscles des joues, de la langue et des lèvres est plus grande. Ainsi, les voyelles fermées sont prononcées [I], [Y] et [U] si elles sont relâchées par l'apprenant-e et respectivement, les voyelles mi-fermées sont prononcées mi-ouvertes et les mi-ouvertes sont prononcées presque ouvertes, amenant de la confusion entre les voyelles. Par ailleurs, les voyelles antérieures arrondies n'existent pas en anglais. En anglais, certaines voyelles sont plus longues que d'autres (les voyelles tendues). La différence de durée entre, par exemple [i] et [I] est parfois plus importante pour les locuteurs que la différence d'articulation. En français, c'est l'environnement phonétique qui détermine en majeure partie la durée des voyelles.

Il existe un ensemble de symboles qu'on peut ajouter aux caractères API pour modifier légèrement la prononciation du son original. On appelle ces symboles des diacritiques.

5. Phonologie

Le but de la phonologie est d'établir quelles sont les classes de sons qui sont importantes dans la communication pour une langue donnée et d'expliquer la variation entourant ces classes. Le modèle qu'on construit alors des sons de la langue doit être aussi économique que possible (c'est-à-dire qu'il doit comporter aussi peu de phonèmes et de règles que possible) tout en maintenant les oppositions de sens réelles de la langue. Il est évident par ailleurs que les particularités physiologiques de l'humain déterminent en partie ce modèle, ne serait-ce que de déterminer que toutes les langues doivent contenir des voyelles et des consonnes.

Un des aspects notables en linguistique est qu'il y a une très grande variation des structures. Ceci est surtout remarquable en phonétique. En effet, on remarque par exemple que, si on demandait à quelqu'un de prononcer un mot dix fois, chaque occurrence serait prononcée légèrement différemment. Il existe simplement une variation autour des unités phonétiques. On peut s'imaginer cette variation comme étant la variation qui se crée lorsque l'on joue aux dards; il est évident que l'on va rarement tirer deux dards exactement au même endroit dans une même partie. Par ailleurs, vous pouvez très bien vous adapter à un changement d'emplacement du jeu, tout comme vous comprendrez les différents dialectes de votre langue. Ceci est possible parce que nous établissons des catégories générales dans lesquelles les sons s'intègrent aussi bien qu'ils le peuvent. Nous appelons ces catégories des phonèmes. Nous mettons les phonèmes entre barres obliques pour les distinguer des allophones puisque les phonèmes impliquent une élimination de la variation. Il y a toujours moins de phonèmes que d'allophones dans une langue.

On définit le phonème comme étant un son langagier amenant une opposition de sens. On pourrait comparer ce phénomène à un filtre, le crible phonologique. On peut prouver que deux sons constituent des phonèmes distincts s'il existe au moins une paire minimale pour cette opposition phonologique. Les mots "bon" et "pont" constituent une paire minimale parce qu'ils ne diffèrent que par un son (/p/ et /b/), parce que ces sons sont comparables (deux occlusives bilabiales, une sourde, l'autre sonore) et que les mots ont des sens distincts. Il faut s'assurer que ces trois conditions sont remplies pour parler d'une paire minimale (et donc pour qu'il y ait opposition phonologique). Notons que les mots qui constituent une paire minimale doivent être constitués du même nombre de sons. Mentionnons aussi qu'une paire minimale peut être centrée sur des voyelles ou des consonnes et que pour être considérés comparables, des sons doivent s'opposer par un seul descripteur (sonorité, antériorité, etc.). Rappelons-les:

On doit procéder par étapes pour établir les phonèmes d'une langue et pour décrire la variation autour de ces phonèmes. Habituellement, le matériel linguistique auquel les linguistes font face se trouve sous forme de listes de mots, ce qu'on appelle le corpus. Le corpus doit essentiellement comprendre les mots de la langue étudiée transcrits en API avec autant de précision que possible et la traduction de ces mots dans une langue connue des linguistes au travail. Sans le sens (qu'on appelle la glosse), il est impossible d'établir si une différence de sons amène une différence de sens. Vous trouverez ci-dessous un corpus limité pour une langue fictive (le galonais). On utilise parfois des langues fictives par souci pédagogique. Par ailleurs, il est important de savoir qu'on interprète un corpus comme si on ne connaissait rien de la langue et comme si le corpus était représentatif de toute la langue. Ainsi, si on vous donnait un corpus français comportant une vingtaine de mots, vous devriez les analyser en prenant pour acquis que les mots donnés respectent l'ensemble des structures du français, même si vous observez que c'est faux; on joue le jeu puisqu'il s'agit d'exercices pédagogiques visant à parfaire la méthodologie de travail.

1. Répertoriez les allophones qui correspondent aux aspects étudiés ainsi que l'environnement dans lequel ils se trouvent.

2. Comparez le sens des mots: les mots ayant le même sens mais se prononçant différemment impliquent ce que nous appelons une variation libre. C'est une variation peu prévisible amenée par des facteurs sociaux tels le niveau de langue, le dialecte, les particularités physiologiques du locuteur, etc.

3. Toujours en tenant compte du sens des mots, portez votre attention sur les mots dont le sens est différent mais qui se ressemblent phonétiquement. Pour établir que deux mots constituent une paire minimale, il faut que tous les sons des deux mots soient identiques sauf pour un seul son qui ne diffère que par un seul aspect.

4. On peut observer dans certains corpus que certains allophones se retrouvent dans un environnement phonétique mais sont absents de d'autres environnements phonétiques. Ce n'est pas le cas avec le galonais. Ce qui se produit est en réalité que les deux (ou quelques fois trois) allophones constituent des prononciations différentes d'un même phonème. Ces différences proviennent des différences d'environnement phonétique. Par exemple, le son /t/ en français canadien devient [ts] devant /i/ et /y/ comme dans "tissue". Nous appelons ces cas des distributions complémentaires. Ceci donne lieu à des règles de distribution puisque cette variation est régulière et prévisible.

La syllabe est une composante importante de la phonologie. Son étude consiste à déterminer comment les allophones sont prononcés en groupes divisibles à l'intérieur du mot. Le type de groupement varie de langue en langue, d'où l'importance pour l'apprenant-e de langue seconde d'en connaître la structure. De plus, la syllabe fait partie de la phonologie puisque personne n'a réussi à isoler l'aspect phonétique qui permettrait de diviser les suites de sons en syllabes, malgré que presque tous aient une idée de ce qu'est une syllabe. La syllabe est composée en théorie de trois parties: l'attaque, le noyau et la coda. L'attaque est la première partie de la syllabe; elle est composée de consonnes. Le noyau est la partie centrale et essentielle de la syllabe; il est composé de voyelles. La coda est la partie finale de la syllabe et elle est composée de consonnes. L'attaque et la coda ne sont pas essentielles à la syllabe (une syllabe peut n'avoir qu'un noyau, comme pour le mot "eau").

Prenons le mot "parler". La première syllabe du mot est /paR/ où on retrouve une consonne en attaque (/p/, "p"), une voyelle au noyau (/a/, "a") et une consonne dans la coda (/R/, "r"). Cette syllabe est dite fermée parce qu'elle a une coda. La seconde syllabe est /le/ qui est composée d'une attaque (/l/, "l") et d'un noyau (/e/, "er"). Cette syllabe est dite ouverte parce qu'elle n'a pas de coda. En résumé, une syllabe doit obligatoirement comporter un noyau, et elle peut aussi avoir une attaque et/ou une coda; en revanche, une attaque ou une coda peut comporter deux ou trois éléments (on parle dans ces cas d'attaques et de codas branchantes). Par exemple, le mot français "strict" contient une syllabe: /stRikt/. L'attaque est constituée de trois consonnes (attaque complexe: /stR/) et la coda comporte deux consonnes (coda complexe: /kt/). Pour revenir sur les glides, nous pouvons voir ici qu'elles ne peuvent pas faire partie du noyau.

Le français a une syllabe habituellement ouverte. Quatre-vingt pour cent des syllabes en français sont ouvertes. Du vingt pour cent qui reste, près de la moitié sont des syllabes qui se terminent par /R/. On peut donc affirmer sans trop avoir peur de se tromper que si l'on trouve une consonne entre deux voyelles comme dans le mot "ami", la consonne fera partie de la seconde syllabe. En effet, la syllabe tentera de trouver une attaque et éviter d'avoir une coda. On trouvera même des syllabes dont l'attaque se complexifie pour éviter la coda dans la syllabe précédente (e.g. "Australie" qui peut se diviser soit comme "Au-stra-lie" soit comme "Aus-tra-lie" ou "pesticide" qui peut faire "pe-sti-cide" ou "pes-ti-cide'). Cela n'est possible que si la consonne qui constitue la première consonne d'un groupe de trois en attaque est un /s/.

Par ailleurs, toutes les séquences de phonèmes ne sont pas acceptables dans toutes les langues. En français, par exemple, un mot comme "tzopé" ne serait pas acceptable parce qu'on ne peut trouver en français une séquence de consonnes en attaque ou en coda dans laquelle l'une serait sonore et l'autre sourde (sauf avec [l] ou [R]). On appelle ces limites des contraintes phonotactiques: il s'agit de limites portant sur la combinaison et la constitution d'allophones dans une langue donnée. Évidemment, les contraintes varient d'une langue à l'autre. Une contrainte phonotactique ne s'appliquera habituellement pas si un mot est emprunté d'une langue ne comportant pas cette même contrainte phonotactique (c'est la seule occasion). Cependant, même dans ces cas, il y a adaptation des sons du mot emprunté pour respecter les contraintes phonotactiques de la langue. Pensons au mot anglais "tire" qui se prononce en français canadien /ta jr/ où il n'y a pas de voyelle, ce qui n'est pas permis en français.

La phonologie est utile pour comparer les systèmes phonologiques de langues différentes, ce qui peut aider dans l'enseignement de langues secondes. Il est aussi essentiel de pouvoir catégoriser les sons d'une langue pour le bon fonctionnement des systèmes de compréhension automatique de la parole. D'un aspect plus global, il est difficile autrement que par la catégorisation de comprendre comment s'apprend la langue maternelle. Imaginez ce qui se passerait si tous les allophones que l'on entend étaient mémorisés pour créer de nouveaux mots. Nous aurions en tête des centaines de fois le même mot prononcé de façon différentes.

6. Syntaxe

La syntaxe est l'étude de la combinaison des mots en phrases. En linguistique, nous n'étudions pas la grammaticalité selon ce que les grammairiens prescrivent mais plutôt selon l'intuition des locuteurs de la langue en cause. Cette nuance est importante parce qu'il n'y a pas toujours correspondance. Par ailleurs, il faut distinguer la grammaticalité d'une phrase et son intelligibilité. La phrase A ci-dessous est intelligible et grammaticale, alors que la phrase B est intelligible mais agrammaticale, et que la phrase C est inintelligible mais grammaticale. Évidemment, lorsque les gens parlent, ils construisent habituellement des phrases grammaticales et intelligibles.

L'étude de la syntaxe comporte trois parties: a) les catégories syntaxiques, b) les règles syntaxiques et la construction des phrases, et c), la transformation des phrases. Nous les analyserons une à une.

a) La catégorie syntaxique consiste en l'étude des types de mots et de groupes de mots qui existent. On appelle syntagme un groupe de mots qui remplit la même fonction qu'un mot d'une catégorie syntaxique. Le groupe de mots "le chien des voisins" a un sens et une fonction clairement découpés; il constitue ainsi un syntagme (un syntagme nominal dans ce cas-ci). Cependant, le groupe "chien des" ne peut pas être isolé du reste du syntagme parce que le découpage n'est pas intuitif et ne correspond à aucune fonction spécifique. Nous rejetterons ainsi ce type de groupe. Les syntagmes peuvent avoir la même fonction qu'un mot seul. On identifie la nature du syntagme en remplaôant ce syntagme par un mot (la permutation); si on peu le remplacer par un nom, c'est un syntagme nominal (comme "le chien de mes voisins" qu'on peut remplacer par "Pierre"), si on peu le remplacer par un verbe, c'est un syntagme verbal, si le syntagme dòbute par une pròposition, c'est un syntagme pròpositionnel. Pareillement, un syntagme peut inclure un ou plusieurs autres syntagmes. Le tableau suivant présente les catégories syntaxiques, leurs fonctions ou caractéristiques élémentaires et des exemples de mots de ces catégories.

nom (syntagme nominal SN): objet, personne pouvant être sujet main, chien, Jeanne, temps, mercure

adjectif (synt. adjectival SA): qualifie un synt. nominal long, petite, illuminé

adverbe (synt. adverbial SAdv): qualifie un synt. verbal, adjectival ou adverbial vraiment, parfois

préposition (synt. prépositionnel SP): introduit un complément à, de, avec, dans

conjonction (C): mot liant deux phrases juxtaposées ou deux syntagmes mais, ou, et, donc, car, ni, or

b) La combinaison des mots en phrases se fait par application de règles syntaxiques. Un syntagme nominal, par exemple, se construit en incluant au moins un nom, puis, selon le cas, en ajoutant un déterminant avant et possiblement un ou plusieurs adjectifs. On peut ainsi définir la règle comme suit: SN=(dét) + (Adj) + N + (Adj). Les parties qui ne sont pas essentielles au syntagme sont mises entre parenthèses et sont dites facultatives ou optionnelles. L'ordre des composantes est important, ce qui explique la présence de l'adjectif facultatif avant et après le nom ("la grande femme", "l'enfant aimable"). Bien sûr, le syntagme peut aussi contenir d'autres syntagmes, dans quel cas la règle se lirait: SN=SN + (SN) + (SP) + (SV). La phrase qui suit est un exemple de cette structure: "Le chien et le chat avec lesquels je suis arrivé, portant des colliers de couleur vive ...". On peut ainsi définir les parties de la phrase pour chacune des langues du monde.

La grammaire générative a amené une nouvelle forme de représentation de la syntaxe appelée la structure arborescente. Elle sert à visualiser les structures et les liens qui les unissent. Voici un exemple d'une telle visualisation:

c) La phrase de base est affirmative et positive. Lorsqu'on veut produire une phrase négative, interrogative ou emphatique, il faut transformer la phrase de base. Ces transformations se réalisent après la construction de la phrase affirmative. Il existe évidemment plusieurs formes de transformations pour obtenir un même type de phrase. Ainsi, la phrase "Mon fils est adorable" peut se transformer à l'interrogative de plusieurs façons: "Mon fils, est-il adorable?", "Mon fils est-il adorable?", "Mon fils est adorable?", etc. Chaque forme est définie par une règle. Il existe trois types de transformation: l'interrogation, pour poser des questions, la négation, ou indiquer une opposition, et la transformation emphatique, où on met l'accent sur un aspect spécifique de la phrase.

7. La sémantique

Avec la sémantique s'achève l'étude de la forme du contenu et, de là, de la signification. Il ne sera pas question ici des sémantiques non linguistiques (philosophique, logique, mathématique), mais il faut quand même faire remarquer qu'avec la sémantique, la linguistique déborde de ses frontières et touche, entre autres disciplines, à la sémiotique. La sémantique (linguistique) sera définie comme étant l'étude de l'articulation de la signification et du sens et, ainsi, de l'articulation du vocabulaire et de la grammaire. Sont distinguées une sémantique analytique ou sémique, qui a pour objet le signifié des monèmes (plus particulièrement des lexèmes), et une sémantique synthétique ou schématique, qui a pour objet le signifié des énoncés (plus particulièrement des syntactèmes); la première pourrait être dite "lexicale" sans être seulement de la lexicologie, alors que la seconde est "grammaticale", allant jusqu'au signifié des morphèmes. Une sémantique globale étendra son étude jusqu'au texte... Mais avant d'être globale ou totale, une sémantique doit être fondamentale et radicale : elle est à la recherche de la racine du sens; racine qui peut être origine ou non, quête de l'origine plutôt qu'origine de la quête. Le sens est au fondement -- ou au non-fondement -- de la signification conduisant à la communication; le sens est davantage trajectoire qu'origine ou destination, trajet plutôt que projet et objet. La signification n'est jamais qu'effets de sens et la communication, effets de signification. C'est pourquoi il vaut mieux parler du langage du sens -- le texte-en-situation ou l'animalité et l'oralité de la textualité -- que du sens du langage : le langage n'a pas de sens, mais le sens a un langage, est langage. Le sens est monde et langage... Le sens inclut la référance au monde (naturel), celle-ci comprenant la référence comme désignation ou dénotation, renvoi au référent comme «unité culturelle», et la signifiance, c'est-à-dire ce par quoi il y a destination (et articulation) de la communication et de la signification, de l'expression et du contenu, du discours et de la langue, du signifiant et du signifié, etc. La signifiance est à la référance ce que l'immanence est à la transcendance; c'en est l'essence ou l'évidence irréductible. L'intersection de la référance et de la signifiance est un objet particulier de la sémantique; c'est la connaissance propre à l'existence de l'homme et donc à la pensée.

7. 1. L'analyse sémique (et sémémique)

La sémantique est un investissement du lexique et de la syntaxe; par rapport au lexique, cet investissement est sémique. Jusqu'à un certain point, le lexique, comme mémoire de la langue, est une nomenclature, une terminologie inventoriée par les dictionnaires. Cette nomenclature peut être structurée ou organisée en classes correspondant à une taxinomie comprenant divers taxèmes, un taxème étant un paradigme sémantique ou un «ensemble en fonctionnement», dont les éléments sont des taxes. Les parties du discours et les catégories de la langue sont en quelque sorte des taxèmes grammmaticaux, de même que les unités et les fonctions syntaxiques conduisant à des relations, à des formulations ou à d'autres structurations capables de servir de modèles; un groupe de taxèmes lexicaux, des lexèmes, peut constituer un «domaine d'expérience» et un lexème peut faire partie de plusieurs domaines, surtout sous l'effet de la «culture ambiante». Au niveau des désignations, les taxèmes lexicaux pourront se retrouver dans des relations paradigmatiques (d'opposition ou d'inclusion) ou des relations syntagmatiques (de participation ou d'association), selon la détermination du domaine d'expérience comme champ sémantique cadastré ou quadrillé par une isotopie. Mais avant la léxémisation, on ne peut pas encore parler de lexèmes, qui n'y sont encore que des «nébuleuses», des «amalgames» ou des «agglomérats» sémiques instables : des lexes -- conceptions d'avant toute conceptualisation ou pré-concepts...

Nous avons vu, au niveau phonologique de la forme de l'expression, que les traits qui distinguent les phonèmes sont des phèmes et qu'un ensemble de phèmes est un phénème correspondant à un phonème; en outre, l'intersection des phémèmes d'une série est un archiphémème définissant un archiphonème. Au niveau sémique de la forme du contenu, il est possible de procéder de la même manière : les sèmes distinguent les lexèmes ou même les morphèmes entre eux; un ensemble de sèmes constitue un sémème correspondant à un monème (lexème ou morphème); l'intersection des sémèmes est un archisémème correspondant à un archimonème ou, plus particulièrement, à un archilexème. Nous avons aussi vu que dans un sème, il y a des sèmes constants (ou dénotatifs : descriptifs ou applicatifs) et des sèmes variables (ou connotatifs); parmi les sèmes constants, il y a un «noyau sémique», c'est-à-dire un ensemble de sèmes génériques qui est le classème; les sèmes variables ou virtuels constituent le virtuème. Le sémantème et le virtuème sont microsémantiques et le classème est mésosémantique. Au niveau sémantique (et donc sémique), il y a un binarisme du "non" et du "oui", du posé et du présupposé, de l'avant et de l'après, de l'hypothèse et de la thèse, du prospectif et du rétrospectif, de l'infini et du fini : du - et du +. Ces catégories sont des valeurs. Nous savons que les morphèmes font partie d'une classe finie ou fermée, alors que les lexèmes font partie d'une classe presque infinie ou ouverte; c'est donc dans l'étude des lexèmes que l'analyse sémique (et sémémique) est la plus efficace et la plus productive...

Généralement, la dénotation et la connotation du sémème varient en sens inverse : plus il y a de compréhension ou d'intension de la dénotation, moins il y a d'extension de la connotation et vice versa; un terme dit concret (comme "microscope") a moins d'extension et plus d'intension qu'un terme abstrait ("comme liberté") : un terme technique a peu d'extension, comme le nom propre (dont le sémantème est très chargé). Ce peut être la même chose pour des catégories grammaticales : le singulier a plus d'extension que le pluriel (qui a plus d'intension, donc de sèmes spécifiques); c'est la différence entre le neutre (extensif) et le marqué (intensif).

Au niveau du classème, nous retrouvons souvent de grandes classes comme : inanimé/animé, non-humain/humain, mâle/femelle, collectif/individuel, etc., le deuxième terme étant le terme marqué. Quant au virtuème, il varie selon le contexte, le site et la situation, donc aussi selon les interlocuteurs et leur univers de croyances et de connaissances. Le virtuème est ainsi tributaire de certains acquis culturels et socio-historiques; mais il peut accéder à la compétence, c'est-à-dire à la mémoire lexicale : c'est un peu le rôle de l'éducation de faire partager les connotations -- d'user de métaphores et de les user (comme c'est le cas avec la fonction connotative en poésie et en publicité)...

Alors que l'analyse sémique correspond au niveau phonologique de la forme de l'expression, la sémantique schématique correspondrait à son niveau morphologique; elle étudie les mécanismes de construction, d'intégration ou de dérivation morphologique : la formation des monèmes par l'ajout de morphèmes lexicaux aux lexèmes, dans la préfixation et la suffixation par exemple. La sémie sera alors la «substance sémantique» d'une lexie comme "constructeur". La sémantique schématique poussera son analyse jusqu'à l'énoncé et au paragraphe, où des schèmes d'entendement de nature logique (ou syntactico-sémantique) interviennent.

7. 2. La structure élémentaire de la signification

De la forme de l'expression à la forme du contenu, il faut constater qu'il y a moins de contraintes : la sémantique est moins stable, très combinatoire par rapport à la phonologie, qui est très contrainte par le petit nombre de phonèmes (malgré la grande diversité ou complexité phonétique); la syntaxe, elle, est une combinatoire très contraignante mais fort stable.

L'instabilité de la sémantique et sa grande combinatoire lui viennent de la très grande généralité ou abstraction de son fondement, c'est-à-dire du caractère élémentaire ou primaire de la signification. Fondamentale, la structure élémentaire de la signification est une organisation très abstraite des valeurs, c'est-à-dire des catégories sémantiques binaires, un système de valeurs constituant une axiologie. Il y a ainsi des micro-univers sémantiques avant tout univers de discours, qui est la surface de l'univers. Au sein de ces micro-univers, peuvent être distingués des univers sémantiques (ou des totalités de signification) et des universaux sémantiques qui sont indéfinissables et qui sont des structures axiologiques élémentaires. L'axiologie de l'univers collectif ou sociolectal concerne le rapport entre la nature et la culture et donc la survie de l'espèce; l'axiologie de l'univers individuel ou idiolectal concerne le rapport entre la vie et la mort et donc le sexe de l'individu. Quant à la structure axiologique figurative, elle concerne le rapport entre les quatre éléments de la nature : feu/air/eau/terre.

Il peut y avoir projection de la structure élémentaire de la signification sur le carré sémiotique; c'est ce que l'on appelle le modèle constitutionnel, qui est sémantique et syntaxique. Le carré sémiotique est le modèle d'organisation de la signification ou la représentation visuelle de l'articulation logique d'une catégorie sémantique (comme "nature/culture" ou "vie/mort"); c'est un réseau relationnel ou une typologie des relations élémentaires, qui sont :

1°) la contradiction, qui est la négation, par disjonction, de l'assertion d'un sème par un autre sème;

2°) la complémentaire, qui est l'implication, par conjonction, de la contradiction;

3°) la contrariété, qui est la relation d'opposition ou de présupposition réciproque constitutive de la catégorie sémantique.

Se distinguent ainsi l'axe des contraires et des subcontraires, le schéma positif ou négatif et la deixis positive ou négative. Comme dénégation, la deixis est la dimension fondamentale du carré sémiotique; c'est celle de l'investissement thymique, pathique, phorique, proprioceptif, d'avant toute assertion; c'est la présupposition à la racine de toute (pro)position. Ainsi les deixis commandent-elles les schémas, qui commandent eux-mêmes les axes...

À partir du modèle constitutionnel, les valeurs sémantiques se transforment en thèmes et les univers axiologiques en champs : l'intersection des thèmes d'un même champ sémantique ou ce qu'il y a de commun et en assure la cohérence (par la redondance) est une isotopie, qui est une sorte d'archisémème des archisémèmes, l'isosémie étant la redondance du même sème. C'est l'isotopie qui permet d'identifier les systèmes d'idées que sont les idéologies politiques, sociales, morales, religieuses, littéraires, artistiques, etc., dont il sera possible de reconnaître les figures rassemblées dans des champs lexicaux et dont les termes pourront varier selon la terminologie d'un idiome ou selon son usage. Ce qu'il y a donc de commun aux champs lexicaux d'un même champ sémantique, c'est l'isotopie qui s'y répète, d'un paradigme à l'autre mais de manière syntagmatique dans un texte. En d'autres mots, une isotopie peut être figurative (lexicale) ou thématique/sémantique. L'isotopie est la rection axiologique de l'idéologie et la direction idéologique de la terminologie. Entre l'axiologie et la taxinomie, l'isotopie est le devenir-thymique du véridictoire (en Occident) ou le devenir-véridictoire du thymique (en Orient)...

8. Les grands courants en linguistique

8. 1. De la grammaire à la linguistique

Les plus anciennes théories connues du langage apparaissent il y a près de vingt-cinq siècles en Inde et en Grèce. Panini rédige au IVe siècle avant notre ère une grammaire du sanskrit qui constitue à la fois une excellente description de sa langue et une réflexion aiguë sur son fonctionnement. En Grèce, l'étude du langage est liée à la philosophie qui étudie le lien entre langue et logique – les deux mots provenant du grec logos. Platon (Ve-IVe siècle av. J.-J.) et Aristote (IV^e siècle av. J.-C.) s'y intéressent.

La Grammaire de Port-Royal (1660) d'Antoine Arnauld (1612-1694) et de Claude Lancelot (v. 1615-1695) est la première tentative moderne de formulation d'une théorie du langage. Elle part de l'idée qu'il existe un lien entre langue et logique et donc que le langage est une représentation de la pensée. Les différentes catégories de mots correspondant à des catégories logiques, les différences entre les langues sont analysées comme des variations de «surface».

Au début du XIX^e siècle apparaît en Europe la grammaire comparée, qui tente de reconstruire les langues originelles dont proviennent les différentes langues du monde. Depuis les remarques de William Jones en 1786, on connaît les analogies entre le sanskrit et la majorité des langues d'Europe, et il s'agit de comprendre de quelle façon toutes ces langues sont apparentées. Les travaux de Franz Bopp, des frères Grimm et de Friedrich von Schlegel déboucheront d’abord sur l'élaboration de lois phonétiques rendant compte de l'évolution des sons à travers le temps. En appliquant ces lois au problème de la langue mère, on parviendra ainsi à reconstruire une langue hypothétique, baptisée indo-européen.

8. 2. Le Cours de linguistique générale de Ferdinand de Saussure

Le Suisse Ferdinand de Saussure (1857-1913) est le premier à effectuer une analyse de la langue de type structural, les éléments du système étant définis sur la base de leur fonction et non pas sur celles de leurs caractéristiques phoniques. Sa théorie est présentée dans son Cours de linguistique générale (1916), qui va révolutionner l'étude des faits de langue.

On y trouve des distinctions qui vont être au centre des conceptions de la linguistique du XX^e siècle: distinction entre le langage (la faculté générale qu'ont les êtres humains de parler), la langue (chaque instrument linguistique particulier) et la parole (l'ensemble des réalisations individuelles); distinction entre les relations syntagmatiques (relations qu'une unité linguistique entretient avec d'autres unités présentes dans la chaîne du discours) et les relations paradigmatiques (relations qu'elle entretient avec des unités absentes et qui pourraient occuper sa place); distinction entre le signifiant (c’est-à-dire la forme concrète acoustique ou phonique) et le signifié (le concept, le contenu sémantique, l'ensemble des réalités à quoi renvoie le signifiant). De plus, l'étude synchronique est à distinguer de l'étude diachronique, c’est-à-dire que, dans le premier cas, la linguistique étudie des états de langue à un moment donné et, dans l'autre, l'évolution linguistique.

Pour Saussure, tous les faits de langue sont à étudier et la linguistique doit donc abandonner tout point de vue normatif. Ce principe implique également que toutes les langues sont dignes de devenir objet d'étude, aucune n'étant supérieure à une autre ou plus intéressante qu'une autre.

8. 3. Leonard Bloomfield et le structuralisme américain

C'est avec Edward Sapir (1884-1939) et Leonard Bloomfield (1887-1949) que la linguistique américaine va prendre ses caractéristiques propres. E. Sapir est surtout connu par ses travaux sur les rapports entre langue et vision du monde (en particulier, «l'hypothèse Sapir-Whorf» selon laquelle la langue organise la culture d'une communauté). L. Bloomfield élabore une théorie linguistique béhavioriste qui refuse de prendre en compte le sens des énoncés pour ne travailler que sur les comportements associés à l'usage de ces énoncés, la communication étant ramenée au modèle stimulus-réponse. Dans son ouvrage le Langage (1933), L. Bloomfield insiste surtout sur la segmentation de l'énoncé linguistique en unités (la phrase est segmentée en constituants immédiats, puis en morphèmes), dont il étudie la distribution et classe les variantes

8. 4. Le cercle de Prague et la phonologie

En 1926, une équipe de jeunes chercheurs russes (Roman Jakobson, Nikolaï Troubetzkoï) et tchèques (Vilem Mathesius, B. Trnka, J. Vachek) fonde le cercle linguistique de Prague. Distinguant la phonétique de la phonologie, la première étudiant les sons de la parole et la seconde les sons de la langue, ces chercheurs fondent la phonologie structurale qui conçoit la langue comme un système répondant à une fonction (la communication) et mettant en œuvre les moyens nécessaires pour assumer cette fonction. Dans les Principes de phonologie (publ. posth., 1939), N. Troubetzkoï définit le phonème comme la plus petite unité fonctionnelle, et l'opposition phonologique comme l'opposition phonique qui permet de distinguer deux unités sémantiques.

D'autres linguistes se joignent au cercle de Prague, comme le Britrannique Daniel Jones et les Français Émile Benveniste et André Martinet, qui sont les principaux propagateurs de ces thèses.

8. 5. L'école de Copenhague et la glossématique

Deux linguistes danois, Louis Hjelmslev et Knud Togeby, ont repris de l'enseignement de F. de Saussure l'idée que la langue est une forme et non pas une substance, créant la glossématique (du grec glôssa signifiant «langue») et s'efforçant de construire une sorte d'algèbre de la langue considérée comme pur jeu de différences. Sur le modèle du cercle de Prague, L. Hjelmslev crée, en 1931, le cercle linguistique de Copenhague. Les Prolégomènes à une théorie du langage (1941) restent son texte le plus important. Dans cette approche épistémologique, seule la présentation du couple connotation/dénotation, reprise et transformée par Roland Barthes, a fait école.

8. 6. La linguistique française

Les deux figures marquantes de la linguistique française moderne sont Emile Benveniste et André Martinet. Benveniste a systématisé la notion de racine (une voyelle alternante entre deux consonnes) et s'est très vite converti à une approche structurale du lexique, étudiant en particulier le vocabulaire des institutions indo-européennes. Puis il s'est consacré à la linguistique générale (Problèmes de linguistique générale, 1966-1974), apportant des contributions importantes à la théorie de l'arbitraire du signe et à celle des temps et des pronoms.

A. Martinet propose une théorie générale de la langue, connue sous le nom de fonctionnalisme, approche structurale qui ne néglige pas pour autant la dimension historique et qui analyse les faits de langue à la lumière de la fonction – considérée comme centrale – de communication. Partant de l'acquis de la phonologie – qu'il a contribué à améliorer, en particulier en ce qui concerne la théorie de l'archiphonème et de la neutralisation –, A. Martinet élabore la notion de double articulation, posant que la langue est segmentée, d'une part, en monèmes (unités linguistiques ayant à la fois une forme et un sens, qu'il va classer à partir de la façon dont elles marquent leur fonction) et, d'autre part, en phonèmes (unités linguistiques n'ayant qu'une forme et pas de sens); cette vision lui permet de montrer comment quelques dizaines de phonèmes permettent de former des milliers de monèmes qui, à leur tour, s'assemblent dans les énoncés linguistiques.

8. 7. Vers une grammaire générative

Se situant tout d’abord dans la lignée de l'école bloomfieldienne, l'Américain Zellig Harris formule les principes de l'analyse distributionnelle, en particulier dans Methods in Structural Linguistics (1951). Il repousse l'utilisation du critère de sens pour fonder la description linguistique sur l'inventaire de la distribution des phonèmes et des morphèmes, c’est-à-dire sur la somme des environnements de ces unités. Il développe ainsi une analyse de la phrase en constituants immédiats.

Z. Harris évolue ensuite vers une linguistique transformationnelle en partant essentiellement du problème des ambiguïtés syntaxiques. Si une phrase peut avoir deux sens, cette difficulté peut être expliquée en remontant au noyau à partir duquel, par transformation, est construite cette phrase. Dans un autre domaine, l'apparente identité de structure de deux phrases – le menuisier travaille le dimanche et le menuisier travaille le bois – peut être réfutée en constatant qu'elles ne se prêtent pas aux mêmes transformations.

Noam Chomsky, disciple de Z. Harris, va utiliser cette idée de transformation d'une tout autre façon. Voulant dépasser le stade classificatoire de la linguistique, il veut élaborer un modèle des langues et du langage, et part du principe qu'une grammaire est constituée par un ensemble fini de règles permettant de produire un ensemble infini de phrases.

Une description syntaxique (ou grammaire générative) doit donc être pour N. Chomsky l'ensemble des règles dont l'application permet de produire toutes les phrases correctes de la langue.

Revenant aux conceptions de la Grammaire de Port-Royal, il distingue ainsi entre les structures profondes et les structures superficielles, les secondes provenant des premières par application des règles de transformation. Pour lever l'ambiguïté d'une phrase – phénomène de «surface» –, il suffit de remonter son histoire générative, c’est-à-dire d'appliquer les règles de transformation à l'envers, pour retrouver la structure profonde concernée.

8. 8. La sociolinguistique

Le Français Antoine Meillet (1866-1936) est le premier à insister sur les rapports entre la langue et la société. Dans un article intitulé «Comment les mots changent de sens», il s'attachait à étudier les liens entre milieux sociaux et variantes linguistiques. De façon plus générale, A. Meillet considérait que le langage est un fait social et que la tâche du linguiste est de préciser à quelle structure sociale correspond une structure linguistique déterminée.

Après avoir été longtemps négligée, l'analyse sociale du langage viendra de deux horizons très différents, celui de linguistes se réclamant du marxisme et celui de la sociolinguistique américaine.

Pour ce qui concerne le marxisme, c'est surtout Paul Lafargue qui, dans un article consacré à «la Langue française avant et après la Révolution» (1894), a analysé l'influence sur le vocabulaire d'un événement politique et social marquant. Entre 1920 et 1950, la linguistique soviétique officielle, centrée sur les travaux de Nikolaï Marr – qui affirme que le langage des ouvriers aurait, malgré les différences de langues, des caractéristiques communes – ne fera pas plus avancer les choses.

La nouveauté vient des Etats-Unis où se développe, à partir des années 1960, une ethnologie de la parole, autour de chercheurs comme Dell Hymes ou John Gumperz, qui travaillent sur les interactions et les enjeux que l'on peut déceler derrière l'utilisation de la langue. À la même époque, en Grande-Bretagne, Basil Bernstein étudie les rapports entre formes linguistiques et classes sociales.

Plus important est l'apport de William Labov, tant au niveau méthodologique que sur le plan théorique. Saisissant le langage dans son contexte social, il en vient à définir une communauté linguistique comme un groupe de locuteurs qui partagent un ensemble d'attitudes sociales envers la langue: non pas des individus qui pratiquent les mêmes variantes, mais des gens qui jugent ces variantes de la même façon.

8. 9. La psycholinguistique

Certains chercheurs ont voulu mettre l'accent sur les relations entre les messages échangés par les interlocuteurs et l'état mental de ces interlocuteurs: c'est le domaine de la psycholinguistique. Cette science prit corps dans les années 1950 autour de psychologues (C.E. Osgood, J.B. Caroll) et de linguistes (T.E. Sebeok, F.G. Lounsbury). Le projet initial de la psycholinguistique était d'analyser la façon dont les intentions du locuteur étaient transformées en messages que l'interlocuteur pouvait interpréter. Le psychologue B.F. Skinner intervint à son tour dans le débat, en proposant (le Comportement verbal, 1957) une psychologie du langage fondée sur le comportementalisme. D'autres psychologues, comme le Soviétique Lev Vigotski ou le Suisse Jean Piaget, apporteront également leur contribution à la construction de la nouvelle discipline. Les chercheurs influencés par les théories de N. Chomsky vont, pour leur part, développer une approche psycholinguistique dans le cadre de l'analyse générative.

8. 10. La linguistique appliquée

La linguistique appliquée consiste dans l'utilisation des méthodes de la linguistique ou des résultats des descriptions linguistiques pour résoudre différents problèmes techniques ou sociaux.

En premier lieu, la linguistique a beaucoup apporté à l'enseignement des langues, qu'il s'agisse de la langue maternelle ou des langues étrangères. On a pu, par exemple, montrer que les difficultés rencontrées dans l'étude d'une langue étrangère étaient en partie explicables par les différences de structure entre la langue source et la langue cible, et qu'il était possible d'élaborer des méthodes d'enseignement des langues étrangères spécifiques à une langue maternelle. Ainsi, le mot français bois, qui désigne à la fois la matière («du bois») et un ensemble d'arbres, s'oppose à forêt («un ensemble d'arbres plus étendu»), alors qu'en espagnol leña ne désigne que le bois de chauffage, madera désigne le bois de construction, bosque désigne une petite forêt et selva une forêt plus importante. Un Français apprenant l'espagnol aura donc du mal à dominer ce vocabulaire. Cette approche, qui porte le nom de linguistique contrastive, part de l'analyse des fautes commises par les débutants, cherche leur explication dans les différences de structure (syntaxiques, phonologiques, sémantiques) entre la langue maternelle et la langue étudiée, et débouche sur une méthodologie pédagogique appropriée, proposant une progression et des exercices correctifs.

On a pu aussi montrer que certaines difficultés d'apprentissage du calcul, en particulier chez des enfants de migrants, n'étaient pas liées au calcul lui-même, mais à des difficultés de compréhension de la langue dans laquelle on enseignait cette discipline, ce qui a porté l'attention à la fois sur l'importance de la langue d'enseignement et sur l'inégalité des enfants issus de classes sociales différentes face à l'école. La linguistique appliquée à l'enseignement est donc une branche importante de la linguistique appliquée, qui a aujourd’hui sa place dans la formation des enseignants.

Un autre domaine dans lequel les recherches linguistiques ont une application immédiate est celui de la traduction, en particulier la traduction automatique. La multiplication des ordinateurs a laissé espérer la possibilité de remplacer le traducteur humain par une machine, ce qui impliquait des descriptions formelles de la syntaxe et de la sémantique des langues concernées. De ce point de vue, les travaux de Noam Chomsky (qui partait de l'hypothèse qu'il y a des structures communes à toutes les langues) ont paru un temps prometteurs, mais on s'est aperçu qu'on ne pouvait pas transposer de façon automatique une langue dans une autre, et qu'il était nécessaire de passer par une sorte de langue intermédiaire, de caractère universel. Ces travaux ont ouvert la voie à des recherches concernant la linguistique mathématique et les universaux du langage, mais les résultats sont pour l'instant limités.

D'autre part, la mise au point de langages de programmation nécessite une réflexion interdisciplinaire entre linguistes et informaticiens, tandis qu'à l'inverse les travaux sur l'intelligence artificielle impliquent que les linguistes utilisent largement l'informatique.

Dans le domaine de la psycholinguistique, les applications sont également nombreuses, qu'il s'agisse de l'étude des troubles du langage et de leurs rapports avec les lésions corticales ou avec des maladies mentales: la phoniatrie, la neurolinguistique, la psychopathologie ou la pathologie du langage sont ainsi des domaines privilégiés d'application de la linguistique, qui est une aide précieuse dans la compréhension et le traitement des troubles de l'acquisition et du maniement du langage.

Enfin, la sociolinguistique a, entre autres débouchés, un domaine d'intervention fondamental dans ce qu'on appelle la planification linguistique, en particulier dans les pays ayant obtenu récemment leur indépendance: analyse du plurilinguisme, étude de l'émergence de langues véhiculaires, proposition de langues d'unification, de scolarisation, normalisation du vocabulaire, néologie, etc. Les linguistes jouent donc un rôle central dans la description des situations, la mise au point d'alphabets pour les langues non écrites, la standardisation des langues dialectalisées, l'élaboration de manuels scolaires, toutes choses nécessaires lorsqu'un gouvernement décide par exemple de promouvoir au statut de langue officielle une langue locale en remplacement d'une langue héritée de l'époque coloniale. Mais il faut alors choisir, parmi les nombreuses langues en présence, celle qui pourra jouer ce rôle, et l'«équiper» en conséquence. On distingue ici entre la politique linguistique (c’est-à-dire les grands choix en matière d'intervention sur la langue ou sur la situation linguistique, qui relèvent de l'État) et la planification linguistique (l'application concrète de ces choix qui nécessite l'intervention des linguistes).

Les politiques linguistiques peuvent chercher à intervenir sur la langue (lorsqu'on veut normaliser, lutter contre les emprunts à des langues étrangères, moderniser en créant de nouveaux mots) ou sur les langues (lorsque l'on veut changer les rapports entre les langues en présence). Dans le premier cas, on notera l'exemple du Québec, qui lutte contre l'influence de l'anglais sur le français, ou de la Turquie, qui, à l'époque d'Atatürk, a modernisé sa langue. Dans le second cas, on citera l'Indonésie qui, après son indépendance, a su élever une langue véhiculaire, le malais, au statut de langue nationale, malgré la grande multiplicité des langues en présence sur son territoire.

1. Définition du champ d'étude de la linguistique

2. La sémiologie et la linguistique