+ All Categories
Home > Documents > L’émergence de la parole - Gipsa-labjean-luc.schwartz/... · 2013. 9. 16. · 3 découvertes de...

L’émergence de la parole - Gipsa-labjean-luc.schwartz/... · 2013. 9. 16. · 3 découvertes de...

Date post: 04-Mar-2021
Category:
Upload: others
View: 0 times
Download: 0 times
Share this document with a friend
29
1 L’émergence de la parole : Aspects historiques et épistémologiques d’une nouvelle réarticulation LouisJean Boë 12 , JeanLuc Schwartz 1 Jean Granat 2 , JeanLouisHeim 23 Antoine Serrurier 4 , Pierre Badin 1 , Guillaume Captier 5 , Pierre Bessière 6 1 GIPSAlab, UMR CNRS, Institut National Polytechnique, Grenoble 2 Muséum National d’Histoire Naturelle, UMR CNRS, Paris 3 Institut de Paléontologie Humaine, Paris 4 SPCG – ISVR, Southampton 5 Laboratoire d’Anatomie, Montpellier 6 LIG Lab, INRIA, Grenoble 1. Introduction La parole – pierre de touche pour le moins philosophique, cognitive, linguistique et sociale – confère un statut singulier à l'Homme en tant qu'espèce vivante. Le questionnement de l’origine de la parole, les conditions de son émergence, la nature de sa production et de sa perception, la compréhension de son acquisition et de sa pathologie, l'exploration de sa diversité dans les langues du monde, suscitent de nombreuses questions. Celles-ci restent encore très largement débattues alors qu’elles renvoient, en même temps, à des intuitions, à des croyances et à des mythes plusieurs fois séculaires. Pour l’espèce humaine, la parole et le langage constituent véritablement une question existentielle qui a donné lieu à d’innombrables mythes, théories, dérives et même à des interdits. La fin du XX e et le tout début de ce siècle révèlent une véritable réarticulation des recherches dans le domaine de l’émergence de la parole et du langage (EPL par la suite). Libres de toutes contraintes religieuses, philosophiques ou institutionnelles, ces recherches naturalistes se caractérisent par leur approche multidisciplinaire, et impliquent des méthodes et des données très diversifiées. Nous nous sommes inscrits dans cette réarticulation en proposant, depuis plusieurs années et dans plusieurs projets nationaux et internationaux, une contribution dans le domaine des relations entre la morphologie des organes de la production de la parole et son contrôle, avec tout particulièrement, un focus sur l’ontogenèse et la phylogenèse, en constituant un groupe pluridisciplinaire associant anthropologues, paléoanthropologues, médecins anatomistes, roboticiens 1 , phonéticiens et spécialistes de parole en modélisation. Comme tout domaine en émergence et au développement rapide, ce nouveau programme n’est pas exempt de recherches menées sans véritables données, avec des emprunts à des hypothèses fragiles dans des disciplines parties prenantes mais non maîtrisées ou trop simplifiées. Les média exercent une pression qui n’est pas toujours constructive. Comme le notait Bachelard, la conceptualisation scientifique est une suite d’approximations successives bien ordonnées (1938, 1993 : 61), c’est pourquoi les bilans réguliers, les mises en perspectives réflexives ne nous semblent pas superflus : c’est en quelque sorte l’enjeu de cet article. En nous plaçant prioritairement dans le registre de la parole, nous ne considérons pas pour autant qu’au cours de l’évolution elle a été première dans la construction du langage : le geste a pu la précéder (de Condillac 1746 à Corballis 2002 ; pour un historique, voir Hewes, 1999) ou geste et parole ont pu émerger dans une dynamique phylogénétique conjointe. Nous n’aborderons donc pas la question de l’antériorité. Mais dans tous les cas il faudra bien essayer d’expliquer comment la parole a pu se mettre en place et est devenue le moyen de communication privilégié d’Homo 1 Dans le cadre de cette recherche sur l’émergence de la parole une série de travaux ont été menés dans le cadre de la robotique. Faute de pouvoir tout présenter nous n’aborderons pas ici ce pan de travail. Citons : Glotin, 1996 ; Berrah et al., 1996 ; Berrah, 1998 ; Serkhane, 2005 ; Serkhane et al., 2005 ; Moulin-Frier, 2007.
Transcript
Page 1: L’émergence de la parole - Gipsa-labjean-luc.schwartz/... · 2013. 9. 16. · 3 découvertes de l’Homme de Neandertal (1856) et de l’Homme de Cro-Magnon (1868), la mise en

1

L’émergence de la parole : Aspects historiques et épistémologiques d’une nouvelle réarticulation

Louis-­‐Jean  Boë1  2,  Jean-­‐Luc  Schwartz1  Jean  Granat2,  Jean-­‐Louis-­‐Heim2  3  

Antoine  Serrurier4,  Pierre  Badin1,  Guillaume  Captier5,  Pierre  Bessière6    

1  GIPSA-­‐lab,  UMR  CNRS,  Institut  National  Polytechnique,  Grenoble  2  Muséum  National  d’Histoire  Naturelle,  UMR  CNRS,  Paris  

3  Institut  de  Paléontologie  Humaine,  Paris  4  SPCG  –  ISVR,  Southampton  

5  Laboratoire  d’Anatomie,  Montpellier  6  LIG  Lab,  INRIA,  Grenoble  

 

1. Introduction La parole – pierre de touche pour le moins philosophique, cognitive, linguistique et sociale –

confère un statut singulier à l'Homme en tant qu'espèce vivante. Le questionnement de l’origine de la parole, les conditions de son émergence, la nature de sa production et de sa perception, la compréhension de son acquisition et de sa pathologie, l'exploration de sa diversité dans les langues du monde, suscitent de nombreuses questions. Celles-ci restent encore très largement débattues alors qu’elles renvoient, en même temps, à des intuitions, à des croyances et à des mythes plusieurs fois séculaires. Pour l’espèce humaine, la parole et le langage constituent véritablement une question existentielle qui a donné lieu à d’innombrables mythes, théories, dérives et même à des interdits.

La fin du XXe et le tout début de ce siècle révèlent une véritable réarticulation des recherches dans le domaine de l’émergence de la parole et du langage (EPL par la suite). Libres de toutes contraintes religieuses, philosophiques ou institutionnelles, ces recherches naturalistes se caractérisent par leur approche multidisciplinaire, et impliquent des méthodes et des données très diversifiées.

Nous nous sommes inscrits dans cette réarticulation en proposant, depuis plusieurs années et dans plusieurs projets nationaux et internationaux, une contribution dans le domaine des relations entre la morphologie des organes de la production de la parole et son contrôle, avec tout particulièrement, un focus sur l’ontogenèse et la phylogenèse, en constituant un groupe pluridisciplinaire associant anthropologues, paléoanthropologues, médecins anatomistes, roboticiens1, phonéticiens et spécialistes de parole en modélisation.

Comme tout domaine en émergence et au développement rapide, ce nouveau programme n’est pas exempt de recherches menées sans véritables données, avec des emprunts à des hypothèses fragiles dans des disciplines parties prenantes mais non maîtrisées ou trop simplifiées. Les média exercent une pression qui n’est pas toujours constructive. Comme le notait Bachelard, la conceptualisation scientifique est une suite d’approximations successives bien ordonnées (1938, 1993 : 61), c’est pourquoi les bilans réguliers, les mises en perspectives réflexives ne nous semblent pas superflus : c’est en quelque sorte l’enjeu de cet article.

En nous plaçant prioritairement dans le registre de la parole, nous ne considérons pas pour autant qu’au cours de l’évolution elle a été première dans la construction du langage : le geste a pu la précéder (de Condillac 1746 à Corballis 2002 ; pour un historique, voir Hewes, 1999) ou geste et parole ont pu émerger dans une dynamique phylogénétique conjointe. Nous n’aborderons donc pas la question de l’antériorité. Mais dans tous les cas il faudra bien essayer d’expliquer comment la parole a pu se mettre en place et est devenue le moyen de communication privilégié d’Homo

                                                                                                               1  Dans le cadre de cette recherche sur l’émergence de la parole une série de travaux ont été menés dans le cadre de la robotique. Faute de pouvoir tout présenter nous n’aborderons pas ici ce pan de travail. Citons : Glotin, 1996 ; Berrah et al., 1996 ; Berrah, 1998 ; Serkhane, 2005 ; Serkhane et al., 2005 ; Moulin-Frier, 2007.  

Page 2: L’émergence de la parole - Gipsa-labjean-luc.schwartz/... · 2013. 9. 16. · 3 découvertes de l’Homme de Neandertal (1856) et de l’Homme de Cro-Magnon (1868), la mise en

2

sapiens. Même si les la communication gestuelle a pu être première, si les signes silencieux ont eu d’abord la préférence, la communication sonore a dû présenter de nombreux avantages et peut-être pas uniquement celui de « communiquer dans le noir ». Nous laisserons aussi de côté la question sous-jacente de la datation de cette émergence au cours de la phylogenèse.

Dans un premier temps nous procéderons à une mise en perspective historique de l’EPL en nous replaçant dans la deuxième moitié du XIXe siècle, nous proposerons une classification qui permet une lecture des différentes théories de l’EPL et enfin nous présenterons plus particulièrement nos travaux dans ce domaine.

2. Épistémologie historique  

Au milieu du XIXe siècle, dans leur très grande majorité, les linguistes considèrent qu’il existe une hiérarchie dans les langues et les anthropologues considèrent comme établie l’inégalité des races. L’humanité universelle guidée par les philosophes du siècle des Lumières a bien volé en éclats. La fin de celui-ci avait vu la mobilisation des plus grands naturalistes dont le programme de recherche, la science de l’espèce humaine, avait pris le nom d’Histoire naturelle de l’Homme. Les variations humaines de la couleur de la peau et des mœurs ne remettaient pas alors en cause l’essence et l’unité de l’Homme (monogénisme) doté de langage et créé par un ordonnateur divin. L’égalité potentielle de chaque représentant de l’espèce humaine se reflète encore dans la Déclaration des droits de l’homme (1799). Mais l’esclavage est maintenu2 par le Consulat. Se met alors en place une échelle humaine que certains anthropologues et linguistes vont tenter de justifier par des d’études objectives et quantitatives. La race se biologise et devient synonyme de variété du genre humain (polygénisme) dans une vision inégalitaire. Avec les races inférieures on trouve les langues de la même catégorie. Élaborée par des savants républicains, cette approche va pouvoir servir de caution à certaines explications inégalitaires du colonialisme3 (Blanckaert, 1995 ; Reynaud Paligot, 2006).

2.1. Autour de l’interdit de 1866 Le XIXe siècle est sans conteste celui des recherches sur l’EPL : l’histoire naturelle, la

préhistoire, l’ethnologie, l’anthropologie, la linguistique et la neurologie ont été traversées par une série d’avancées scientifiques au cours desquelles ont été accumulées de multiples données et établis les grands principes de l’évolution, de la classification des espèces, de la grammaire comparée, de la localisation de facultés cérébrales de la parole et du langage en particulier. Les débats sur l’émergence de l’Homme, ses variétés, le langage et les langues ont été aussi l’objet de violentes controverses associées à des erreurs scientifiques et idéologiques : l’existence des races, la supériorité de certaines d’entre elles et de leurs langues (le mythe de la race et de la langue aryenne), la justification du racisme sous toutes ses formes, de l’esclavagisme et des classes sociales, du colonialisme, de l’antisémitisme, de l’eugénisme et de la prophylaxie sociale, du sexisme et de l’homophobie (pour des positions racistes : Blumenbach, 1795 ; Morton, 1839 ; Le Bon, 1879 ; Vacher de Lapouge, 1909 ; Herrnstein, Murray, 1994 ; Rushton, Jensen, 2005 ; Watson, 2009) dont les conséquences ont été dans certains cas dramatiques, exemples tragiques des relations entre science et société (pour la dénonciation de ces exemples : Bodmer, Cavalli-Sforza, 1974 ; Calvet, 1974 ; Gould, 1981 ; Olender, 1989 ; Massin, 2001 ; Bancel et al., 2004 ; Reynaud Paligot, 2006 ; Blankaert, 2001b; Sibeud, 2001 ; Kroh, 2009).

L’histoire de cette période a été largement explorée et écrite. Nous en retiendrons, pour les aspects scientifiques : les formalisations de la grammaire comparée et des évolutions phonétiques, tout l’apport théorique de l’Origine des Espèces pour l’évolutionnisme (Darwin, 1859), les

                                                                                                               2  Aboli une première fois par la Convention en 1794, l’esclavage est maintenu en 1802 pour les îles restituées à la France par l’Angleterre (par ex. la Martinique). Il faudra attendre la restauration de la République pour qu’il soit aboli définitivement en 1848.  3  Dans la deuxième moitié du XXe siècle, la France possède l’empire colonial le plus vaste du monde (de l’Afrique, à l’Asie et à l’Océanie).  

Page 3: L’émergence de la parole - Gipsa-labjean-luc.schwartz/... · 2013. 9. 16. · 3 découvertes de l’Homme de Neandertal (1856) et de l’Homme de Cro-Magnon (1868), la mise en

3

découvertes de l’Homme de Neandertal (1856) et de l’Homme de Cro-Magnon (1868), la mise en relation de l’aire du cortex se situant au niveau de la partie inférieure de la 3e circonvolution frontale de l'hémisphère dominant avec certains troubles de la parole (Broca, 1861).

Tous les développements de la linguistique historique ont eu lieu en Allemagne et dans la première moitié de XIXe siècle avec l’étude comparative des langues indo-européennes (Franz Bopp, Jacob Grimm, Friedrich Diez) et l’extension naturaliste, darwiniste d’August Schleicher ; c’est le même constat pour l’anthropologie (Theodor Waitz, Rudolf Virchow, Ernst Haeckel, Wilhem Wundt) qui, dans sa pluralité, est traversée, dès son apparition, par le darwinisme dont Haeckel se fait le défenseur infatigable. En 1856, la mise au jour de restes fossiles dans la vallée de la Neander en Allemagne (Johann Carl Fuhlrott) va transformer fondamentalement les données de la future bataille sur l’évolution que va provoquer Darwin trois ans plus tard.

De son côté, la France a pris un retard notable qu’elle va tenter de rattraper à partir de la seconde moitié de ce XIXe siècle. Les développements vont se mettre en place dans deux directions aux oppositions quasi irréductibles : l’importation du modèle historico-comparatif par Michel Bréal et Gaston Paris et la mise en place de l’école de linguistique naturaliste, inspirée directement par Schleicher, représentée par Abel Hovelacque et étroitement associée à l’anthropologie physique, animée par Paul Broca. Ce dernier domaine semblait braver par ses enjeux de connaissance les interdits des autorités religieuses et morales traditionnelles (Blankaert, 2009). Les uns considèrent que la langue relève du domaine historique et social bien plus que du champ physiologique : pour eux anthropologie et linguistique sont deux ordres différents puisque les choix de la langue relèvent de l’arbitraire, un axiome constitutif. Les autres classent la linguistique parmi les sciences naturelles et conçoivent la langue, réalité physiologique, comme un organisme vivant et ils considèrent l’ontogenèse comme un reflet indicateur de la phylogenèse.

Ces deux courants sont opposés dans leurs postures idéologiques et religieuses, dans leurs présupposés théoriques, dans leurs profils politiques et professionnels, dans leurs finalités scientifiques. Il vont institutionnaliser leurs démarches et mettre en place leurs réseaux.

La Société d’Anthropologie de Paris (SAP), est créée en 1858 par Paul Broca4 avec une armée de chercheurs qui travaillent au laboratoire d’anthropologie de l’École Pratique des Hautes Études et au Muséum National d’Histoire Naturelle. La SAP est un véritable forum pour controverses5 dont les comptes-rendus sont publiées dans ses Bulletins et mémoires. Dans son orbite, l’École d’Anthropologie (créée en 1876) est dotée de 11 chaires dont celles d’anthropologie et de linguistique, elle publie La Revue de Linguistique et de Philologie Comparée (fondée par Chavée et Hovelacque), revue de cette école de linguistique naturaliste française qui de 1867 à 1916 publiera plus de 700 articles.

La Société de Linguistique de Paris6 (SLP) est fondée en 1866 à l’initiative de Hyacinte de Charency, Michel Bréal en sera l’immuable secrétaire jusqu’à sa la fin de vie (1915). Elle entretient des relations étroites avec le Collège de France, la Sorbonne et dispose de son organe d’expression, le Bulletin et mémoire de la SLP (pour des historiques voir Auroux, 1982 ; Blanckaert, 1995 ; Desmet, 1996, 2001, 2007 ; Dias, Rupp-Eisenreich, 2000 ; Wartelle, 2004).

Il ne reste peut-être pas de résultats scientifiques significatifs de l’école de linguistique naturaliste, mais il faut souligner que c’est dans ce contexte que Broca7, sensibilisé par les

                                                                                                               4  Broca s’est entouré d’une « jeune garde » de 35 ans d’âge et composée de deux chirurgiens (Béclard, Fleury), de trois enseignants du Muséum d’Histoire Naturelle (Geoffroy St Hilaire, Gratiolet, Lemercier) et d’un groupe de médecins.  5 La Société d’Anthropologie de Paris devient très vite un vaste forum où débattent des personnalités aussi différentes que : Broca (polygéniste, évolutionniste), qui ne s’intéresse ni à l’origine des langues, ni à leur classification, considérant que seule compte la faculté de langage; Renan, qui, sans devenir membre de la SAP, y défend la primauté des données linguistiques; Chavée (polygéniste), qui soutient l’équation diversité originelle des langues – diversité de l’organisation du cerveau ; Pruner-Bey (monogéniste), qui s’oppose à l’équation langue-race ; Hovelacque (polygéniste), qui accorde une même importance à l’anthropologie et à la linguistique et considère qu’une même langue peut être parlée par plusieurs races ; Gratiolet et de Quatrefages, créationnistes–fixistes et monogénistes. Pratiquement tous croient en l’inégalité des races et des langues, mais Joseph Anténor Firmin, « Haïtien et noir », membre de SAP, défend le principe de l’égalité des races (De l’égalité des races humaines (Anthropologie positive), 1885).  6 Les animateurs de la Sté de Linguistique de Paris sont pour l’essentiel des professeurs de la Sorbonne et du personnel de la nouvelle École Pratique des Hautes Études (Auroux, 1982 : 12).  7 Tout en se démarquant de la phrénologie (cf. G. Lanteri-Laura, Histoire de la phrénologie, Paris : PUF, 2e éd. 1993).  

Page 4: L’émergence de la parole - Gipsa-labjean-luc.schwartz/... · 2013. 9. 16. · 3 découvertes de l’Homme de Neandertal (1856) et de l’Homme de Cro-Magnon (1868), la mise en

4

problèmes du langage et des langues, a mis en évidence, en 1861, le siège de la faculté du langage qui allait ouvrir tout un domaine de recherche à la neurolinguistique.

Chacun de ces courants mettent en place un programme scientifique au sens d’Imre Lakatos (1970, 1978, 1994) qui se caractérise par un noyau dur, c’est-à-dire un ensemble d’hypothèses initiales fondatrices établies par les participants, une heuristique négative constituée de règles méthodologiques sur les voies de recherche à éviter (un glacis protecteur autour du noyau dur) et une heuristique positive qui consiste à faire progresser le programme tout en prenant en compte, au fur et mesure, les réfutations, les éléments de contre-épreuve internes et externes. Le programme de recherche est abandonné soit parce que le noyau dur n’a pas supporté le choc face à une réfutation fondamentale, soit parce que l’heuristique positive s’est affaiblie et sa dynamique n’a pas été suffisamment porteuse, ce qui a entraîné sa dégénérescence.

Le noyau dur de la SAP figure explicitement dans ses statuts : Article 1. La Société d’Anthropologie de Paris a pour but l’étude scientifique des races humaines.

C’est donc sur le présupposé de l’existence de races différentes, caractérisables par des paramètres physiques, que se fonde alors toute la démarche de cette société, en accord avec la pensée dominante de ce XXe siècle. Cette démarche est basée, pour l’essentiel, sur les données de l’anatomie et de la physiologie craniofaciale, mais elle pourra prendre en compte des données linguistiques, dans le cadre bien délimité par Broca :

« Nous nous proposons […] de chercher, par les voies multiples de l’anatomie, de la physiologie, de l’histoire, de l’archéologie, de la linguistique, et enfin de la paléontologie, quels ont été, dans les temps historiques et dans les âges qui ont précédé les plus anciens souvenirs de l’humanité, les origines, les filiations, les migrations, les mélanges des groupes nombreux et divers qui composent le genre humain. » (Broca, 1862 : 264). « Il est possible qu’une race perde sa langue en adoptant celle d’une autre race, mais encore que cela a eu lieu fréquemment, dans la période historique, chez des peuples qui , pour cela, n’ont changé ni de race ni de type. Les caractères linguistiques ne sont pas permanents. » (Broca, 1862 : 297). « La linguistique […] fournit à l’anthropologie des renseignements et non des arrêts, et elle doit intervenir dans nos débats, non à titre de juge, mais à titre de témoin. » (Broca, 1862 : 318-319).

Mais, pour Hovelacque le chef de file de la linguistique naturaliste, la relation entre la langue et les caractéristiques physiques et donc la race ne fait pas de doute :

« La langue étant un produit de la nature elle-même, étant la fonction d’un nouvel organe, il est évident que deux systèmes linguistiques irréductibles entre eux indiquent deux organes producteurs différents. » (Hovelacque, 1876 : 361). « Si c’est la faculté de langage articulé qui est le propre et la seule caractéristique de l’homme, […] et si les différents systèmes linguistiques que nous connaissons sont irréductibles, ils ont pris naissance isolément en des régions bien distinctes. il en résulte que les premiers êtres qui furent en voie d’acquérir la faculté du langage articulé ont gagné cette faculté en différents lieux à la fois et ont donné naissance à des races humaines originellement distinctes. » (Hovelacque, 1887 : 420).

C’est d’ailleurs, très explicitement la position de Darwin : « Si nous possédions l’arbre généalogique complet de l’humanité, un groupement généalogique des races humaines nous fournirait certainement aussi la meilleure classification des idiomes divers qui se parlent aujourd’hui dans le monde ; et si toutes les langues mortes, avec tous les dialectes intermédiaires et lentement changeant, devaient y trouver leur place, un tel regroupement serait le seul possible. » (Darwin, 1859, 1866 : 515).

Du côté de la SLP, une partie de son noyau dur est inscrite aussi dans ses statuts (1866), mais en creux :

Article premier : la Société de linguistique a pour but l’étude des langues, celle des légendes, traditions, coutumes, documents pouvant éclairer la science ethnographique. Tout autre objet d’étude est rigoureusement interdit. Article 2 : la Société n’admet aucune communication concernant soit l’origine du langage, soit la création d’une langue universelle.

En 1876 ces deux articles furent, à l’occasion de la demande de reconnaissance d’utilité publique, supprimés et remplacés par : « la Société de linguistique a pour but l’étude des langues, et l’histoire du langage. Tout autre sujet d’études est rigoureusement interdit ».

Ces articles constituent bien une interdiction de recherche et d’expression pour les membres affilés à cette société. Cette prise de position emblématique n’est d’ailleurs pas uniquement française. En Angleterre, Alexander Ellis, dans son discours présidentiel à la Philological Society précisait, en 1873, que les travaux sur l’EPL se situaient hors du champ de la discipline. En

Page 5: L’émergence de la parole - Gipsa-labjean-luc.schwartz/... · 2013. 9. 16. · 3 découvertes de l’Homme de Neandertal (1856) et de l’Homme de Cro-Magnon (1868), la mise en

5

Allemagne, August Schleicher, un des indo-européanistes les plus innovants, a toujours affirmé que :

« La science du langage a le droit de refuser de répondre à cette question si souvent posée et si souvent traitée […] la théorie de la naissance du langage n’est pas de son domaine mais plutôt de celui de l’anthropologie » (1860, trad. 1988 : 91-92).

Les néo-grammariens allemands de la génération suivante des comparatistes fondateurs vont d’ailleurs complètement abandonner les questions de l’origine des racines primitives, les reconstructions du proto-aryen et des protolangues, préoccupations qu’ils traitent, par dérision, de glottogoniques (Jespersen, 1922, 1976 : 95).

L’exégèse de cette interdiction par la SLP proposée par Sylvain Auroux (2007) semble très convaincante. Les rédacteurs du célèbre article de la SLP n’ont pas laissé de traces écrites, mais au-delà des raisons de caractère social ou conjoncturel (par ex. éviter de vives controverses politiques et religieuses qui opposeraient les croyants aux anticréationistes, les monogénistes aux polygénistes, les matérialistes athées aux bien pensants catholiques), il semble bien que ce sont des raisons de caractère scientifique qui ont prévalu et particulièrement l’une d’entre elles. Ce n’est pas l’inobservabilité des racines qui gênaient les linguistes, puisque tout le comparatisme visait à reconstruire des protolangues, mais le fait que dans la recherche ultime de la langue d’origine, c’est-à-dire la recherche d’éléments communs à toutes les familles, il aurait fallu rechercher les causes et les motivations des racines (par exemple des onomatopées), ce qui aurait remis en cause tout le programme comparatiste et ses lois phonétique basé sur l’arbitraire des racines (Auroux, 2007 :41-68). Ce n’est donc parce qu’ils considéraient que la question de l’origine ne relevait pas du domaine scientifique, mais parce que cette recherche linguistique ne pouvait aboutir qu’à une impasse épistémologique mettant en cause le noyau dur :

« Les axiomes de la linguistique [comparatiste] sont incompatibles avec toute recherche sur l’origine des langues. Il ne s’agit pas d’un ostracisme parce qu’il ne concerne que le champ de la linguistique comparée, c’est-à-dire l’histoire des langues. Il n’a jamais été question d’interdire des recherches sur l’origine de la faculté de langage à d’autres disciplines » (Auroux, 2007 :126).

L’interdit de la SLP relève donc bien d’une logique programmatique : la violer aurait remis en cause le noyau dur des recherches comparatistes. Dans la mesure où elle était émise, non pas par un organisme institutionnel, mais par une société savante à laquelle personne n’était forcé d’adhérer, même si celle-ci fonctionnait comme un groupe de pression qui consacrait l’autonomie des recherches linguistiques, on peut considérer qu’elle avait bien sa raison d’être.

La disparition du programme de la linguistique naturaliste associant langues et races (Haoui, 1993) correspond à l’éclatement du grand projet de la SAP d’étudier les multiples facettes de l’humanité par le prisme des races (essentiellement caractérisées par l’architecture crânienne) qui ne pouvait que conduire à une impasse :

« Le péché originel de l’anthropologie consiste dans la confusion entre la notion purement biologique de race (à supposer d’ailleurs, que, même sur ce terrain limité, cette notion puisse prétendre à l’objectivité, ce que la génétique moderne conteste) et les productions sociologiques et psychologiques. » (Lévi-Strauss, 1960, 1973 :10)

Même sur ce terrain limité les anthropologues n’ont pu établir des critères discriminants corroborant l’existence des races8 et permettant de classer un individu donné dans une race plutôt qu’une autre. Force est de reconnaître que l’extension des controverses sur l’existence des races est la conséquence de la seconde guerre mondiale, du racisme et du nazisme. Pourtant il faudra attendre les années 1950 pour que la communauté scientifique accepte le non fondé des races humaine. La race est une variété de l’espèce (Ernst Mayr) or l’espèce humaine est unique avec une variabilité interpopulation supérieure à la variabilité intrapopulation. Ceci s’inscrit contre les

                                                                                                               8 En 1891, Paul Topinard qui a été secrétaire général de la SAP de 1880 à 1886 et enseignant à l’École d’anthropologie de Paris, écrit dans son ouvrage L’Homme et la nature : « Nous avons vu […] qu’il n’y a pas de races à proprement parler, dans le sein de l’humanité, telles qu’on en trouve chez les animaux, c’est-à-dire des variétés constantes, se perpétuant semblables à elles-mêmes de façon certaine. Il y a seulement des éléments historiques ou philologiques de peuples auxquels on attribue, à tort ou à raison, un certain nombre de caractères physiques communs. Autrement dit les races de l’anthropologie ne sont que les produits de notre esprit, des suppositions de filiations réelles de sang sans mélange, des hypothèses nécessaires à l’étude. Il n’existe que des individus se rapportant plus ou moins aux types que nous admettons. » (Topinard, 1891 : 345). Sa position ne reflète pas celle de la majorité des membres de la SAP.  

Page 6: L’émergence de la parole - Gipsa-labjean-luc.schwartz/... · 2013. 9. 16. · 3 découvertes de l’Homme de Neandertal (1856) et de l’Homme de Cro-Magnon (1868), la mise en

6

variétés possibles de l’espèce Humaine. La génétique moderne confirme bien l’unicité de notre espèce. L’UNESCO9 en a pris acte dans ses différentes déclarations (statements) de 1950 à 1967 :

« There is a great genetic diversity within all human populations. Pure races – in the sense of genetically homogeneous populations – do not exist in human species. The classifications, whatever they are, cannot claim to classify mankind into clear-cut categories. Differences between individuals within a race or within a population are often greater than the average differences between races or populations. The biological data stand in open contradiction to the tenets of racism. Racist theories can in no way pretend to have any scientific foundation and the anthropologists should endeavour to prevent the results of their researches from being used in such a biased way that they would serve non-scientific ends ». (UNESCO, 1964, Proposal on the biological aspects of races).

2.2. Une nouvelle réarticulation scientifique Dans le domaine de l’EPL, la première moitié du XXe siècle est une période de transition,

bien moins bien connue et dont le bilan reste à faire, avec, en particulier, l’émergence de la génétique et sa confrontation avec la linguistique.

Actuellement un grand nombre d’indices montrent que les travaux sur l’EPL connaissent un véritable développement, tout à la fois institutionnel et médiatique : des académies (The New York Academy of Sciences, The California Academy of Sciences) l’ont promu, des sociétés savantes ont été créées (Association for the study of Language in Prehistory avec sa revue Mother Tongue). EVOLANG, l’International Conference on the Evolution of Language en est à la huitième édition. Autres signes de cette évolution, un workshop intitulé Language origins research : State of the art as of 1997, s’est tenu dans le cadre du XVIe Congrès International des Linguistes organisé par la Société de Linguistique de Paris, celle-là même qui, en 1866, avait inscrit dans ses statuts qu’elle n’admettait aucune communication sur l’origine du langage ; en 2004, l’un d’entre nous a présenté, dans une séance de cette Société, une communication sur La langue unique et l’hypothèse de Ruhlen. Le Collège de France a invité Luigi Cavalli Sforza à donner des cours entre 1981 et 1990, en a publié un ouvrage dans ses travaux (Gènes, peuples et langues), a organisé, en 2002, un Colloque international sur l’Origine et évolution des langues : approches, modèles, paradigmes.

Le CNRS et l’European Science Foundation ont soutenu les programmes OHLL (Origine de l’Homme du Langage et des Langues) et sa poursuite avec OMLL (Origins of Man, Language and Languages), le projet européen Hand to Mouth se poursuit (une partie d’entre nous ont fait et font partie de ces projets).

L’Université du Québec à Montréal organise10 cet été 2010 un Summer Institute in Cognitive Sciences consacré à l’Origine du langage.

Les maisons d’édition n’ont pas manqué d’exploiter le filon de l’EPL. Au niveau médiatique, on ne compte plus les articles et les numéros spéciaux de Scientific American, Pour la Science, La Recherche, Science et Avenir, Science & Vie, Philosophie Magazine consacrés à ce thème. Le documentaire de Bernard Favre, Les origines du langage, regroupant bon nombre d’acteurs internationaux du débat de l’EPL, a été en 2010 largement diffusé et rediffusé sur plusieurs chaînes de télévision. Parmi toute cette très inégale profusion de publications on pourrait citer deux ouvrages de référence The handbook of Human symbolic evolution (Lock, Peters, 1996) et Origins of language constraints on hypotheses (Johansson, 2005) qui présente presque exhaustivement les théories récentes de l’EPL, une monumentale histoire de la linguistique naturaliste par Piet Desmet (1996), un ouvrage collectif sur des aspects historiques de l’anthropologie (Blanckaert, 2001), un numéro thématique de Histoire Épistémologie Langage11 de 2007 consacré au Naturalisme linguistique et ses désordres et un essai théorique et critique, La Question de l’origine des langues (Auroux , 2007).

La conférence Origins and evolution of language and speech organisée sous l’égide de la New York Academy of Sciences en 1975 (Harnad et al., 1976) illustre bien cette réarticulation qui abandonne la problématique de la localisation temporelle et spatiale de l’origine des langues et la poursuite des recherches comparatistes. Les treize parties de ce congrès, qui étaient organisées en cadrages et discussions, ont précisé la cible du champ concernant la nature même du langage

                                                                                                               9 Pour une exégèse de ces textes voir Gayon (2002).  10 www. summer10.isc.uqam.ca  11 Histoire Épistémologie Langage, Le naturalisme linguistique et ses désordres. Tome XXIX, fascicule 2, 2007.  

Page 7: L’émergence de la parole - Gipsa-labjean-luc.schwartz/... · 2013. 9. 16. · 3 découvertes de l’Homme de Neandertal (1856) et de l’Homme de Cro-Magnon (1868), la mise en

7

(présentée par Noam Chomsky) et celle des protolangues ; ont été fouillés les aspects cognitifs de la communication et tout le pan neurologique (la latéralisation, et ses pathologies, désordres de la mémoire, aphasie) avec les approches parallèles de l’intelligence artificielle ; la paléobiologie et la paléoanthropologie comparative avec les grands singes ont été placées aussi dans le champ cognitif et neural. L’essentiel des thèmes ont fait part égale entre le langage et la production-perception de la parole (anatomie, phylogénie et biomécanique du conduit vocal). Il s’agit, dans le domaine linguistique, du remplacement du programme culturaliste qui avait atteint son apogée avec le structuralisme par un nouveau départ du courant naturaliste, mais sur d’autres bases que celles du XIXe siècle. On peut noter aussi que la parole figure en bonne place dans ce nouveau cadre, alors qu’elle avait été marginalisée, considérée comme une question bien secondaire voire située en dehors du champ de la linguistique (comme il n’y a pas si longtemps encore12 Milner et Hagège) par le structuralisme saussurien avec son dogme de la primauté et de la supériorité du langage sur la parole et par une phonologie (de Troutbetzkoy et Hjemslev à Dell13) dont la détermination de la forme ne s’est sentie en aucun cas liée par la substance (Boë, 1997ab).

Aujourd’hui, un revue de la bibliographie des travaux sur l’émergence de la parole et du langage révèle une grande quantité d’approches et de démarches méthodologiques très différentes. Dans les déclarations d’intentions et les prises de positions consensuelles (Hauser et al., 2002 ; Christiansen, Kerby, 2003), on retrouve la nécessité du travail pluridisciplinaire (figure 1), nécessité que nous avons bien ressentie et appliquée.

Figure 1. Les champs qui concourent aux recherches sur l’émergence de la parole et du langage : des données multiples, des protocoles et des méthodes d’investigation très différents

(d’après Christiansen et Kerby, 2003)

On ne peut vraiment pas considérer que cette nouvelle réarticulation présente toutes les caractéristiques d’un programme tel qu’il a été défini par Lakatos. Certes le naturalisme, renouvelé dans le contexte des sciences cognitives, de la neurophysiologie et de la génétique, est bien au centre de ces approches qui visent à décrire les relations entre les aspects biologiques et les fonctions langagières. Mais, on assiste à une accumulation de preuves avec appel à une multiplicité des domaines.

                                                                                                               12  Milner,  1983  :183  ;  Hagège,  1985  :171-­‐72  13  Dell,  1973-­‐1985  :  5,  49.  

Page 8: L’émergence de la parole - Gipsa-labjean-luc.schwartz/... · 2013. 9. 16. · 3 découvertes de l’Homme de Neandertal (1856) et de l’Homme de Cro-Magnon (1868), la mise en

8

Le noyau dur n’est pas formulé explicitement et les heuristiques positives et négatives ne sont pas toujours formalisées ni falsifiables. On a donc affaire à un domaine scientifique en émergence avec des faiblesses et, parfois, une certaine amnésie : « Most of what we know about language has been learned in the last three decades » (Bickerton, 1990 : 5). 2.3. En marge de la réarticulation

À l’évidence la Nouvelle synthèse14 qui associe génétique, archéologie et linguistique (Cavalli-Sforza, Ruhlen, Renfrew) ne s’inscrit pas dans cette réarticulation scientifique. Dans le domaine linguistique il s’agit d’une démarche comparatiste qui fait suite à la glottochronologie15 de Morris Swadesh (1952) en passant par les comparaisons multilatérales ou mass comparison16 de Joseph Greenberg (1954, 1987) pour aboutir aux mégalocomparaisons de Merritt Ruhlen. En 1994, celui-ci propose une démonstration visant à établir que toutes les langues du monde partagent la même origine : une langue mère parlée en Afrique, foyer des Hommes modernes, il y a environ 100 000 ans, avant une migration d’une partie d’entre eux vers le Moyen-Orient, l’Asie du Sud-Est et l’Océanie pour enfin atteindre l’Australie il y a plus de 40.000 ans. À partir d’une base de données, constituée en 1994 avec John Bengtson, pour 27 racines17 (les GE global etymologies) (mère, genou, cendres, nez, tenir à la main, bras, os, trou, chien, qui ?, femme, sucer, rester sur place, homme, penser à, quoi ?, deux, voler (dans les airs), bras, vulve, jambe, doigt, terre, jambe, poil, eau) et de leurs formes phonétiques18, avec en moyenne 24 synonymes par racine (par exemple pour K’OLA trou : aisselles, anus, arrière, arrière-garde, cachette, carquois, caverne, chatouiller un cochon fatigué pour le faire avancer, coude, creux, creuser, dos, en arrière, épaule, évider, fenêtre, fesses, fissure, fosse, hanche, incision, narines, partie arrière, poitrine, postérieur, ravin, reins, rivière, trou d'arbre, vallée) dans plus de 1300 langues réparties en 32 familles, Ruhlen montre que dans au moins 6 langues de chaque famille on retrouve la même forme phonétique pour chaque racine. Dans sa procédure d’établissement des similarités phonétiques, il ne tient pas compte des voyelles et il réduit, après équivalence, toutes les consonnes à 10 macroclasses19.

Mais pour que la démonstration soit complète, il aurait fallu montrer que les ressemblances observées n’étaient pas l’effet du hasard, c’est-à-dire en termes de preuve statistique tester l’hypothèse nulle comme le demandait James Hurford (2003) :

« As linguists like Larry Trask, Don Ringe and Lyle Campbell, to name but a few, loudly insist, no good answer has yet been given to the charge that the correspondences noted by the long-range reconstructionists are not above the chance level. In other words, no effort has been put into rejecting the null hypothesis. « (Hurford, 2003).

Nous avons réfuté la démonstration de Ruhlen : en utilisant un générateur de lexique ajusté sur ses paramètres nous avons montré que celui-ci avait 100% de chances de trouver des ressemblances entre les formes phonétiques de racines : trop d’équivalences phonétiques, trop peu de racines et

                                                                                                               14 Dans la déclaration d’intention, le programme OHLL était inscrit dans le cadre de la Nouvelle synthèse : « Un effort important a été accompli durant la dernière décennie dans les pays anglo-saxons pour intégrer les connaissances de ces trois disciplines, et l'archéologue britannique Colin Renfrew a désigné du nom de nouvelle synthèse cet intense effort de coopération. Les progrès accomplis aujourd'hui dans ce domaine dépassent ceux de tout le siècle précédent. Des recherches menées conjointement par des généticiens et des linguistes (Cavalli-Sforza, Greenberg, Ruhlen à l'Université de Stanford par exemple) ont ainsi montré, ces dernières années, que les apparentements génétiques des populations étaient proches des relations qui peuvent exister entre les langues du monde. Il existe, en effet, des corrélations significatives entre les distributions linguistique et biologique dans de nombreuses régions du monde (Afrique, Europe, Chine…). Il en résulte, dans le domaine proprement linguistique, de nouvelles propositions sur la typologie et la classification des langues. Les cadres élaborés à la fin du XVIIIème et au début du XIXème siècle par les comparatistes de la grande aventure indo-européenne ont littéralement éclaté […]. Force est de reconnaître, cependant, que la France n'a pas – ou peu – participé à cette "nouvelle synthèse" interdisciplinaire. » En pratique le projet français OHLL ne s’est pas développé dans ce cadre, si ce n’est pour en montrer les limites que ce soit au niveau linguistique ou génétique ; toutes les références à la Nouvelle synthèse ont disparu dans les présentations finales de OMLL (le prolongement européen de OHLL) à Rome, en décembre 2007.  15 Hymes (1973) et Auroux (2007 : 100) font remonter les prémices de la glottochronologie à Dumont d’Urville (1834) et Broca (1862). Il s’agit de la datation de la séparation des langues. Le programme glottochronologique a été abandonné faute de résultats probants : les mots ne sont pas des témoins archéologiques qui évoluent comme les éléments périodiques que l’on peut dater au carbone 14.  16 « Looking at […] many languages across a few words » plutôt que « at a few languages across many words » (Greenberg 1987: 23).  17 De manière inexpliquée les racines bras et jambe se retrouvent deux fois dans la liste. Contacté par l’un d’entre nous (LJB), Ruhlen n’a pas pu donner d’explication.  18 AJA BU(N)KA BUR CUN(G)A KAMA KANO KATI K’OLO KUAN KU(N) KUNA MAKO MALIQ’A MANA MENA MIN PAL PAR POKO PUTI TEKU TIKA TSAKU TSUMA AQ’WA. Les racines sont essentiellement mono ou bisyllabiques et comportent plus de 50% de /K/.  19 Avec encore des équivalences par macroclasses , par exemple /P B/ peuvent être assimilés à /M/ ou /T D/ ou /N/, qui constituent trois autres macroclasses.  

Page 9: L’émergence de la parole - Gipsa-labjean-luc.schwartz/... · 2013. 9. 16. · 3 découvertes de l’Homme de Neandertal (1856) et de l’Homme de Cro-Magnon (1868), la mise en

9

trop d’équivalences sémantiques ; les 27 racines finissent même par se réduire à quatre macro-racines (Boë, Bessière, Ladjili, Audibert, 2008).

L’origine des langues de Ruhlen se présente comme un ouvrage de vulgarisation incitant tous les lecteurs dénués de toute compétence linguistique à procéder eux-mêmes, crayon en main, à l’établissement des familles et à retrouver les racines originelles : « pas besoin d’un doctorat en linguistique, mais seulement du sens commun20 ». Ce type de démarche renvoie aux comparaisons lexicales pratiquées depuis la Renaissance et abandonnées par les comparatistes allemands qui opéraient sur la morphologie et la phonétique, de manière structurelle en considérant la langue comme un système21. Pour nous la démarche de Ruhlen est même en recul par rapport aux comparaisons de listes de mots effectuées par les géographes Conrad Malte-Brun (1810) et Adrian Balbi (1826) ou par le circumnavigateur Jules Dumont d’Urville (1834) qui en inféraient des informations sur le brassage des populations. Dans son Atlas ethnographique du globe, Balbi proposait une classification des peuples anciens et modernes d’après leurs langues en fonction des ressemblances de prononciation d’un lexique de 26 mots (soleil, lune, jour, terre, eau, feu, père, mère, œil, tête, nez, bouche, langue, dent, main, pied, un… dix) avec leurs prononciations comparées dans 700 langues :

« On classe tous les peuples d’après les parentés ou la différence qu’offre leurs langues respectives […]. Nous nous bornons à indiquer les peuples anciens et modernes des différentes parties du monde, dont les langues ayant une parenté bien prononcée entre elles, forment ce que nous appelons des familles et signalent des émigrations, des passages et des invasions, là même où manque entièrement l’histoire et où se taisent les traditions populaires » (Balbi, 1826, tome 2).

Et Auroux de tirer un sévère bilan de la méthode comparatiste utilisée par Ruhlen : « On comprend pourquoi Salmons, dès 1992, qualifiait ‘l’étymologie globale’ de ‘linguistique précopernicienne’ ; il s’agit d’un véritable retour en deçà de la révolution comparatiste aux méthodes contestées du XVIIIe siècle. Avec Ruhlen, la ‘comparaison multilatérale’ aboutit à un véritable fiasco dont l’étude fournit en quelque sorte le meilleur plaidoyer contemporain pour l’attitude de la Société de linguistique» (Auroux, 2007 : 107-108).

2.4. Enjeux et risques d’un dialogue pluridisciplinaire foisonnant

2.4.1. La contagion des idées scientifiques Les domaines pluridisciplinaires sont, par leur nature composite et par leurs traditions de

développement, très perméables à des données, des théories ou même de simples hypothèses non corroborées qui ont été élaborées en dehors de leurs propres champs d’investigation, surtout si elles viennent à l’appui de leurs propres théories (circularité des preuves). Comment circulent les idées et les théories développées dans tous ces champs ?

« Une idée née dans le cerveau d’un individu peut avoir, dans les cerveaux d’autres individus, des descendants qui lui ressemblent. Ces idées non seulement peuvent se transmettre, mais même en étant transmises à nouveau par ceux qui les reçoivent, elles peuvent, de proche en proche, se propager » (La Contagion des idées, 1996, pp. 7-8). Dan Sperber (1996) propose ainsi une épidémiologie des représentations. Il en considère deux

catégories. Les premières sont des représentations mentales privées : les croyances, les intentions, les préférences, etc. La seconde catégorie est celle des représentations publiques, beaucoup moins nombreuses : ce sont les images, les signaux, les textes qui sont transformés par le communicateur puis commuées par le destinataire en représentations privées. Les idées se transmettent et se transforment en passant d'un individu à un autre : « non pas de façon aléatoire, mais en direction de contenus qui demandent un effort mental moindre et qui entraînent des effets cognitifs plus grands ». C’est la tendance à optimiser le rapport effort/effet (Sperber et Wilson, 1986).

C’est ce qui explique à notre avis pourquoi certaines falsifications fonctionnent si bien : elles peuvent avoir des succès retentissants et durables tant elles ont été opérées pour correspondre aux préjugés culturels, pouvoir être acceptées facilement et propagées rapidement. C’est ainsi qu’en 1912, le crâne de l’Homme de Piltdown tombait à point nommé en Grande-Bretagne qui était

                                                                                                               20 Il faut quand même plus de sens commun pour mettre en évidence la même origine de certaines racines bien étudiées : « A method which scans only for phonetic resemblances, as multilateral comparison does, misses such well-known true cognates as French   cinq /Russian pjatj/ Armenian hing / English five (all easily derived by straightforward changes from original Proto-Indo-European *penkwe ‘five’), or French boeuf/English cow (from PIE *gwou-), French /nu/ (spelled nous) ‘we, us’/English us (from PIE *nes-; French through Latin xx nos, English us from Germanic *uns […]; none of these common cognates are visually similar. » (Campbell, 2003).  21  Les correspondances entre consonnes opérées par Ruhlen pour toutes les langues, dont les indo-européennes, mettent bien à mal les lois de Grimm pour cette famille.  

Page 10: L’émergence de la parole - Gipsa-labjean-luc.schwartz/... · 2013. 9. 16. · 3 découvertes de l’Homme de Neandertal (1856) et de l’Homme de Cro-Magnon (1868), la mise en

10

dépourvue de fossiles, il apportait la preuve du chaînon manquant, entre le singe et l’Homme, prévu par Darwin et de plus ce crâne devait contenir un cerveau volumineux, preuve d’intelligence ce qui étayait la théorie de la suprématie de la race blanche (Jay Gould, 1980, 1982 : 123-142 ; Thomas, 2002). Il a fallu attendre 40 ans pour que les sommités scientifiques britanniques et les responsables du British Museum reconnaissent que l’Eoanthropus Dawsoni, (du nom de son inventeur, Charles Dawson), n’était qu’une supercherie, un habile montage d’os à partir d’un crâne remontant tout au plus au Moyen Âge et d’une mandibule d’un jeune et récent orang-outan provenant de l’île de Bornéo.

Concernant l’émergence de la parole, nos travaux ont permis de vérifier (Boë, 2001) l’hypothèse selon laquelle certaines théories, très fragiles, mais très intuitives, c’est-à-dire à bon rapport effet/effort, ont pu pénétrer le module des représentations mentales privées, en quelque sorte le parasiter et alimenter par transmission les représentations publiques.

Ainsi continuent à se propager avec beaucoup de succès : – l’affirmation que nous réfutons selon laquelle un petit os, l’os hyoïde, serait un facteur clé à

l’origine de la parole, alors que tous les mammifères en possèdent un. L’existence de l’os hyoïde n’est pas un élément pertinent dans la discussion de l’émergence de la parole. Avancer que l’hyoïde est indispensable à l'élocution n’est pas plus pertinent que d’affirmer que la première vertèbre cervicale est indispensable à la station verticale puisque la grande majorité des mammifères est dotée de cette vertèbre bien que n’ayant pas tous acquis cette station verticale et une marche bipède ;

– la théorie de la descente du larynx se propose d’expliquer globalement et très simplement pourquoi les grands singes ne parlent pas, pourquoi Neandertal ne pouvait articuler que très lentement quelques voyelles peu différenciées et pourquoi le bébé ne génère pas de système vocalique bien formé dans ses premiers mois. Par sa généralité et sa simplicité cette théorie est un véritable cas d’école pour la contagion des idées : nous avons montré (Heim et al., 2002 ; Boë et al., 2002, 2002) que la comparaison de Neandertal avec l’Homme actuel ne présente en fait aucune descente du larynx. Notre proche cousin n’était vraisemblablement pas handicapé du conduit vocal, nous y reviendrons.

2.4.2. La circularité des preuves Pour établir sa théorie selon laquelle les Hommes de Neandertal ne pouvaient pas produire les voyelles cardinales des langues humaines /i a u/, Lieberman et Crelin ont choisi, en 1971, le crâne de l’Homme de la Chapelle-aux-Saints. Ce crâne, retrouvé en plusieurs morceaux, avait été reconstruit, en 1913, par Marcellin Boule qui considérait que les Néandertaliens étaient plus proches des grands singe que de l’Homme (figure 2), ce qui était le préjugé de l’époque. Par la suite il a été montré que la reconstitution effectuée par Boule était biaisée (Heim, 1986, 1989). Nous avons montré dans nos travaux que Neandertal était très proche de Sapiens, ce qui est admis de plus en plus actuellement (Patou-Mathis, 2006). Mais, jusqu’à maintenant, Lieberman (1984, 2007) n’en a pas tenu compte.

Figure 2. Neandertal tel que Marcellin Boule le représentait au début des années 1900 quand il reconstruisait le crâne de l’Homme de la Chapelle-aux-Saints (photo L.J. Boë) et une nouvelle reconstitution par Élisabeth Daynès

en collaboration étroite avec les anthropologues spécialistes de Neandertal (© 2009 Photo E. Daynès Reconstruction Atelier Daynès, Paris).

Page 11: L’émergence de la parole - Gipsa-labjean-luc.schwartz/... · 2013. 9. 16. · 3 découvertes de l’Homme de Neandertal (1856) et de l’Homme de Cro-Magnon (1868), la mise en

11

2.5. Des présupposés extrascientifiques Comme nous l’avons indiqué l’EPL est bien un domaine avec un arrière plan de croyances.

Ainsi l’Homme de Neandertal, considéré comme une espèce différente d’Homo sapiens, est au centre de vives controverses qui débordent du cadre purement scientifique. « La préhistoire est-elle toujours une science ? » s’interroge Sophie de Beaune :

« Savoir si oui ou non l’homme de Neandertal a utilisé les capacités langagières dont il disposait est une question qui sort des limites des sciences exactes. Les opinions se divisent sur cette question et les hypothèses font intervenir des présupposés d’ordre extrascientifique. On est là encore dans un domaine très subjectif où des arguments de l’ordre de la croyance s’opposent […] lorsqu’il s’agit de le défendre et de le réhabiliter. Dans un cas comme dans l’autre, on sent que les chercheurs ne défendent pas seulement une théorie scientifique » (De Beaune, 2007 : 16).

3. Épistémologie structurante

3.1. Les approches pull et push L’émergence de la parole et du langage est le résultat d’une conjonction remarquable entre : • l’existence d’un système auditif très sophistiqué et d’organes destinés à respirer, mastiquer et

déglutir ; • l’utilisation (exaptation22 : Gould, Vrba, 1982) et la spécialisation de ces organes comme

instrument vocal capable de produire, en coordination avec la respiration, des signaux sonores complexes ;

• l’émergence de capacités cognitives qui ont permis à l’espèce humaine : – de pouvoir apprendre à contrôler finement l’instrument vocal ; – de disposer d’un système de double compositionnalité (double articulation), le langage, lui

permettant, à partir de seulement quelques dizaines de sons, de générer plusieurs dizaines de milliers de mots et de pouvoir les composer en une infinité de phrases (générativité, créativité) ;

– d’associer arbitrairement du sens à chacun des éléments ainsi produits, le tout grâce à un système linguistique, la langue, partagé par un ensemble de locuteurs et d’auditeurs.

L’apprentissage de la parole nécessite une référence, une recopie, un mimétisme mais qui sont en en fait limités, car le caractère génératif inhérent au langage permet à l’enfant de produire de nouvelles combinaisons et des généralisations.

Nous n’aborderons pas la récursivité qui serait le propre du langage humain (Chomsky, 1980), car il est difficile d’en évaluer le bénéfice évolutionniste. La co-existence de capacités performantes d’apprentissage et de production-perception du son d’une part et d’autre part de capacités cognitives symboliques n’a sûrement pas suffi pour que l’Homme se mette à parler. Ces deux faisceaux de potentialités n’ont pas pu être, à eux seuls, à l’origine de ce bond cognitif. On peut faire l’hypothèse que ce sont des motivations, des objectifs sous contrainte qui ont permis à l’Homme à tirer profit de cette conjoncture, fruit de l’évolution.

La question posée est celle de la possibilité de l’émergence de la parole et du langage à partir d’un état initial dans lequel le langage est absent. En laissant de côté la question sous-jacente de l’époque de cette émergence dans la phylogenèse, nous proposons une possible ligne de partage entre les approches que Jean-Luc Schwartz (2010) appelle pull et push croisée dans une dichotomie entre fonction et substrat (figure 3).

Cette classification possible s’appuie sur un modèle darwinien, dans lequel si émergence il y a, celle-ci suppose à la fois un état préalable, un processus de génération de variétés génétiques, un processus de sélection et un processus de reproduction. Dans ce contexte, les approches que nous nommons pull sont celles qui mettent l’accent sur le contenu fonctionnel de ce processus de sélection : quelles sont les meilleures variétés ? Cette question en appelle une autre, plus générale : à quoi sert le langage et pourquoi cette spécialisation secondaire évoluée (apomorphique) a-t-elle été retenue par la sélection évolutive ? Les approches pull sont donc celles qui visent à tirer le langage d’un objectif fonctionnel majeur, qu’il s’agit de déterminer.

                                                                                                               22   Dans ce cas d’exaptation, un organe non modifié est réutilisé à l'identique pour une fonction manifestement non sélectionnée à l'origine.  

Boe Louis-Jean� 15/6/10 11:29Mis en forme: Couleur de police : Rouge

Boe Louis-Jean� 15/6/10 11:06Supprimé:  

Page 12: L’émergence de la parole - Gipsa-labjean-luc.schwartz/... · 2013. 9. 16. · 3 découvertes de l’Homme de Neandertal (1856) et de l’Homme de Cro-Magnon (1868), la mise en

12

Les approches que nous appelons push sont centrées sur l’état préalable pour lequel il faut déterminer, du mieux possible, les propriétés principales : avant le langage, qu’y a-t-il ? Plus précisément, de quel pré-langage disposaient les primates non humains, ce qui pourrait fournir des éléments essentiels précurseurs au langage ? Les approches push se centrent donc sur les continuités du langage avec des fonctions, mécanismes et ingrédients préalables, plutôt que sur la discontinuité évolutionniste majeure qu’est l’apparition du langage. Elles se demandent ce qui peut avoir poussé des Primates supérieurs (hominidés) vers l’émergence de la parole et du langage. Elles évitent la question, pourtant essentielle, d’un possible processus de sélection, pour mieux relier le langage à d’éventuelles formes antérieures (proto langage).

3.2. Les motivations et les hypothèses pull Certaines d’entre elles avaient été avancées au XIXe et même bien avant. Elles s’inscrivent pour l’essentiel dans le cadre darwinien : les passions avancées dans les siècles précédents comme moteurs de la parole sont devenues des besoins, des fonctions multiples à avantages adaptatifs :

• l’extension, la structuration et le maintien des relations sociales pour augmenter les chances de survie (moyens de coopération, nouement des alliances, organisation politique, prestige, resserrement des liens…) non seulement pour de petits groupes, mais aussi pour de larges populations ;

• le choix des partenaires sexuels (augmentation de la capacité de persuasion et de séduction) ;

• la possibilité de transmettre des informations (mémoire) et de mieux éduquer les enfants ; • la pratique de la chasse (un langage gestuel est moins bien adapté avec les armes en main) ; • la motivation technique nécessitant un apprentissage complexe et une planification de la

chaîne opératoire : – pour la fabrication des outils23, leur diversification et leur fonction sémiotique et socio-

culturelle: transport des matériaux, ateliers de débitage, microlithes, outils à os, lames, aiguilles (que l’on peut étudier par l’archéologie expérimentale ; la transmission des techniques de débitage et leur diffusion dans tout l’ancien monde ;

– la construction de sites complexes; • la possibilité de pouvoir « disposer de la capacité de tout un chacun de se représenter les

états mentaux d’autrui ». Toutes ces motivations peuvent être regroupées sous le vocable de coopération sociale et

technique, de transmission de représentations mentales. Ambrose (2001) ; Bickerton (2003) ; Dunbar (1993, 1996) ; Gärdenfors (2003) ; Harnad, Steklis, Lancaster (1976) ; Hockett, Ascher (1964) ; Johansson (2005) ; Jablonski, Aiello, (1978) ; King (1996) ; Landau, 1991 ; Leroi-Gourhan (1964) ; Lock, Peters (1999) ; Montagu (1976) ; Orrigi (2001) ; Sperber, Orrigi (2005) ; Premack (2004) ; Schepartz, 1993 ; Schick, Toth (1993) ; Sperber (2000), Sperber, Origgi, 2005 ; Stoczkowski, W. (2001) ; Tomasello (1999) ; Tomasello et al. (2005) ; White (1999) ; Wildgen (2004) ; Wynn (1999).

En fait, bon nombre d’arguments qui plaident en faveur de l’émergence de la parole peuvent être contredits en partie : certains mammifères chassent en groupe efficacement, élèvent leur progéniture, certes pendant un temps très court, utilisent des outils, certes rudimentaires, coopèrent, arrivent bien à se reproduire et possèdent une bonne représentation des alliés, des concurrents et des prédateurs.

On peut se demander avec Rastier (2006) si, dans certains cas, il ne s’agit pas de petits romans anthropologiques, par ailleurs très prisés par les médias : le langage permettrait ainsi aux chasseurs de s’assurer de la fidélité de leurs femmes en leur absence (Coon, 1962 : 87-88), servirait à raconter des histoires (l’Homo inventans, McNeil, 1996) par exemple pour assurer la paix dans des tribus dominées par des mâles belliqueux (l’Homo narrans, Victorri, 1999, 2005), ou encore à dire du mal des absents tout en resserrant les liens du groupe (grooming and gossip hypothesis, Dunbar, 1996), à influer sur le comportement des congénères et s’assurer un prestige social en communiquant, par exemple, des informations a priori improbables, ou pour faire de la politique (Dessales, 2001 ; Dessales et al., 2006 ). Il est vrai que dans l’état des connaissances ces

                                                                                                               23  La trousse à outil se révèle bien variée : billots, enclumes, meules, polissoirs, galets percuteurs, couteaux etc.  

Boe Louis-Jean� 16/6/10 17:12Supprimé: ,

Page 13: L’émergence de la parole - Gipsa-labjean-luc.schwartz/... · 2013. 9. 16. · 3 découvertes de l’Homme de Neandertal (1856) et de l’Homme de Cro-Magnon (1868), la mise en

13

propositions ne peuvent être ni corroborées ni infirmées, mais tout au plus jugées sur leur logique et plausibilité. Si l’on se situe dans une démarche scientifique poppérienne pour laquelle « le critère de la scientificité d’une théorie réside dans la possibilité de l’invalider, de la réfuter ou encore de la tester » (Popper 1985 : 65), on peut peut-être s’interroger sur leur pertinence. Ainsi, un objectif majeur des recherches à venir sera de développer des travaux permettant d'obtenir des éléments de preuve, directe ou indirecte, en faveur ou en défaveur de ces différents scénarios ou de nouveaux scénarios à élaborer.

3.3. Les théories push : substrat et fonction Venons-en maintenant à ce que nous avons appelé les théories push c’est-à-dire celles qui

s’attachent à la recherche de l’état préalable à l’émergence de la parole. L’objectif est de spécifier le plus précisément possible les continuités entre l’animal (et bien évidemment, particulièrement le primate non humain) et l’homme, en poussant le plus loin possible la recherche de ce que l’on peut supposer être des prérequis, dont on cherche la présence ou l’absence chez nos prédécesseurs dans l’évolution. On peut à ce niveau, en considérant la littérature foisonnante des 50 dernières années, proposer une seconde dichotomie, entre prérequis des fonctions cognitives et prérequis des substrats (équipement génétique, appareil d’audition et de production de la parole) et soit de façon très imagée, entre ce que les informaticiens désignent sous les vocables bien connus de software et hardware. La figure 3 présente de façon très schématisée les interactions qui ont peut-être conduit à l’émergence de la parole et du langage.

Figure 3. L’émergence de la parole est poussée par des mécanismes et ingrédients préalables et tirée par

des motivations de coopérations sociales et techniques tout en acquérant des bénéfices évolutifs.

3.3.1. Push hardware : le gène FOXP2 Les troubles spécifiques du développement du langage (TDSL) font partie des dossiers qui

alimentent les recherches et les controverses sur la faculté spécifique du langage, sa possible dissociation avec les autres capacités cognitives et son innéité. Avec la thèse du noyau universel des grammaires humaines, le langage n’est plus considéré comme un comportement, il est associé à un organe et donc à un ou plusieurs gènes :

« La grammaire universelle et la grammaire de l'état stationnaire [c’est-à-dire final] sont réelles. On s'attend à les trouver physiquement représentées dans le code génétique et le cerveau adulte respectivement, avec les propriétés mises au jour par notre théorie de l'esprit. » (Chomsky, 1980, 1985, 80-81). « S’il y a un instinct de langage, il faut qu’il existe physiquement quelque part dans le cerveau et que les circuits du cerveau aient été préparés à jouer leur rôle par les gènes qui les ont construit. » (Pinker, 1994, 299).

Page 14: L’émergence de la parole - Gipsa-labjean-luc.schwartz/... · 2013. 9. 16. · 3 découvertes de l’Homme de Neandertal (1856) et de l’Homme de Cro-Magnon (1868), la mise en

14

 À la suite d’une première publication concernant des troubles du langage sur trois générations

d’une même famille, est évoqué la relation entre un gène et le type de dysphasie observée (Gopnik, 1990). Cinq ans plus tard sont associés, pour la première fois, la mutation d’un gène (FOXP224, pour forkhead box P2, chromosome 7) et des troubles de l’apprentissage de la morpho-syntaxe dans une famille anglaise, la famille KE, 30 personnes, portant sur 15 membres étalés sur 3 générations (Vargha-Khadem et al., 1995). La transmission du déficit est de type monogénétique et autosomique : le père ou la mère peuvent transmettre, de génération en génération, le déficit à leurs enfants (1 chance sur 2). Les auteurs soulignent bien qu’il ne s’agit pas de la mise en évidence du gène de la grammaire, mais on assiste quand même à un emballement scientifico-médiatique. La tentation est trop grande : la théorie de Chomsky concernant l’existence d’une grammaire universelle serait génétiquement prouvée. FOXP2 n’échappe pas à ce phénomène médiatique de nombreuses fois observé et qui tend à extrapoler les avancées génétiques de manière trop simplifiée, voire inexacte (Gouyon et al., 1997 ; Jordan, 2000).

Par la suite, les études approfondies de Faraneh Vargha-Khadem et de son équipe ont mis l’accent sur l’aspect dysarthrique du déficit : les troubles de la famille KE ne se limitent pas à des déficits de langage. Les sujets atteints éprouvent de graves difficultés à contrôler des mouvements coordonnés et complexes (dyspraxie buccofaciale de la mandibule et de la lèvre supérieure) provoquant aussi une production de parole altérée. De études par imagerie cérébrale chez des membres KE atteints, ainsi que d’autres patients révélent des anomalies fonctionnelles dans des régions corticales liées au langage (Liégois et al., 2002, 2003 ; MacDermot et al., 2005). En fait, l’apprentissage vocal (le processus phonatoire), qui constitue une composante de la production de la parole, se retrouve aussi chez des espèces animales, d’où l’idée d’identifier FOXP2 chez des oiseaux chanteurs qui sont capables de modifier des vocalisations innées pour en créer de nouvelles. Le diamant mandarin, est un oiseau qui génère à l’âge adulte pratiquement toujours le même chant. Il a été montré que, chez les jeunes mâles, l’expression de FOXP2 augmente significativement pendant la période d’apprentissage vocal dans une aire appartenant au circuit cérébral impliqué dans l’apprentissage du chant (Haesler et al., 2004, 2007). Si l’on diminue expérimentalement le niveau d’expression de FOXP2 on observe chez les oiseaux traités une diminution de la capacité d’imitation, une moindre capacité à enchaîner des sons et un chant instable à l’âge adulte ce qui confirme son influence au niveau de l’apprentissage et de la production des sons (Haesler et al., 2007).

Il semblerait que FOXP2 soit un gène qui a très peu muté au cours de l’évolution (Enard et al., 2002, figure 4) : depuis 75 millions d’années, date estimée de la séparation de la souris avec la lignée des singes (rhésus, orang-outan, chimpanzé) et de l’homme, seulement deux mutations non-silencieuses (c’est-à-dire qui entraînent une modification d’un acide aminé) se sont produites. L’hypothèse la plus probable serait que, outre le rôle de FOXP2 dans le développement embryonnaire de circuits cérébraux sous-jacents au langage, ce gène soit également impliqué à un stade plus tardif dans les aptitudes sensori-motrices. Il reste notamment à préciser si FOXP2 est important pour la production motrice ou pour l’apprentissage moteur et dans quelle mesure ces déficits de production peuvent se répercuter sur l’apprentissage du langage lui-même. Le débat s’est donc repositionné : il n’est plus question du gène de la grammaire, mais les chercheurs disposent maintenant d’un point d’entrée sur la compréhension des mécanismes neuromoléculaires qui influencent l’acquisition du langage et de la parole et d’autres gènes influençant le langage seront peut-être découverts :

« Further advances in comparative genomics, expression profiling and, in particular, identification of susceptibility factors in developmental language disorders should allow the discovery of language-related genes other than

                                                                                                               24 « La caractéristique commune des protéines FOX est la forkhead box, petite chaîne de 80 à 100 acides aminés formant un motif qui se lie à l’ADN […] élément capital qui permet aux protéines FOX de réguler l’expression de gènes cibles […]. Chez la famille KE, c’est le domaine liant l’ADN du FOXP2 qui est muté chez les sujets atteins de troubles de la parole et du langage.» (Marcus, Fisher, 2004 :6). FOXP2 est un acteur de transcription qui pourrait réguler le développement ou le fonctionnement de circuits distribués dans diverses régions du cerveau, incluant le cortex, le striatum, le thalamus et le cervelet.  

Page 15: L’émergence de la parole - Gipsa-labjean-luc.schwartz/... · 2013. 9. 16. · 3 découvertes de l’Homme de Neandertal (1856) et de l’Homme de Cro-Magnon (1868), la mise en

15

FOXP2. » (Fisher, Marcus, 2006 : 9)

Figure 4. FOXP2 : mutations silencieuses et mutations avec remplacements de nucléotides (en gris), pour la phylogénie des primates (par exemple pour la souris 1/131 correspond au cours du temps à 1 mutation avec remplacement de nucléotide et 131 mutations silencieuses) (d’après Enard et al., 2002). Depuis cette publication il a été constaté que l’Homme actuel et

Neandertal partagent le même gène FOXP2 (Krause et al, 2007). FOXP2 existe chez les oiseaux et les crocodiles (cousins des oiseaux)

3.3.2. Push software : prérequis des fonctions cognitives Avec le volet push software, nous abordons là le thème très riche de l’environnement cognitif

susceptible d’avoir joué un rôle dans l’apparition du langage, soit parce qu’il en aurait fourni les conditions minimales et donc les prémisses en quelque sorte, soit parce qu’il constituerait un système de contraintes ayant jusqu’à un certain point façonné les formes du langage humain. Tout naturellement s’est donc posé la question de savoir si cet environnement cognitif est partagé par les animaux (et particulièrement les Primates) et Homo sapiens. Sans aborder dans le détail les hypothèses et les travaux, très nombreux, qui ont enrichi la littérature, dans les 20 dernières années, mentionnons quelques lignes de force.

D’abord, pour parler il faut entendre : le système auditif humain est très sophistiqué, mais ne l’est pas plus que les systèmes auditifs d’un très large ensemble d’espèces mammifères ; les continuités sont ici de toute évidence la règle et non l’exception. Les capacités d’intégration multisensorielle (Ghazanfar et al., 2005) et de catégorisation perceptive (Kuhl, Miller, 1975 ; Kluender et al., 1987) ne semblent pas plus discriminantes.

Il faut ensuite produire des sons avec le conduit vocal et si l’hypothèse d’une spécificité humaine a fait son chemin, elle est selon nous obsolète.

C’est donc du côté de capacités cognitives intégratives plus complexes que se sont tournés les chercheurs, notamment dans deux directions. D’abord, la parole et le langage supposent résolus des problèmes complexes d’appariement entre action et perception, pour la compréhension des actions de l’autre, comme pour l’acquisition et l’apprentissage du contrôle d’actions complexes. Les neurones miroir (voir le chapitre par Schwartz et al. dans ce même numéro) ont été proposés, depuis Rizzolatti & Arbib (1998), comme le système neuronal par excellence permettant de relier dans le cerveau perception et action, de fournir ainsi un noyau crucial dans l’évolution vers le langage. Les neurones miroir, répondant dans le cerveau du singe à la fois lors de la production et de la perception de gestes de la main et des mimiques la face, ont été par la suite considérés par Arbib (2005) comme le pivot d’une séquence phylogénétique ayant conduit à des capacités d’imitation, d’apprentissage de séquences simples puis complexes, étape initiale vers l’apparition de systèmes de communication sophistiqués, jusqu’à la bascule vers des protolangages alliant indépendance de la substance et de la forme et séquentialité des actions, constituants intrinsèques de la spécificité du langage humain.

Ensuite (et en lien étroit avec l’item précédent) c’est du côté des capacités communicatives qu’on peut se tourner. Les recherches sur ces capacités pour les espèces animales sont bien entendu légion. En relation avec l’apparition du langage, les enjeux principaux sont ceux de la sophistication des systèmes

Page 16: L’émergence de la parole - Gipsa-labjean-luc.schwartz/... · 2013. 9. 16. · 3 découvertes de l’Homme de Neandertal (1856) et de l’Homme de Cro-Magnon (1868), la mise en

16

de communication animale chez les Primates, et notamment de la question de la primauté de la main ou de la voix. Les gestes communicatifs sont attestés chez de nombreuses espèces de singes : gestes de menace (Meguerditchian, Vauclair, 2006), gestes de désignation ou de pointage (Hopkins, Leavens, 1998 ; Leavens, 2004) ; mais certaines espèces de singes semblent également disposer de systèmes de communication vocale, notamment à travers les cris d’alerte des singes vervets (Cheney, Seyfarth, 1990), distinguant trois types de prédateurs, l’aigle qui vient du ciel, le léopard qui accourt et le serpent caché dans le sol. Un débat s’est instauré entre primatologues pour estimer lequel de ces deux systèmes de communication, gestuelle et/ou orale, fournirait le précurseur le plus plausible au langage humain. La communication gestuelle semble dotée de bonnes propriétés de contrôle intentionnel et de spécialisation fonctionnelle (flexibilité) qui en font par excellence un système de communication sociale puissant (Corballis, 2003). D’autre part, ce système est naturellement prédisposé à contenir des capacités référentielles, puisqu’un geste peut renvoyer par ses propriétés intrinsèques à des éléments du monde extérieur (iconicité). Le pointage en fournit un point de départ évident, permettant au singe d’orienter l’attention vers l’objet désigné (Leavens, 2004). Mais la communication vocale n’est pas sans argument. Contrairement aux visions initiales, elle n’est pas totalement dépendante d’un système de contrôle émotionnel déclenchant des comportements réflexes. Elle apparaît au contraire de plus en plus comme complexe, flexible et tactique, c’est-à-dire contrôlée, jusqu’à un certain point, en fonction de l’objectif de communication (Slocombe, Zuberbühler, 2005 ; Arnold, Zuberbühler, 2006 ; Lemasson dans ce numéro). Elle fournit une continuité de moyens avec la parole, qui ont conduit à la théorie Frame-Content de MacNeilage (1998) proposant que le système de mastication ait pu fournir un système précurseur naturellement adapté pour la modulation des vocalisations et, partant, la génération de séquences de type consonnes-voyelles qui pourraient être le point de départ de la naissance de la syllabe et plus largement de la phonologie. Une synthèse de cette approche est développée autour de la théorie Vocalize to Localize (Abry et al., 2004, 2009).

Enfin, au-delà de fonctions de communication sociale telles que celles que nous venons d’aborder, il est possible de se demander si ce n’est pas dans un niveau de communication plus profond que le langage a été puiser ses racines. Les recherches sur la théorie de l’esprit, la capacité des humains à se projeter dans le cerveau de l’autre pour chercher systématiquement à y déchiffrer des intentions, ont conduit à questionner l’existence de ce type de mécanismes dans le cerveau des singes (Premack & Woodruff, 1978), et plus globalement à évaluer les différences entre les capacités d’interaction sociale entre primates non humains et Homo sapiens (Orrigi, 2001 ; Sperber, Orrigi, 2005). Dans un article récent, Tomasello et al. (2005) font l’hypothèse que la différence cruciale réside dans l’intentionnalité partagée, c’est-à-dire dans la capacité non seulement à pouvoir lire dans le cerveau du partenaire, mais également à connaître la valeur d’une action partagée et donc à partager des états mentaux, étape cruciale vers l’émergence et l’évolution de mécanismes de cognition culturelle sophistiqués, dont le langage ferait partie.

4. Notre analyse d’un cas d’école : morphologie du conduit vocal et contrôle de la production de la parole  

Pour parler, il faut disposer, pour le moins, d’un système phonatoire qui génère une source sonore grâce à la vibration des cordes vocales situées dans le larynx et d’un conduit vocal qui modifie les caractéristiques de cette source pour produire une succession de sons. Le conduit vocal peut être considéré comme un tuyau qui s’étend des cordes vocales aux lèvres avec une bifurcation possible par les fosses nasales (branchées par l’abaissement du velum). Ce tuyau est essentiellement limité par des parties molles (lèvres, langue, paroi pharyngale) dont la configuration dépend de la morphologie crânienne et de la position du rachis par rapport à celle-ci.

Le contrôle de ce conduit consiste pour l’essentiel à gérer la configuration du tuyau, par le jeu des articulateurs (mandibule, langue, velum, lèvres), en contrôlant notamment l’ouverture aux lèvres, et la position et la dimension d’une zone de rétrécissement ou d’occlusion qui peut se déplacer du pharynx à la zone dento-alvéolaire. Dans cette tâche, la langue joue un rôle essentiel. Ensuite il faut synchroniser, au cours du temps, ce contrôle du conduit vocal avec la présence/absence de vibration des cordes vocales. Est ainsi généré un continuum sonore dans lequel il est possible d’identifier une suite de syllabes constituées de voyelles et de consonnes.

Page 17: L’émergence de la parole - Gipsa-labjean-luc.schwartz/... · 2013. 9. 16. · 3 découvertes de l’Homme de Neandertal (1856) et de l’Homme de Cro-Magnon (1868), la mise en

17

Nous allons donc présenter dans cette dernière section les éléments d'un dossier sur le contrôle du conduit vocal, que nous avons ouvert depuis des années, et que nous traiterons en suivant le fil de la classification que nous venons de proposer. Nous y observerons l'existence de fortes continuités (éléments push), tant au niveau du substrat architectural et génétique (hardware) que des capacités fonctionnelles (software). Ces continuités nous permettront de préciser où pourrait s'être opérée la séquence phylogénétique majeure qui pourrait avoir tiré vers l'émergence de la parole : au niveau de la prise sous contrôle du système de mastication-déglutition et de son investissement par un système de modulation vocale, fournissant un point d'entrée vers la naissance des syllabes (alternances de consonnes et de voyelles) et la phonologie.

4.1. Hardware génétique : les gènes HOX Dans l’ontogenèse de l’embryon humain, il existe une organisation pour la mise en place des

différents tissus qui le constituent. La découverte des gènes HOX et non HOX, en 1978, chez la mouche drosophile, puis chez tous les mammifères indique bien que ces gènes architectes étaient présents au cours de l’évolution. À partir des 15-20 premiers jours qui suivent la fécondation (Couly et al., 1993 ; Couly et al., 2002), ces gènes sont responsables de la construction embryonnaire (figure 5) et déterminent l’organisation antéropostérieure et dorso-ventrale de l’embryon, la mise en place de la base du crâne, de la tête et du corps. Ces gènes interviennent, en particulier, pour la croissance osseuse de la tête et du cou, charpente du conduit vocal.

La synthèse de ce développement (Benoît, 2001, 2008) nous permet de disposer des grandes lignes de l’ossification de la tête, de l’os hyoïde, et du cou. Les gènes non HOX (répartis dans les 46 chromosomes) sont responsables de la mise en place des éléments nécessaires à l’ossification membraneuse de la partie antérieure et supérieure de la tête et de la partie antérieure de la mâchoire. Les gènes HOX (répartis dans 4 chromosomes) sont eux responsables de l’ossification enchondrale de la partie postérieure du crâne (l’occipital), de la base du crâne, de l’os hyoïde, du rachis cervical (les vertèbres C1 à C7) et du reste du squelette post crânien. Afin de visualiser les territoires de l’expression des gènes du développement nous avons tracé une limite passant dans le plan sagittal médian par le point lambda (à la rencontre des sutures interpariétale et occipito-pariétale), la crête synostosique antérieure du sphénoïde, la projection sur ce plan du ligament sphéno-mandibulaire au niveau de la lingula et la limite entre le corps de l’os hyoïde et les grandes cornes (figure 5).

 

Page 18: L’émergence de la parole - Gipsa-labjean-luc.schwartz/... · 2013. 9. 16. · 3 découvertes de l’Homme de Neandertal (1856) et de l’Homme de Cro-Magnon (1868), la mise en

18

Figures 5. L’expression des zones des gènes HOX non HOX. Représentation schématique de la migration et de la destination des cellules des crêtes neurales. Représentation schématique d’après Charrier, Creuzet, 2007).

Les zones d’influence des gènes HOX et non HOX sur les structures osseuses de la tête et du cou (d’après R. Benoît, 2001; 2008).

Ainsi, la disposition anatomique de la base du crâne, d’une partie de la mandibule, du rachis cervical, de l’os hyoïde et donc du larynx est contrôlée par l’expression des gènes HOX. Depuis le passage à la station verticale cette morphologie a vraisemblablement peu changé.  4.2. Hardware anatomique Une fois la bipédie acquise, il y a environ 4 millions d’années, on peut considérer que le larynx

de nos prédécesseurs et proches cousins pouvait déjà occuper la même position que chez l’Homme actuel. En revanche, ce qui a nettement changé chez Homo sapiens c’est la position antéro-postérieure de la face qui a considérablement reculé pour se loger sous le crâne dans l’espace provoqué par la bascule occipitale. De plus (Granat, 2000), le déplacement du tiroir dentaire par rapport à la base osseuse a fait apparaître le menton (figure 6).

À partir de la géométrie du conduit vocal, il est possible d’en calculer les potentialités acoustiques. Il faut d’abord en déterminer les limites : l’extrémité des lèvres correspond aux bords alvéolaires du maxillaire et de la mandibule, la paroi pharyngale est bornée en arrière par la partie antérieure du rachis. Pour les cordes vocales, il existe aussi des limites qui permettent de les localiser : en effet l’ensemble constitué par l’os hyoïde (support de la langue et point d’attache des muscles abaisseurs de la mandibule) et le larynx auquel il est suspendu est positionné dans le cou, sous le plan mandibulaire et au dessus de la 7e vertèbre cervicale qui en constitue la limite inférieure. Les cordes vocales, pour un sujet masculin adulte, se situent au regard de la 5e ou 6e vertèbre cervicale (une vertèbre au dessus pour un sujet féminin) (figure 7).

Page 19: L’émergence de la parole - Gipsa-labjean-luc.schwartz/... · 2013. 9. 16. · 3 découvertes de l’Homme de Neandertal (1856) et de l’Homme de Cro-Magnon (1868), la mise en

19

Figure 6. Le conduit vocal et sa position par rapport à la morphologie du crâne, de l’os hyoïde et du corps des

vertèbres cervicales (Xérographie d’un sujet masculin, adulte, document Denis Autesserre, Hôpital de la Timone, Marseille).

Figure 7 : Les limites osseuses et cartilagineuses dans lesquelles s’insèrent les parties molles du conduit

vocal : à l’avant des incisives les lèvres, le palais dur, la mandibule, la partie antérieure du rachis cervical et sa 7e vertèbre, la glotte (intervalle entre les cordes vocales) entre les cartilages thyroïde et cricoïde (D’après

Pernkopf et Acklands DVD of Human Anatomy, Head and neck, 2003.

Les parties molles ne se fossilisent pas, mais avec le crâne et le rachis d’un même fossile il est possible de reconstruire les limites de son conduit vocal. Malheureusement on ne dispose qu’exceptionnellement de ces parties osseuses pour un même fossile. C’est le cas pour les néandertaliens de la Ferrassie et de la Chapelle-aux-Saints et de plusieurs fossiles du palélolithique supérieur (Cro Magnon, Saint Germain la Rivière, Chancelade, Cap Blanc), pour l’Homo ergaster WT 15000, un adolescent du Kenya (1,5 Ma), on dispose des vertèbres C6-C7 qui permettent de proposer la reconstruction d’un rachis plausible.

L’os hyoïde (Granat et al., 2006 ; Boë et al., 2006) est un élément du squelette très fragile, de petite taille et n’étant en connexion avec aucun autre os, il disparaît très vite lors de la fossilisation. Seulement quelques unités ont été mises au jour pour :

• deux néandertaliens : à Kébara, Mont Carmel en Israël (60 ka) et un autre, dans le site d’El Sidron en Espagne (43 ka), tous deux très peu différents de ceux d’hommes actuels (Arensburg, 1991 ; Arensburg et al., 1989 ; Rodriguez et al., 2003 ) ;

• plusieurs pré-néandertaliens, dans le site la Sima de los Huesos, en Espagne (au moins 530 ka), avec les caractéristiques d’homme moderne (Martinez, 2008) ;

• un Australopithecus afarensis, dans le site de Dikika en Éthiopie (3,3 Ma), pour une enfant de 3 ans ; l’os ressemble plutôt à celui d’un chimpanzé qu’à celui d’un humain (Alemseged et al., 2006 ).

Page 20: L’émergence de la parole - Gipsa-labjean-luc.schwartz/... · 2013. 9. 16. · 3 découvertes de l’Homme de Neandertal (1856) et de l’Homme de Cro-Magnon (1868), la mise en

20

Pour un fossile, l’étude de cet os oriente vers le classement de l’espèce et permet de mieux positionner l’ensemble hyoïdo-laryngal si l’on souhaite reconstruire son conduit vocal.

Nos études ont porté entre autres sur le rapport hyoïde, mandibule rachis au cours de la phylogenèse et nous ont permis de proposer des reconstructions de différents hommes fossiles du genre Homo (figure 8).

Figure 8. Conduits vocaux de fossiles Néandertaliens : Amud (40 à 50 ka, Israël), Homme de la Ferrassie (72 ka),

Skuhl V (Homme anatomiquement moderne, 90 ka , Israël), reconstruits avec placement de l’os hyoïde (d’après Granat, et al., 2006 ; Boë et al. 2006) et d’un Homme actuel

(remarquer la position différente de la face et l’apparition du menton).

4.3. La théorie de la « descente du larynx » au cours de la phylogenèse En 1971, Philip Lieberman et Edmund Crelin ont surpris les paléontologues, les anthropologues,

tout comme les spécialistes de parole, par leur reconstitution du conduit vocal de l’Homme de la Chapelle-aux-Saints, un Néandertalien présentant un crâne et une mâchoire relativement bien conservés. Ils ont positionné l’os hyoïde et le larynx beaucoup trop haut rendant d’ailleurs difficile l’abaissement de la mandibule et donc la mastication (Du Brul, 1976 : 641-642) :

« Crelin also made a serious mistake in positioning the larynx […]. But the largest problem in the reconstruction by Crelin and Lieberman lay in the position of the hyoid, a small bone above the larynx to which the tongue muscles attach. As reconstructed, Neanderthals were not only unable to talk, various anthropologists and anatomists observed, they were also unable to swallow or open their mouths. » (Trinkaus, Shipman, 1993 :354–355).

Une meilleure connaissance de la génétique, de l’embryologie, de l’anatomie et de la biomécanique permet de proposer une disposition anatomiquement vraisemblable (figure 9).

Page 21: L’émergence de la parole - Gipsa-labjean-luc.schwartz/... · 2013. 9. 16. · 3 découvertes de l’Homme de Neandertal (1856) et de l’Homme de Cro-Magnon (1868), la mise en

21

Figure 9. Homme de Neandertal : sur un schéma de représentation cranio-cervico-faciale l’os hyoïde a

été positionné à gauche par Lieberman et Crelin (1971) dans une position peu plausible ; à droite, sur le même schéma, il a été replacé en tenant compte des critères anatomiques

(d’après Granat, Peyre, 2007 ; Granat et al., 2007).

À partir de cette reconstruction erronée, Lieberman et Crelin ont proposé une démonstration acoustique que l’on ne peut pas considérer comme acceptable (Heim et al., 2002 ; Boë et al., 2002 ; Boë et al., 2007) selon laquelle Neandertal ne pouvait produire les voyelles /i a u/ présentes dans la quasi totalité des langues du monde. C’est sur ces bases anatomiques et acoustiques peu acceptables que Lieberman et Crelin ont fondé la théorie de la descente du larynx selon laquelle, au cours de l’évolution, il a fallu que le larynx descende pour que soit possible la production des sons des langues du monde, privant ainsi Neandertal de l’usage de la parole. En fait cette descente supposée entre Neandertal et Homo sapiens n’était imputable qu’à la remontée du larynx que les auteurs avaient au préalable imaginée pour Neandertal.

Cette théorie a pourtant été reprise dans des dizaines d’ouvrages et de revues de vulgarisation (systématiquement La Recherche). Dans ces illustrations, pour faire bonne mesure, ce n’est pas Neandertal qui est mis en regard de l’Homme, mais un grand singe, alors que leur ancêtre commun date de près de 7 millions d’années (figure 10). Au cours des derniers millions d’années on ne peut parler de descente du larynx pour nos ancêtres et nos proches cousins bipèdes : c’est une restructuration complète que la bipédie a entrainé.

Figure 10. Schéma du conduit vocal d’un grand singe et celui d’un homme actuel publié dans de multiples articles de

vulgarisation pour montrer qu’il a fallu une « descente du larynx » pour parler. Tout d’abord l’Homme ne descend pas d’un grand singe, tous deux sont des spécimens terminaux de deux branches dont le dernier ancêtre commun remonterait

à 7 millions d’années. Ensuite, pour faire bonne mesure l’épiglotte du singe a été placée dans les fosses nasales. La figure suivante présente un schéma du conduit vocal de grand singe plus réaliste : son pharynx est

comparativement plus petit que celui de l’Homme, mais ce n’est pas pour cette raison qu’il ne parle pas, il faut chercher du côté de son équipement cortical.

Sans procéder à des reconstructions, il faut bien le signaler hypothétiques, de conduit vocal de

fossiles répartis depuis un million d’années jusqu’au paléolithique supérieur, il existe une possibilité de démontrer quelles sont les conséquences de la variation de la morphologie du conduit vocal sur les capacité potentielles de production de la parole. En effet si l’on compare les conduits vocaux d’un grand singe, d’un fossile bien conservé de 1,5 million d’années (WT 15000, Nariokotome) et d’un homme moderne adulte, on peut quantifier par un indice global (Larynx

Page 22: L’émergence de la parole - Gipsa-labjean-luc.schwartz/... · 2013. 9. 16. · 3 découvertes de l’Homme de Neandertal (1856) et de l’Homme de Cro-Magnon (1868), la mise en

22

Height Index : Honda, Tiede, 1998) et géométrique (le rapport de la distance antéro-postérieure à la hauteur pharyngienne) leurs différences de forme anatomique dues à l’évolution (figure 11).

Figure 11. Le conduit vocal d’un gorille, d’un fossile de 1,5 millions d’années (WT 15000, adolescent de 12 ans) et

d’un Homme actuel adulte. Les flèches indiquent les longueurs anatomiques des cavités buccales et pharyngales. Celle du primate et du fossile sont dans un rapport de 1 à 2, alors qu’elles sont de longueurs égales pour l’Homme actuel.

4.4. La vraie descente du larynx au cours de l’ontogenèse S’il n’y a pas de descente du larynx au cours de la phylogenèse entre les différentes espèces du

genre Homo (bipèdes), en revanche, au cours de l’ontogenèse, l’os hyoïde et le larynx occupent une position de plus en plus éloignée de la base du crâne, de la naissance à l’âge adulte. Or, au cours de l’ontogenèse de l’Homme moderne, l’indice de hauteur laryngale varie dans un rapport de 2 à 1 pour le conduit vocal de l’enfant et de l’adulte (figure 12).

Figure 12. Évolution du conduit vocal de la naissance à l’âge adulte simulée à l’aide d’un modèle de croissance

(adapté d’après Boë, Maeda, 1998). Ce rapport couvre donc toutes les valeurs que l’on peut trouver pour le conduit vocal des grands

singes et pour les conduits vocaux que l’on peut reconstruire à partir de crânes fossiles (Boë et al., 2007).

Même s’il s’agit d’un remodelage complexe (légère fermeture de l’angle sphénoïdal, abaissement du plan palatal par rapport au basion, déplacement de la paroi pharyngale vers la partie antérieure du rachis, augmentation de la hauteur mentonnière de la mandibule, déplacement de la

Page 23: L’émergence de la parole - Gipsa-labjean-luc.schwartz/... · 2013. 9. 16. · 3 découvertes de l’Homme de Neandertal (1856) et de l’Homme de Cro-Magnon (1868), la mise en

23

glotte), on peut parler, dans ce cas, de descente du larynx au cours de l’ontogenèse, c’est-à-dire d’un déplacement de la glotte par rapport aux vertèbres cervicales, s’accompagnant d’une augmentation du volume pharyngal par rapport au volume buccal (figure 13).

Figure 13. La restructuration complète du crâne, du rachis et du conduit vocal, de la naissance à l’âge adulte (projet SkullSpeech, illustration, Boë, Kielwasser, 2008).

On peut obtenir l’espace acoustique maximal, c’est-à-dire la description de toutes les

possibilités acoustiques de ces conduits vocaux en fonction du déplacement de la langue, de la mandibule et des lèvres. Les paramètres de commande qui émergent sont la position du rétrécissement à l’intérieur du conduit vocal (qui caractérise le lieu d’articulation), l’aire à ce niveau, l’aire aux lèvres et l’amplitude de leur projection (protrusion). À l’intérieur du conduit vocal, le rétrécissement, contrôlé par le déplacement de la lame ou du dos de la langue, délimite ainsi le conduit vocal en deux parties (antérieure et postérieure). Celles-ci ne correspondent pas nécessairement au découpage anatomique en cavités buccale et pharyngienne. Les voyelles cardinales extrêmes /i a u/, c’est-à-dire les plus différentes sur le plan acoustique et perceptif correspondent à un rétrécissement nettement marqué (une faible aire à la constriction). Pour produire ces trois voyelles universelles, la connaissance élémentaire de l’acoustique (Fant, 1960) démontre :

• qu’il n’y a qu’une seule solution pour produire une voyelle possédant une troisième résonance élevée comme celle du /i/ : il faut contrôler une constriction avec la lame de la langue mise en gouttière contre le palais dur ; par simple conséquence, il s’ensuit que la longueur de la cavité arrière restante sera toujours suffisante pour produire une deuxième résonance, elle aussi élevée ; quant à la première résonance, elle sera toujours assez basse pour être perçue comme celle d’un /i/ ;

• que produire les deux premières résonances caractéristiques des deux autres voyelles extrêmes ne pose aucun problème : grâce à deux résonateurs de Helmholtz pour le /u/ et deux tubes en forme de pavillon, pour le /a/.

Nous avons vérifié cette hypothèse avec un modèle du conduit vocal simple ou plus sophistiqué. Nous avons généré un grand nombre d’articulations vocaliques (10 000 par exemple) pour cartographier ce que l’on appelle l’Espace Vocalique Maximal (Boë et al., 1989). L’EVM dessine alors dans le plan F1 F2 le triangle vocalique bien connu : à ses extrémités, se retrouvent les configurations [i a u] prédites par la théorie de la dispersion (Liljencrants, Lindblom, 1972 ; Schwartz et al., 1997) (figure 14).

Page 24: L’émergence de la parole - Gipsa-labjean-luc.schwartz/... · 2013. 9. 16. · 3 découvertes de l’Homme de Neandertal (1856) et de l’Homme de Cro-Magnon (1868), la mise en

24

Figure 14. À gauche, de haut en bas : les configurations vocaliques pour /i a u/ schématisées par des tubes (constriction et cavités) et les coupes sagittales correspondantes. À droite, l’espace vocalique maximal cartographié dans les plans F1F2 et F2 F3 à partir de 10 000 articulations générés par un modèle de conduit vocal simplifié (4 tubes, Fant, 1960). Aux extrémités du triangle F1F2 on retrouve bien les formes prototypiques des tubes pour les trois voyelles cardinales.

Dans l’espace F1 F2 F3, ces voyelles présentent bien un contraste maximal prédit par la théorie de la dispersion.

Les conséquences de la croissance du conduit vocal sur l’espace maximal vocalique (EVM) sont bien connues depuis les mesures de Peterson et Barney (1950) et prévisibles (Fant, 1960). Des conduits vocaux de longueurs différentes ont exactement les mêmes potentialités de différenciation acoustique, à ceci près que les EVM sont décalés dans l’espace des fréquences (les fréquences de résonance d’un conduit vocal sont inversement proportionnelles à sa longueur, mais les rapports des résonances restent constants).

On obtient ainsi avec un modèle articulatoire, simplifié ou plus sophistiqué, les EVM au cours de la croissance. Ils sont quasiment identiques (en Bark) : le bébé, s’il avait les mêmes capacités de contrôle articulatoire que l’adulte, pourrait produire, dès la naissance, le même espace vocalique (figure 15).

Figure 15. Les espaces vocaliques maximaux de l’homme, de la femme, d’un enfant de 10 ans, de 4 ans et d’un nouveau-

né dans le plan F1 F2 avec des échelles en Bark (quasi logarithmique) qui rendent compte de l’espace perceptif.

Ce n’est donc pas au niveau de la géométrie du conduit vocal qu’il faut chercher les causes de l’émergence de la parole pour l’Homme moderne ou de l’absence de parole pour les grands singes, mais au niveau de son contrôle. Il faut comprendre qu’un pharynx de faible dimension par rapport à la cavité buccale n’est pas un handicap pour produire les voyelles des langues du monde. Si les Hommes de Neandertal ne produisaient pas les contrastes vocaliques maximaux /i a u/, ce n’était pas pour les raisons avancées par Lieberman et Crelin. Anatomiquement, il n’y a pas de raison de faire appel à une quelconque descente du larynx au cours de l’évolution.

Page 25: L’émergence de la parole - Gipsa-labjean-luc.schwartz/... · 2013. 9. 16. · 3 découvertes de l’Homme de Neandertal (1856) et de l’Homme de Cro-Magnon (1868), la mise en

25

En faisant porter sur des caractéristiques anatomiques du conduit vocal tout le poids de son argumentation, la théorie de Lieberman et Crelin a entraîné les débats sur l’émergence de la parole dans une fausse piste. Cependant il faut noter qu’il s’agit d’un fonctionnement normal de la science dans la mesure où l’hypothèse de la descente du larynx était une hypothèse forte et falsifiable.

Les travaux actuels sur l’origine du langage s’orientent maintenant vers l’étude des contraintes sensori-motrices périphériques qui régulent les gestes de production de la parole, celle des circuits corticaux et de leur capacité de contrôle. Mais encore fallait-il lever l’hypothèque de la position du larynx.

4.5. Push software

4.5.1. Production de la parole et succion-mastication-déglutition Nous avons montré que nos prédécesseurs et lointains cousins du genre Homo (1,6 Ma)

avaient tous la capacité potentielle de produire tous les sons des langues actuelles. Mais avaient-ils une capacité de contrôle suffisante pour les générer ?

Traditionnellement les champs disciplinaires des recherches dans les domaines de la production de parole et de la succion-mastication-déglutition (SMD) ont été relativement étanches. Il était difficilement envisageable de comparer la parole, une production cognitive de très haut niveau, à la SMD, un acte automatique de bas niveau, sinon pour souligner les différences (Ostry et al., 1997). Et pourtant la parole emprunte les effecteurs de la SMD, pourquoi n’en récupèrerait-elle pas une partie des gestes ? D’autant plus que de nombreuses observations mettent en évidence que les troubles de SMD (dysphagie) sont souvent associés à des troubles de production de la parole. La  déglutition  représente  un  intérêt  pour  l’orthophonie  étant  donné  la  complexité  et  les  parallèles  entre  le  contrôle  et  la  coordination  de  la  déglutition  et  de  la  production  de  la  parole  et  du  langage. (Lapointe, McFarland, 2004 ; McFarland, Tremblay 2006, 2007).

Les fonctions motrices orofaciales sont supportées par le système musculo-squelettique issu des arcs pharyngés et innervé par les nerfs crâniens du tronc cérébral. Elles assurent des fonctions vitales comme l'ingestion alimentaire et la respiration qui doivent être coordonnées pour éviter les fausses routes. Le développement de ces fonctions débute dans la période fœtale par la mise en place dans un premier temps de la succion-déglutition puis des mouvements respiratoires.

À la naissance, l'ingestion alimentaire de liquide se fait grâce au réflexe de succion-déglutition dont la régulation se fait au niveau du tronc cérébral. La disposition anatomique particulière du nouveau-né, palais mou horizontalisé, larynx crânialisé avec l'épiglotte qui vient au contact de la face nasale du voile du palais, lui permet de déglutir et de respirer en même temps : l'ingestion alimentaire liquide se fait latéralement alors que la ventilation est assurée dans la partie médiane. Au cours de cette phase d'oralité primaire les temps oral et pharyngé de la déglutition sont couplés et indissociables. La succion-déglutition nutritive nécessite une force suffisante des muscles oraux et de la langue avec des cycles de l'ordre de 1Hz. Bien que la succion-déglutition soit un réflexe à la naissance celle-ci va devenir de plus en plus régulière et automatique avec l'âge.

L'oralité primaire va durer pendant les six à huit premiers mois de la vie puis va être progressivement remplacée par l'oralité secondaire qui débutera avec l'alimentation fractionnée à la cuillère et le changement de consistance du bol alimentaire. Pendant cette transition, de nouvelles praxies alimentaires contrôlées par la volonté, au niveau des aires motrices corticales, vont se mettre en place. À la différence de la succion-déglutition; le nourrisson va pouvoir être capable de dissocier le temps oral et le temps pharyngé. En contre partie il devra coordonner la déglutition avec la respiration pour éviter les fausses routes. La mastication, dont le but est de préparer le bol alimentaire, est une activité rythmique de contraction musculaire entre muscles agonistes et antagonistes avec une fréquence de 1 à 2 Hz au début. Elle va devenir de plus en plus efficiente au cours des deux premières années en même temps que la denture temporaire apparaît.

Les maturations fonctionnelles de l'ingestion alimentaire et de la coordination de la respiration vont se mettre progressivement en place avec le passage de l'oralité primaire à l'oralité secondaire. Cette transition utilise les mêmes supports anatomiques musculo-squelettiques qui vont eux-mêmes se modifier dans leur anatomie au cours de période. Ces structures vont être également le support de la parole qui apparaît avec le babillage vers 7 mois.

Page 26: L’émergence de la parole - Gipsa-labjean-luc.schwartz/... · 2013. 9. 16. · 3 découvertes de l’Homme de Neandertal (1856) et de l’Homme de Cro-Magnon (1868), la mise en

26

Les premiers résultats qui mettent véritablement en évidence le recoupement des gestes de SMD et de parole datent de 2002, ils sont dus à une équipe de médecins, chirurgiens et anthropologues (Hiiemae et al., 2002 ; Hiiemae, Palmer, 2001, 2003). L’expérience a consisté à disposer des capteurs de positions sur les lèvres, la mandibule, la langue et l’os hyoïde sur des sujets qui déglutissaient du liquide, mastiquaient des bols alimentaires de différentes consistances d’une part et qui produisaient des séquences de parole d’autre part. Les résultats montrent que les limites des trajectoires de chacun de ces repères correspondant à la parole sont un sous-ensemble des lieux correspondant à la succion-mastication-déglutition :

« Although there is a fundamental dichotomy between the referential framework and the methodological approach to studies of the orofacial complex in feeding and speech, it is clear that many of the shapes adopted by the tongue in speaking are seen in feeding » (Hiiemae et al., 2002). . Une deuxième série d’expériences (Serrurier et al. 2008, 2010) menées dans le cadre de la

modélisation du conduit vocal a repris le même protocole, mais l’a étendu à l’élaboration de deux modèles : l’un pour la SMD et l’autre pour la production de la parole. Les mesures faites dans les deux études précédentes sont confirmées (figure 16).  

     

Figures 16. Localisation des capteurs et superpositions de leurs déplacements pour la parole (en clair) et pour la mastication déglutition (en foncé).

 Ensuite deux modèles articulatoires ont été élaborés pour chacune des activités. Le modèle de

mastication-déglutition se révèle plus général que le modèle de production de parole : il permet de reproduire, avec une bonne précision (erreurs inférieures au mm), non seulement les gestes de mastication-déglutition mais aussi ceux de parole. On peut faire l’hypothèse qu’au cours de la phylogenèse et de l’ontogenèse la parole a été et est acquise à partir d’une spécialisation des gestes de mastication-déglution, mais aussi une réorganisation de leur contrôle.

4.5.2. Babillage et cyclicité La compositionnalité des sons a fait l’objet d’une proposition théorique majeure, la théorie

Frame then Content (FC) (MacNeilage, 1998 ; MacNeilage et Davis, 2000). Cette théorie fait jouer aux cyclicités mandibulaires un rôle clé dans les premiers pas du langage, tant dans l’ontogenèse que dans la phylogenèse. En effet, après avoir exploré divers types de vocalisations quasi-stationnaires dans les premiers temps de sa vie, le babillage canonique marque vers 6-7 mois (âge vers lequel l’enfant tient seul sa tête droite) le début de vocalisations dynamiques, impliquant une coordination par le bébé de sa source vocale (pour produire du son) et de mouvements cycliques de sa mâchoire (pour moduler le son). Ces cycles de mâchoire produisent des alternances de phase ouverte de type [a] et de phase fermée, où la mâchoire a porté la langue et/ou les lèvres en position haute bloquant le passage de l’air et produisant une proto-consonne (figure 17). Il en résulte des proto-syllabes de type [bababa] ou [dadada] selon que la fermeture se fait au niveau de la langue ou des lèvres, voire [bdabdabda] si les deux fermetures sont concomitantes (Vilain, 1999). Ces proto-

Page 27: L’émergence de la parole - Gipsa-labjean-luc.schwartz/... · 2013. 9. 16. · 3 découvertes de l’Homme de Neandertal (1856) et de l’Homme de Cro-Magnon (1868), la mise en

27

syllabes sont dénommées cadres (frames) par MacNeilage et Davis, avant que ne se mette peu à peu en place un contrôle indépendant des phases vocaliques et consonantiques, que les auteurs appellent contenu, d’où le nom de théorie Frame then Content. Cette séquence développementale reprend, selon la théorie, une séquence phylogénétique dans laquelle les gestes de mâchoire impliqués dans les mécanismes d’ingestion chez les primates non humains auraient été détournés vers une fonction communicationnelle avec les mimiques faciales observées chez les grands singes (lip-smacks, tongue-chatter : bruits de lèvres, claquements de langue), étendue vers une fonction de modulation vocale ouvrant la porte à des gestes vocaux utilisables par la communication parlée.

 

 Figure 17. Production de proto-syllabes par cyclicité mandibulaire dans la théorie FC. À gauche la mâchoire est en

position haute produisant une occlusion au niveau des lèvres ou de la zone alvéodentale, soit une proto-consonne de type [b] ou [d]. À droite, la mâchoire est en position ouverte, ce qui produit la proto-voyelle de type [a].

(IRM, d’un enfant de 7 mois, d’après Vorperian et al., 2005).

Cette organisation motrice en cadres et contenus portés par une dynamique mandibulaire sous-

jacente est considérée par MacNeilage comme une solution au problème classique (Lashley, 1951) de la production d’un ordre sériel de cibles par des gestes par nature continus (MacNeilage, 2007). Ainsi, la théorie FC fournit un point d’entrée dans la compositionnalité des sons (ou phonologique), grâce au système dynamique constitué par la mandibule.

4.7. De la phylogenèse à la morphogenèse : les « bonnes formes » des systèmes sonores des langues du monde

Si l’on admet ainsi l’existence d’un chemin conduisant, sur la base d’éléments pull à déterminer, c’est-à-dire de bénéfices évolutionnistes qu’il reste à découvrir, vers la naissance du langage et de la parole, la question posée est alors celle des formes que peuvent prendre les unités de communication de ce langage. En d’autres termes, si l’on suppose résolu le problème de la phylogenèse (de la genèse d’une humanité dotée de langage, en l’occurrence) se pose alors le problème de la morphogenèse, c’est-à-dire de la genèse des formes de la communication langagière. Ce problème a alimenté également un large ensemble de recherches, initiées au début des années 1970 par la naissance conjointe de théories majeures de la communication parlée, la théorie de la dispersion de Bjorn Lindblom (Liljencrants, Lindblom, 1972) et la théorie quantique de Stevens (1972). Nous ne traiterons pas ici de la question de la morphogenèse. Disons simplement que, si l’on accepte la théorie Frame-Content de MacNeilage et Davis qui dote les humains de capacité de modulation vocale par dérivation du système de mastication-déglutition, on obtient directement un point d’entrée vers un invariant des systèmes sonores des langues du monde, l’alternance de voyelles et de consonnes au sein de syllabes. En ajoutant des principes d’optimisation perceptive et motrice des formes générées par le conduit vocal, nous avons obtenu des principes de prédiction des systèmes vocaliques ou consonantiques (/i a u/ ou /i e a o u]/ comme

Page 28: L’émergence de la parole - Gipsa-labjean-luc.schwartz/... · 2013. 9. 16. · 3 découvertes de l’Homme de Neandertal (1856) et de l’Homme de Cro-Magnon (1868), la mise en

28

voyelles privilégiées ; des consonnes non voisées plutôt que voisées ; parmi les plosives, /p t k/ ou /b d g/ comme système de base (voir Boë et al., 1997 ; Schwartz et al., soumis) dans le cadre d’une extension que nous avons proposée de la théorie de Lindblom, la théorie de la dispersion-focalisation (Schwartz et al., 1997).

Ainsi, la naturalisation du langage fournit une perspective singulière à la proposition structuraliste de l’arbitraire des formes du langage : si l’arbitraire de la correspondance entre le signifié et le signifiant n’est pas remis en question pour l’essentiel (en dehors des propositions phonosymbolistes à la portée très limitée), le langage puise ses formes dans un stock d’unités sonores non infini (Lindblom, 1990) et même en réalité fort restreint, contraint qu’il est par les pressions structurantes et les conditions aux limites imposées par les systèmes cognitifs (de perception, d’action, de mémoire, d’apprentissage, etc.) sur le langage tout au long de son évolution passée ou présente.

5. En résumé  

La réarticulation des domaines de recherche sur l’émergence de la parole et du langage qui se développe depuis une quarantaine d’années peut se définir par un consensus : le naturalisme qui est au centre de cette approche incite à décrire les relations entre les aspects biologiques et la parole et le langage, par une accumulation des preuves établies dans une multiplicité des domaines. On retrouve bien la dichotomie entre forme et substance mais il faudrait dépasser les frontières traditionnellement établies entre sciences du langage et sciences de la parole. Il s’agit manifestement d’un système dont la complexité est peut-être du même ordre que celui de l’apparition de la vie. Les chercheurs se trouvent confrontés à un manque d’observable, à la difficulté de monter des protocoles expérimentaux et à l’ampleur des connaissances à rassembler dans des équipes pluridisciplinaires. Comme pour les travaux sur l’origine de l’Homme, on assiste à un foisonnement théorique qui entraîne un certain nombre de développements très hypothétiques. Il semble important de se livrer, avec des partenaires épistémologues, à de régulières mises en perspectives réflexives et plus que jamais les hypothèses falsifiables feront avancer les connaissances.

La mise en évidence de FOXP2 dont la déficience perturbe la production de la parole et l’acquisition du langage constitue un nouveau point d’entrée pour la recherche génétique. Sa présence dans le règne animal ne réduit pas son importance pour la parole et le langage, mais représente plutôt un autre exemple de recrutement et de modification au cours de l’évolution de substrat existant. En ce qui concerne l’équipement de la production de la parole, nous avons tenté de montrer qu’il existe une continuité dans l’évolution. La connaissance des gènes HOX depuis la mouche drosophile en passant par la souris nous permet de comprendre la structuration cranio-caudale et la cohérence de la disposition de la base du crâne, de la mandibule, de l’os hyoïde et du rachis. Depuis l’acquisition de la bipédie, il est possible d’avancer que la morphologie du conduit vocal de nos ancêtres différait de peu de celle de l’Homme actuel. D’ailleurs en admettant même qu’ils aient été dotés d’un plus petit pharynx, la connaissance de l’acoustique du conduit vocal nous permet d’avancer qu’il aurait quand même pu produire tous les sons des langues du monde, à condition de disposer de capacités de contrôle suffisantes. En ce qui concerne celles-ci, nous avons montré que les mouvements des articulateurs pour la production de la parole peuvent être considérés comme un sous ensemble de ceux que l’on peut observer actuellement pour la succion, mastication déglutition. Ce qui tendrait à avancer que la parole, qui utilise des organes initialement prévus pour d’autres fonctions, aurait aussi récupéré une partie des gestes de l’ingestion de liquide et de nourriture. C’est d’ailleurs dans cette voie de recherche que s’inscrit la mise en place du babillage à partir de la cyclicité de la succion. Il y a vraisemblablement plusieurs centaines de milliers d’années, le conduit vocal et son contrôle présentaient un état initial favorable à l’émergence de la parole.

Bien entendu il ne s’agit que d’hypothèses fondatrices d’un programme de recherche dont il reste beaucoup à affiner pour développer une heuristique positive.

Page 29: L’émergence de la parole - Gipsa-labjean-luc.schwartz/... · 2013. 9. 16. · 3 découvertes de l’Homme de Neandertal (1856) et de l’Homme de Cro-Magnon (1868), la mise en

29

Tant d’inconnues demeurent, qu’à l’heure actuelle il n’est pas possible de connaître l’époque de l’apparition de la parole. L’étude plus approfondie des moulages endocrâniens permettra peut-être un jour prochain de mieux cerner les possibilités langagières des hommes fossiles. Dean Falk, paléoanthropologue et spécialiste du cerveau des Primates et des Hommes fossiles, étudie des reconstitutions du cerveau par scanner 3D. L’avenir est encore plein d’espoir.

Remerciements Un grand merci à Sylvie Archambault, Frédéric Berthommier, Marc Dymetman et Hélène Mathéry pour leurs documentations, suggestions et critiques, à Roland Benoît pour la partie génétique, à Denis Autesserre pour ses images radiographiques, à Élizabeth Daynès pour sa photographie, à Sophie Jacopin et Nicolas Kielwasser pour l’infographie. Soutien Une partie de ces travaux a été financée et a pu être réalisée grâce aux projets MSH-Alpes, OHLL, OMLL, ANR-SkullSpeech, et Hand to Mouth.

 


Recommended