RassegnaComparazioneLinguistica
Transcript
RassegnaComparazioneLinguistica
“MODELLI TEORICI DI COMPARAZIONE LINGUISTICA NELLA RICERCA CONTEMPORANEA: UNA RASSEGNA CRITICA” Barbara Bendolini Indice Introduzione ................................................................................................................. i-v 1. La Linguistica storico-comparativa nel XXI secolo...........................................1 1.a. Metodi e obiettivi.................................................................................................1 1.b. Limiti del modello comparativo tradizionale .................................................3 2. Il modello della mass o multilateral comparison di Greenberg ....................8 2. a. Il dibattito critico tra mass o multilateral comparison e metodo comparativo tradizionale................................................................................... 8 2.a.1. Il metodo........................................................................................................8 2.a.2. Rilevazione dei prestiti (detection of borrowings)..........................................10 2.a.3. Il ruolo delle regolari corrispondenze di suono......................................11 2.a.4. Confronto del lessico e di elementi grammaticali.................................. 13 2.a.5. L’eredità del metodo comparativo classico.. ..........................................17 2.a.6. Critiche all’approccio matematico della mass comparison........................ 22 2.a.7. Stato della questione ..................................................................................23 2. b. Ulteriori sviluppi degli studi di tipologia linguistica..........................26 2.b.1. Obiettivi, metodi e strumenti del modello tipologico..........................26 2.b.2. La Tipologia e il mutamento linguistico: punti di contatto con la linguistica storico-comparativa .....................................................................34 2.b.3. Tipologia e universali linguistici in Greenberg......................................36 2.b.4. Tipologia e Indoeuropeo: la teoria del doppio strato.............................. 38 2.c. Un esempio di multilateral comparison: “Global etymologies” (Bengston-Ruhlen) ............................................................................................40 2.c.1. La base della tassonomia linguistica........................................................ 40 2.c.2. Il problema dei prestiti ............................................................................. 42 2.c.3. La convergenza .............................................................................................. 43 2.c.4. Compatibilità tra multilateral comparison e traditional method ....................49 3. Recenti studi di Linguistica computazionale: approcci combinati...........58 3. a. Il recupero di Swadesh (Lexicostatistics e Glottochronology) .......58 3.a.1. Dal “vocabolario basico” delle word-lists di Swadesh....................... 58 3.a.2. …alla Lexicostatistics e Glottochronology .......................................................67 3.a.3. Il dibattito sull’eredità di Swadesh.......................................................... 69 3.a.4. Sviluppi successivi della Lexicostatistics: metodi, strumenti, limiti...... 72 3.a.5. Sviluppi successivi della Glottochronology: metodi, strumenti, limiti.....74 3. b. Approccio quantitativo e probabilistico nella Linguistica storica 3.b.1. Un metodo probabilistico per individuare relazioni di parentela tra lingue (Baxter-Ramer)................................................................................... 79 3.b.2. Corrispondenze fonetiche totali automatizzate e cambiamento linguistico (Huff) ..................................................................................................92 3.b.3. Esplorazioni nella Automated Lexicostatistics: The automated similarity judgment program (Holman-Brown) ....................................................100 3.b.4. Prospettive future della Automated Lexicostatistics............................... 115 4. Semantic primes di Wirsbizcka e Goddard......................................................121 4.a. Fondamenti di Semantica............................................................................121 4.b. Natural Semantic Metalanguage e primitivi semantici................................ 124 4.c. Cross-linguistic semantics .................................................................................129 4.d. Semantica computazionale.........................................................................131 Riferimenti bibliografici.............................................................................................135 Allegati: Tabelle lessicostatistiche (Holman-Brown) ..... ........................................167 i Introduzione Com’è noto, l'inizio della ricerca nel campo della Linguistica storico-comparativa coincide proprio con la nascita della Linguistica in sé. La Linguistica comparativa conta sulla grande tradizione della ricerca sviluppata in università tedesche: molti linguisti storico-comparativi, soprattutto Indoeuropeisti, ma anche specialisti di lingue semitiche e altaiche, hanno studiato in Germania. Negli ultimi decenni, tuttavia, proprio in Germania, essa ha parzialmente perso la relativa centralità rispetto alle altre discipline della linguistica. Ciò ha portato ad una grande perdita, tenendo conto della ricchezza di conoscenze accumulata durante due secoli. Nel corso del XIX secolo, hanno trovato terreno fertile e sono stati riconosciuti come argomenti fondamentali di ricerca temi come il rapporto genetico, la ricostruzione linguistica ed il cambiamento linguistico, che sono stati studiati spesso con un metodo interdisciplinare, attraverso l’implementazione di strumenti e metodologie in seguito estesi ad altri campi della linguistica. Alla fine del XX secolo, nonostante il crescente interesse per la linguistica descrittiva sincronica, la linguistica storico-comparativa può ancora risultare con una rinnovata e approfondita forza e avere potenzialmente un ruolo esemplare riguardo ad altre discipline linguistiche attraverso l’uso di nuove metodologie di ricerca, quali i metodi quantitativi della linguistica computazionale (lessicostatistica e glottocronologia attraverso i mezzi informatici) e un dialogo interdisciplinare con le scienze vicine, quali la genetica, l'archeologia e le scienze cognitive. In campi di ricerca come la linguistica indoeuropea e delle lingue orientali, è oggi essenziale per i linguisti interessati al cambiamento linguistico ed alla tipologia linguistica, promuovere lo scambio di conoscenze fra campi vicini, ma spesso non comunicanti, della linguistica: in particolare risulta foriera di sviluppi la collaborazione fra tipologi e linguisti storici. Non bisogna dimenticare che In questo campo, la tradizione tedesca fornisce un background straordinariamente ricco, poiché la Germania è stata anche la culla della Tipologia linguistica, con il padre fondatore Wilhelm von Humboldt, dagli inizi del XIX secolo ed è oggi la sede delle istituzioni principali per la Tipologia della lingua, così come lo è per la Linguistica storico-comparativa. ii Proprio perché è d’obbligo una rivalutazione della rilevanza della Linguistica storico-comparativa nel XXI secolo, l’obiettivo principale della presente rassegna critica è quello di tracciare un bilancio degli ultimi sviluppi della ricerca contemporanea in questo così importante campo della Linguistica, proprio perché in questi ultimi anni, in particolare 20082011, si è potuto registrare una rinascita d’interesse che arriva inaspettatamente dal mondo dell’Informatica, dei metodi statistici e probabilistici della Linguistica computazionale: è ora possibile infatti usufruire degli inaspettati apporti del potente strumento informatico, che grazie a databases e motori di ricerca è capace di gestire, modellare e confrontare una grande mole di dati prima ingestibili dalla mente umana. Tale rinnovato interesse si fonda, da un lato, su un impensabile recupero di metodi sottovalutati come la Lexicostatistics e la Glottochronology di Swadesh, basate sul confronto interlinguistico del vocabolario basico (universale e quindi particolarmente immune ai prestiti) e sulla datazione del cambiamento linguistico, dall’altro sull’affermazione di una nuova prospettiva, ovvero dell’approccio interlinguistico della mass o multilateral comparison di Greenbergiana memoria e dei cross-linguistic studies tipologici e semantici, approcci che, nati 50 anni fa, sono stati oggetto di critica da parte di linguisti tradizionali e Indoeuropeisti, per presupposti e metodi, ma che ora ricevono un forte impulso innovativo proprio grazie alle potenzialità del mezzo informatico. Gli apporti dei nuovi approcci mirano soprattutto a dare un contributo alla discussione sui fattori in gioco nel cambiamento linguistico diacronico e nello studio del rapporto fra gradualità diacronica e variazione sincronica, integrando gli attuali punti di vista su variazione e uso linguistico. Speciale attenzione è quindi rivolta ad argomenti teorici e metodologici: 1) come lo studio sul cambiamento linguistico può trarre giovamento dai successi più recenti delle teorie linguistiche e 2) come le spiegazioni della variazione sincronica possono essere trovate nei processi diacronici, discutendo se la gradualità diacronica e la variazione sincronica possono essere analizzate tramite gli stessi obiettivi e per mezzo degli stessi strumenti teorici. Questa rassegna vuole quindi indagare su questioni fondamentali su cui la linguistica storica s’interroga da sempre, quali: - perché e come le lingue cambiano, come arrivano cioè ad essere quello che sono e come sono imparentate tra loro; - se è preferibile parlare di gradualità del cambiamento o di sostituzione (replacement); -se nella comparazione linguistica è più legittimo enfatizzare l’innovazione linguistica (come vuole il metodo comparativo tradizionale) o la persistenza (come vuole la prospettiva della Lexicostatistics e della mass o multilateral comparison e dei cross-linguistic studies); iii -se è ancora giusto parlare di sound law (senza limiti nello spazio e nel tempo) o è meglio parlare di phonetic rule; - qual è l'effetto del contatto sul cambiamento linguistico, in altre parole, il contatto di lingua può effettivamente essere visto come tipo speciale di fenomeno sincronico che può durare nel tempo e può condurre gradualmente al cambiamento diacronico, innescando o influenzando lo sviluppo delle costruzioni particolari nelle lingue vicine; - se è lecito “riproporre” il concetto di monogenesi e successiva differenziazione culturale nell’eterno enigma dell’origine del linguaggio; - qual è l’effettivo limite tra lingue vive e lingue morte, se ha senso fare questa distinzione e perché ha ancora senso oggi studiare le lingue antiche, classiche; - se queste nuove prospettive, la rinascita di approcci abbandonati e rivisti alla luce dei mezzi informatici, sono incompatibili rispetto agli approcci tradizionali classici o sono invece di reciproco supporto; - fino a che punto è legittimo il confronto tipologico translinguistico confrontando materiale fonologico e semantico in vista della classificazione genetica delle varie lingue storico-naturali; - come possono interagire Tipologia e Metodo Comparativo, Scienze Cognitive, Genetica, Linguistica Computazionale, per poter comprendere il cambiamento linguistico e la parentela genetica tra lingue, ovvero come aspetti sincronici possono influire su aspetti diacronici; - cosa si vuole dimostrare attraverso il punto di vista translinguistico (cross-linguistic studies); - cosa s’intende esattamente per lessico basicoc e se è un concetto scientifico: - come individuare e distinguere dalle parole ereditate (cognates), i prestiti, i calchi, i fenomeni di analogia, che inficiano la validità di ogni confronto ai fini della definizione di una parentela tra lingue e fino a che punto è lecito tener conto anche dei sinonimi semantici, e delle varie implicazioni fonologiche (materiale fonetico di ogni lingua); - quale grado di scientificità e di empirismo c’è nel criterio di “somiglianza superficiale” come guida nel confronto trans-linguistico; - quale ruolo hanno le “regolari corrispondenze di suono” e la ricostruzione, procedimenti fondamentali del metodo comparativo tradizionale inaugurato dai Neogrammatici del XIX sec.; - quante lingue bisogna confrontare per poter arrivare a parlare di un valido modello scientifico; - quale grado di predittività può avere un simile modello; - quanto spazio è dato alla casualità e alla probabilità; - come l’ipotesi monogenetica e della successiva differenziazione del linguaggio, di tipo cognitivista, si concilia con il principio desaussuriano e tassonomico dell’arbitrarietà del segno; iv - come la valutazione di staticità-cambiamento, cioè di permanenzaassenza-innovazione di un lessema in prospettiva interlinguistica, può offrire spunti per ulteriori sviluppi futuri, in relazione al concetto di universali linguistici, al principio di economia, alla parentela genealogica tra le lingue, e soprattutto dare dei riferimenti metodologici che facilitino l’apprendimento e la didattica delle lingue, eliminando la dicotomia tra lingue vive e lingue morte, anzi “visualizzando” le lingue vive moderne come semplice evoluzione delle lingue “morte” antiche. E’ evidente quindi che ripercorrere il dibattito critico sugli approcci di comparazione linguistica degli ultimi anni, significa innanzitutto toccare implicitamente molte questioni fondamentali che appartengono a tutta la riflessione linguistica. Molte critiche a modelli del passato sembrano dovute a malintesi e/o letture fatte in modo polemico, senza un reale approfondimento o contatto diretto con i metodi e gli strumenti di tali studiosi, per cui vale la pena rivisitarle alla luce di nuovi strumenti e nuove prospettive. I risultati della rassegna si sono rivelati anche un valido supporto teorico, una base scientifica alla proposta di un nuovo metodo (presentato in Appendice), che verrà sviluppato in seguito soprattutto con valenza didattica, cioè un Indice semasiologico del lessico basico di lingue IE e non-IE, antiche e moderne, in prospettiva interlinguistica, che permetterà di visualizzare un vocabolario comparato di basi lessicali, coinvolgendo aspetti fonologici, morfologici, semantici e lessicali, un metodo interdisciplinare, su nuovi approcci combinati, contando sui precedenti offerti dagli eruditi maggiori, dove proprio il termine di approccio combinato e prospettiva cross-linguistic sembrano essere le parole “chiave”. Tale nuovo metodo è nato tuttavia in modo indipendente rispetto alla presente ricerca: il modello nasce dalla ersonale esperienza di insegnamento nella Scuola Secondaria di I e II grado. Il nuovo modello di schede lessicali, che si intende proporre, permette di visualizzare le lingue storico-naturali, IE e non-IE nella loro evoluzione (non per dimostrare qualcosa, ma per puro confronto). Si potrà evidenziare persistenza e innovazione dei semi lessicali, tra sincronia e diacronia, nella loro "continuità" (Renfrew e Alinei). Si può ipotizzare una origine del linguaggio che è per fÚsij (monogenesi, di tipo cognitivo, universale) e nÒmoj (per successiva differenziazione culturale). Se è vero che "per due punti passa una sola retta" (principio matematico euclideo), è anche vero che poche parole del lessico basico (padre, madre, occhio, piede, … concetti universalmente presenti, a differenza di scarpa, piatto, pala, igloo, tipici di una determinata singola cultura) sono sufficienti per individuare la genesi comune tra lingue. v La Tipologia può quindi essere analizzata in vista della determinazione della classificazione della genealogia linguistica. Si può ipotizzare una matrice comune originaria del linguaggio, di tipo cognitivo, che forse risale al Paleolitico, al momento in cui l’homo sapiens ha iniziato a "comunicare", prima di differenziarsi nelle diverse "etnie". Oppure si può pensare ad una migrazione, da est a ovest (Mesopotamia-Babilonia, Egitto, Anatolia, Caucaso, Balcani, Grecia, Italia, Centro Europa...), di popoli e culture che, una volta estinte, hanno colonizzato nuove terre.... Di certo le schede del lessico basico di seguito presentate, con la loro evidenza, "parlano da sole": non hanno la "pretesa di dimostrare qualcosa", ma di "confrontare" i semi lessicali radicali persistenti nelle varie lingue (attestate, non ipotizzate, e che si possono trovare in qualsiasi dizionario o lessico), ed enucleare le leggi fonologiche che stanno alla base del cambiamento, individuando altri equivalenti delle leggi di Grimm e Verner. 1 1. La Linguistica storico-comparativa nel XXI secolo. 1. a. Metodi e obiettivi Le domande fondamentali che la linguistica storico-comparativa rivolge a se stessa sin dal suo nascere sono: perché e come le lingue cambiano nel tempo e nello spa<zio, e come sono imparentate tra loro. Ogni linguista si propone di arrivare a conoscere le risposte a queste domande, ma queste variano in modo sorprendente da un linguista all’altro. E la divergenza dei punti di vista riguardo a che cosa è realmente noto fino ad oggi è ancora maggiore di quella esibita nella domanda di come si arrivi a questo corpo d’informazioni. Nello specifico, come è noto, vi sono due campi di ricerca della comparazione linguistica: - la linguistica storico-comparativa (linguistica diacronica), fondata nel XIX secolo e oggetto d’indagini con l´aiuto del confronto linguistico, che è riuscito a redigere la stesura di famiglie linguistiche presenti fra le varie lingue, così come l´origine di queste. Da queste ricerche sono nate diverse discipline come la linguistica indoeuropea, la semitistica o l´ugro-finnistica, dove la presunta parentela linguistica è chiamata parentela genetica. - la linguistica contrastiva, che confronta fra loro le lingue dal punto di vista sincronico, si concentra soprattutto sulla tipologia linguistica e sulla didattica delle lingue straniere (ad esempio la ricerca di possibili interferenze linguistiche, i problemi dell´acquisizione delle lingue straniere, ecc.). Se le lingue esaminate sono in contatto l´una con l´altra, si parla di linguistica di contatto. La linguistica comparativa è uno studio che si sviluppa entro i confini dell'evoluzione storica e le fasi che contrassegnano i momenti di cambiamento e di differenziazione delle lingue. Un sistema comparativo, appunto, analizza il sovrapporsi dei vari stadi di trasformazione della lingua attraverso le contaminazioni che via via si accumulano nel tempo sotto l’azione di successivi mutamenti morfologici e fonematici. Così il valore significante assume, di volta in volta, significati nuovi che sostituiscono quelli precedenti e s’innervano nella nuova struttura antropologico-culturale che le ha generate. Nella linguistica comparativa la nozione di radice indica una forma ricostruita alla quale è possibile ricondurre parole affini in lingue diverse appartenenti alla medesima famiglia linguistica. Principio fondamentale della comparazione linguistica è l’individuazione della cosiddetta legge fonetica, derivante dall'analisi comparativa dei fonemi, la quale impone che dato un suono qualsiasi x, quando esso si trasforma per effetto delle contingenze in un suono y, la stessa trasformazione avviene con regolarità in ogni occorrenza di x stanti uguali condizioni nello stesso momento storico definito. La mutazione dei fonemi segue (o concorre) alla mutazione dei morfemi. Ad esempio si veda nella lingua francese la sorte 2 subita dalla ē (lunga latina volgare) la cui forma sonora attuale corrisponde al suono /oi/: sē = soi; mē =moi ; tē = toi ; lēgem = loi. Tuttavia nel XXI secolo la linguistica comparativa ha subito alcune trasformazioni soprattutto per quello che riguarda l’area d’interesse: - Focus degli obiettivi: se la Linguistica storica tradizionale si focalizzava nel registrare le tracce del cambiamento linguistico nel passato (di una lingua o di una famiglia linguistica), d’altra parte la linguistica storica moderna mette a fuoco il progresso del cambiamento linguistico, provando ad analizzare la causa o la motivazione, la diffusione e la modalità del cambiamento linguistico (approccio cognitivo, tipologico, uso di dati dell’archeologia e della genetica…). - Fattori interni vs. fattori esterni: se la Linguistica storica tradizionale si concentrava sulla lingua e sui relativi cambiamenti per quanto riguarda i fattori interni, la Linguistica storica moderna mette il relativo punto focale sui fattori esterni, per esempio, il contesto sociale e sintagmatico. Quella variabilità-varietà sincronica è vista come chiave per una variazione in prospettiva diacronica. La conclusione è che l'inizio del cambiamento di una lingua (in senso diacronico) è proprio la variazione sincronica: ad es. A > B: se A “cambia in” o “è sostituito da” B, è evidente che A appartiene ad uno stadio più antico della lingua in questione, mentre B appartiene ad uno stadio più recente. Il tutto può essere invertito: B<A (il più recente B deriva da un precedente A). - Centralità dell’uso del linguaggio: se per la Linguistica storica tradizionale la struttura linguistica ed il sistema erano di fondamentale importanza, nella Linguistica storica moderna, oltre alla struttura e al sistema, entrano in gioco l'uso di lingua e l'utente, sostenendo che la grammatica è modellata dal discorso e la lingua è cambiata dai parlanti. - Principali oggetti d’indagine: se la Linguistica storica tradizionale era principalmente (o esclusivamente) interessata alla fonologia e alla morfologia, lasciando in secondo piano la sintassi e la semantica, è vero che nella Linguistica storica moderna, oltre alla fonologia e alla morfologia, sono considerate in particolar modo la sintassi, la semantica e la pragmatica. - Metodi: se la Linguistica storica tradizionale era basata sulle valutazioni qualitative, la Linguistica storica moderna è sia qualitativa sia quantitativa, e si basa principalmente su approcci combinati. -Tema: la Linguistica storica tradizionale si occupava soltanto della lingua scritta, la Linguistica storica moderna è interessata anche alla lingua parlata, e tende ad eliminare la separazione tra lingue vive e lingue morte1. 1 Vd. anche: http://it.wikipedia.org/.../wiki/Linguistica_comparativa. 3 1. b. Limiti del modello comparativo tradizionale Com’è noto, in Linguistica il metodo comparativo è il procedimento di analisi e di ricostruzione delle lingue storico-naturali attraverso l'accostamento e il confronto di vari elementi, sia all'interno di un medesimo idioma sia tra idiomi differenti. In linguistica storica, il metodo comparativo è una tecnica applicata dai linguisti per dimostrare le relazioni genetiche tra le lingue, mentre in linguistica comparativa è uno strumento volto a determinare la regolarità (o la sua assenza) di determinati fenomeni evolutivi all'interno di uno stesso idioma. Il metodo comparativo ha avuto particolare rilievo nel campo dell'Indoeuropeistica, ossia la scienza che mira alla ricostruzione dell'estinta e preistorica lingua indoeuropea a partire dalle sue eredi storiche. Introdotto sistematicamente da Franz Bopp e da Rasmus Rask nel primo decennio del XIX secolo, il metodo ha consentito, attraverso la comparazione fonetica, lessicale e grammaticale delle lingue indoeuropee, una ricostruzione della lingua indoeuropea, divenendo il cardine della linguistica storico-comparativa. E’ ben noto che all'interno di una singola lingua, il metodo consiste nel raffrontare sistematicamente vari elementi simili all'interno di un idioma, per determinarne le regolarità e, di conseguenza, l'evoluzione interna di tale lingua e le sue leggi, secondo una tecnica di confronto delle fasi evolutive di una stessa area linguistica e di confronto tra le lingue affini. Un esempio di questo genere di applicazione è la nota Legge di Grimm, che descrive l'evoluzione dal protoindoeuropeo al protogermanico delle consonanti occlusive. La linguistica comparativa classica tradizionale, inaugurata dai Neogrammatici tedeschi, si fonda quindi su due momenti fondamentali: sulla ricostruzione (di una protolingua non attestata, indicata con *), e sulle corrispondenze regolari di suono (leggi fonetiche senza eccezioni); si concentra quindi sull’innovazione, momento di differenziazione delle varie lingue, piuttosto che sulla persistenza. Per quanto riguarda le fasi del metodo di base della ricostruzione comparativa classica 2, si ricorda che esse consistono in: - mettere insieme liste di potenziale parentela (lessico basico)3; - stabilire gli insiemi di corrispondenza; - scoprire quali insiemi sono in distribuzione complementare; - ricostruire i proto-fonemi; - esaminare il sistema ricostruito tipologicamente. 2 Vd. anche http://it.wikipedia.org/.../wiki/Ricostruzione_linguistica. Lyovin 1997, pp. 3-5. Vd. Villar 1997; vd. anche: http://it.wikipedia.org/.../ wiki/Linguistica_comparativa. 3 4 La ricostruzione è quindi uno dei procedimenti fondamentali della linguistica storico-comparativa, mediante i quali si perviene a forme non attestate sulla base del confronto tra lingue conosciute o in conformità di comparazione interna. Il metodo comparativo permette così di ricostruire: - un suono (ad esempio *p indeuropeo); - una parola o un elemento lessicale (ad esempio *ph2tér "padre"); - un morfema (ad esempio *-os desinenza di nominativo singolare dei temi in o); - una lingua (ad esempio l'Indoeuropeo). Le forme ricostruite sono espresse mediante simboli che rappresentano le unità che si suppongono essere alla base delle forme poste a confronto. Per brevità queste forme sono definite "proto-forme" e presentate come fossero parole o suoni di una protolingua, anche se ovviamente non vi è alcuna garanzia sul fatto che tali forme siano realmente esistite. Quando le lingue di una stessa famiglia, poste a confronto, presentano tutte uno stesso suono in una data posizione di una parola, è ragionevole supporre che tale suono fosse presente anche nelle fasi comuni, nella protolingua. Quando invece i suoni sono diversi (ed è il caso più frequente), la "ricostruzione" opera cercando di stabilire quale suono giustifichi le forme storicamente attestate con la maggiore economia di cambiamenti intervenuti. Se ad esempio tutte le parole che significano "padre" nelle lingue indoeuropee cominciano per p- tranne le lingue celtiche (che hanno Ø) e quelle germaniche che hanno f-, la ricostruzione tradizionale ipotizza che nella protolingua vi fosse un suono iniziale *p- (non attestato), che sarebbe stato conservato nella maggior parte delle lingue, sarebbe caduto nelle lingue celtiche e passato a f in quelle germaniche. Talvolta la ricostruzione è più controversa e capita che gli studiosi siano divisi sul suono da ipotizzare e sul simbolo da impiegare per la "ricostruzione" stessa. Ad esempio, per un suono che appare come a nella maggior parte delle lingue indoeuropee, come i in sanscrito e come e oppure a od o in greco, vi sono tuttora molte divergenze nella ricostruzione. Un tempo, ad esempio, si ricostruiva un unico suono (ə, detto schwa), ma vi era dibattito tra chi riteneva che in origine vi fossero tre schwa differenti, fusi in un unico suono in tutte le lingue tranne il greco, e chi invece pensava che si dovesse ricostruire un solo schwa, i cui esiti in greco si sarebbero diversificati per ignoti motivi. Con la scoperta dell'Ittito e l'arrivo della teoria laringalistica, oggi è invece diffusa l'idea che si debbano ricostruire suoni non vocalici ma consonantici (delle laringali), distinti con un esponente numerico: H1, H2, H3. Il dibattito teorico sul senso della ricostruzione è stato particolarmente vivace tra XIX e XX secolo. Agli estremi opposti del dibattito si possono citare da una parte quanti ritenevano di compiere 5 realmente la "ricostruzione" di una lingua esistita (ad esempio August Schleicher4, che giunse al punto di scrivere una favoletta in "indoeuropeo ricostruito"), e dall'altra quanti (come Vittore Pisani5) rilevavano l'aspetto meramente strumentale della ricostruzione, una sorta di formule abbreviate che permettono di sintetizzare le corrispondenze fonetiche tra le lingue, ma senza pretese di una storicità delle formule ricostruite. Nonostante la sua assoluta scientificità, il modello comparativo classico presenta quindi dei limiti: - problemi con la storia delle linguistiche storiche6; - problemi con le ipotesi dei Neogrammatici, nella spiegazione di argomenti come: la presenza dei prestiti; la diffusione areale; le mutazioni casuali; l’analogia; l’applicazione graduale; - problemi all’interno del modello ad albero, già soppiantato nel XIX dal modello a onde; - la presunzione di un ben definito nodo (i rami, una volta separati, non dovrebbero più entrare in contatto); - la soggettività della ricostruzione. Nonostante tali limiti, i linguisti storici hanno usato sempre il metodo storico-comparativo come mezzo principale per individuare i rapporti fra le lingue. Il metodo, sviluppato e usato soprattutto nell’Indoeuropeistica, è stato esteso con successo fino a varie altre famiglie linguistiche nel mondo. Questo metodo richiede ai linguisti di esaminare un gruppo di somiglianze e differenze di lingue, di costruire un modello di ciò che i loro antenati non-attestati devono essere stati, per capire meglio come le lingue hanno raggiunto il loro attuale stato sincronico, e poi di raggruppare insieme le lingue in famiglie linguistiche basate sulle innovazioni comuni (shared innovations) derivanti dai loro antenati linguistici7. Tuttavia, nonostante i successi del metodo storico-comparativo, proprio il celebre Indoeuropeista Calvert Watkins8 affermava che il metodo 4 Schleicher 1874 (in Lehmann 1993, p. 26), p.8; vd. anche: http://it.wikipedia.org/ wiki/Ricostruzione_linguistica]. 5 Pisani 1979. 6 Lyovin 1997, pp. 4–5, pp. 7–8. 7 McMahon e McMahon 2005, pp. 9-10. 8 Watkins 1973, p. 101: “The reconstruction of Indo-European [via the historical-comparative method], the establishment, that is, of the grammar of that language to the best of our ability, is not our fundamental object, as it would be if we were writing a descriptive grammar of a known language. Rather, our ultimate aim is to write the linguistic history of known languages. We are seeking historical explanation for the grammar of languages accessible to us by observation or from written texts. Reconstruction is only a tool, a means to the end of understanding linguistic history. Even if we were, by some miracle, handed a complete grammar of Common Indo-European as spoken somewhere in, say, 4000 B.C. (the date is meaningless), the work of the Indo-Europeanist would scarcely be done. In fact, it would be barely begun. For his task would be, then as before, to relate the facts vouchsafed him to the facts of attested languages: to construct hypotheses, and to demonstrate precisely how it is possible, within a linguistic tradition or traditions, for a language to pass from one system at one point in time to another system at a later point”. 6 non è un fine in sé, ma piuttosto è un mezzo per lo scopo finale della comprensione della storia delle lingue, ovvero arrivare a capire come le lingue del mondo sono venuto ad essere come sono: “La ricostruzione dell’indoeuropeo [attraverso il metodo storicocomparativo], l'istituzione, cioè, della grammatica di quella lingua al meglio della nostra abilità, non è il nostro oggetto fondamentale, come sarebbe se stessimo scrivendo la grammatica descrittiva di una lingua conosciuta. Piuttosto, il nostro ultimo scopo è di scrivere la storia linguistica delle lingue conosciute. Stiamo cercandola spiegazione storica per la grammatica di lingue accessibili a noi attraverso l’osservazione o da testi scritti. La ricostruzione è soltanto uno strumento, un mezzo per il fine di comprendere la storia linguistica. Anche se, per un certo miracolo, fossimo arrivati a una grammatica completa dell’Indoeuropeo comune come parlato in qualche luogo per esempio nel 4000 a.C. (la data è insignificante), il lavoro dell’Indo-Europeista a malapena sarebbe stato fatto. Infatti, sarebbe appena cominciato”. Per questo, scopo precipuo della ricostruzione indoeuropeistica deve essere quello di collegare le forme ricostruite alle forme di lingue effettivamente attestate, in modo da costruire le ipotesi e dimostrare precisamente come è possibile per una lingua, dentro una tradizione o tradizioni linguistiche, passare da un sistema, in un determinato punto temporale, a un altro sistema in un punto successivo, per chiarire se il mutamento linguistico sia dovuto a graduale cambiamento o a sostituzione. In proposito, ancora l’indoeuropeista Calvert Watkins9 ha affermato che il metodo storico-comparativo ha inoltre come limite principale l’incapacità di assegnare le date esatte agli eventi di divergenza di lingua (its inability to assign exact dates to language divergence events) e una mancanza di rigore matematico per sostenere le asserzioni e le ipotesi che asserisce (a lack of mathematical rigor to back up the assertions and hypotheses it asserts), ed ha così descritto il modo in cui il metodo comparativo opera: “Non dobbiamo dimenticare, naturalmente, che la ricostruzione, la grammatica postulata che è considerata arbitrariamente il punto d’inizio del processo della linguistica storica [comparativo], è un artefatto che riflette lo stato contemporaneo dello sviluppo intellettuale. Per come esso è, è soggetto a cambiamento, proprio come lo sono tutti gli artefatti intellettuali o proposte scientifiche. Questa mutabilità si applica anche al modello dei rapporti di parentela tra un insieme di lingue, la configurazione dell'albero di famiglia, che può anche essere modificato -come ogni proposta scientifica - da nuovi dati. 9 Watkins 1973, p. 100 7 Poiché l'obiettivo della linguistica storica è non il confronto storico in sé, ma, come Watkins descrive, scoprire “la storia linguistica delle lingue conosciute10, e date certe debolezze del metodo comparativo storico, è ovvio che alcuni linguisti storici abbiano provato ad usare altri metodi, più matematici, per studiare la storia linguistica. Mentre da un lato Watkins contrasta la legittimità delle ricostruzioni generate con il metodo storico comparativo come modelli scientifici validi, dall’altro con tali affermazioni sta dichiarando chiaramente che le costruzioni del metodo storico-comparativo sono semplicemente uno strumento tra gli strumenti del linguista storico (comunque evidentemente quello predominante negli ultimi 200 anni) e che la nuova comprensione scientifica può certamente condurre a una revisione del modello dei rapporti linguistici di parentela prodotto dall'esercito di linguisti che sta affannosamente lavorando con il metodo comparativo storico da circa due secoli. 10 Watkins 1973, p. 101: “Given that the goal of historical linguistics is not historical comparison but, uncovering the linguistic history of known languages and given some of the weaknesses of the historical comparative method, some historical linguists have tried using other, more mathematical, methods to investigate linguistic history.” 8 2. Il Modello della mass o multilateral comparison di Greenberg 2.a. Il dibattito critico tra mass o multilateral comparison e metodo comparativo tradizionale Una delle vie per superare i limiti del metodo comparativo classico è stata percorsa da Joseph Greenberg, il quale intorno agli anni ’50, ha messo a punto la “mass comparison” (“comparazione di massa”), un metodo per determinare il livello di parentela genetica fra le lingue: il metodo, così definito da Greenberg già nel 195711, è stato a lungo rifiutato dai linguisti12, che vedono con scetticismo la tecnica da lui adottata, soprattutto perché spesso erroneamente interpretata, tanto che i suoi vari sostenitori13 hanno coniato l’espressione “multilateral comparison” (“comparazione multilaterale”) per renderne più esplicito il significato effettivo del metodo. 2.a.1. Il metodo La “mass comparison” consiste nell’impostare una tabella di items (unità lessicali) del vocabolario di base e di elementi morfologici nelle varie lingue da confrontare. Greenberg usa la seguente tabella per illustrare la tecnica adottata14. Essa mostra le forme di sei lemmi di vocabolario basico in nove lingue differenti, identificati qui da lettere: A B C D E F G H I Head kar kar se kal tu tu to fi pi Eye min ku min miŋ min aš min idi iri Nose tor tör ni tol was waš was ik am One mit kan kan kaŋ ha kan kεn he čak Two ni ta ne kil ne ni ne gum gun i sem sem fik pix Blood kur sem sem šam (Tab. in Greenberg 1957, pag. 41) Le relazioni di base possono essere determinate senza alcuna esperienza nel caso delle lingue che sono ragionevolmente strettamente imparentate. 11 Greenberg 1957, pp. 41sg. Possono essere considerati anti-Greenbergiani: Campbell 2001, p. 45; Clifton 2001; HockHenrich-Joseph 1996; Kessler 2003; Kessler-Lehtonen 2006; Matisoff 1990 (che ribattezza il nome di mass in “megalocomparison"); Poser-Campbell 1992; Georg, Stefan-Vovin 2003, che provocatoriamente converte l’espressione “Mass Comparison” in “Mess Comparison” 13 Sono Greenbergiani: Newman, 1995; Ruhlen 1994a e b; Bengtson-Ruhlen, 1994. 14 Greenberg 1957, p. 41. 12 9 Il fatto di conoscere poco dei probabili percorsi di cambiamento fonologico permette che si vada molto più velocemente nel confronto. Un tipologo esperto -non bisogna dimenticare che Greenberg fu solo un pioniere nel campo- può oggi riconoscere o rifiutare rapidamente parecchie potenziali relazioni di parentele in questa tabella come probabili o improbabili. Per esempio, il passaggio p > f è molto frequente, il passaggio f > p molto di meno, permettendo così di ipotizzare che fi:pi e fik:pix sono effettivamente imparentati (related) e risale alle proto forme *piand *pik/x, mentre la conoscenza che k>x è molto frequente, x> k molto di meno, così da permettere di scegliere *pik rispetto a *pix. Sebbene la mass comparison non tenti per nulla di produrre le ricostruzioni delle protolingue – infatti secondo Greenberg15 questo obiettivo appartiene a una fase successiva di studio – tuttavia le considerazioni fonologiche entrano in gioco fin dall'inizio della comparazione. Ruhlen16, il massimo difensore delle teorie di Greenberg, spiega che le tabelle utilizzate nella ricerca concreta devono coinvolgere un numero molto più grande di “voci” (items) e di lingue. Gli items inclusi possono essere sia lessicali come 'hand' , 'sky' e 'go' , sia morfologici, come PLURALE e MASCHILE. Inoltre, sempre riguardo al metodo, Ruhlen17 puntualizza che tale tecnica di classificazione, da lui denominata appunto "multilateral comparison" (da contrapporre appunto al cosiddetto “metodo tradizionale” dei Neogrammatici) consiste nel confrontare gli elementi selezionati della morfologia e del vocabolario di base delle lingue studiate (il notevole ampliamento del numero di lingue campionate è condizione essenziale), esaminandole per le somiglianze nel suono e nel significato, e nel formulare un'ipotesi della classificazione basato su questi due elementi. Lo studioso ribadisce che tale classificazione è il primo passo nel metodo comparativo e che gli altri procedimenti di linguistica storica, in particolare la formulazione delle corrispondenze di suono e la ricostruzione di una protolingua, possono essere effettuati soltanto dopo che è stata stabilita un'ipotesi di classificazione di questo tipo. L'applicazione del confronto di massa ha portato Greenberg non solo a proporre nuove classificazioni ma a confutare parte di quelle precedentemente accettate (l’esempio più noto è quello in relazione alla famiglia linguistica dell’Hamitico). Nonostante lo scetticismo diffuso circa il suo metodo, alcuni dei rapporti genealogici stabiliti da Greenberg sono stati gradualmente accettati (per esempio l’Afroasiatico, cioè Antico Egiziano, Ebraico biblico e Accadico, e il ceppo Niger-Congo); altri sono ampiamente accettati, anche 15 Greenberg, 2005, p. 318. Ruhlen 1987, p. 120. 17 Ruhlen 1994b e Bengtson-Ruhlen- 1994 e pp. 277–336: p. 291, n. 3. 16 10 se discussi da alcuni (per esempio il Nilo-Sahariano), altri sono per lo più rifiutati ma hanno alcuni sostenitori (per esempio il Khoisan), mentre altri sono stati ampiamente rifiutati ed hanno soltanto pochi difensori (per esempio l’Amerindio)18. 2. a. 2. Rilevazione dei prestiti (detection of borrowings) I detrattori della mass comparison sostengono generalmente che il confronto totale non è in grado di distinguere le forme prese in prestito da quelle ereditate (has no means to distinguish borrowed forms inherited ones), a differenza del metodo di ricostruzione comparativa tradizionale, che è in grado di fare ciò attraverso le corrispondenze regolari di suono (through regular sound correspondences). Queste questioni sono state affrontate da Greenberg 19 già dagli anni ’50. Così egli descrive i punti chiave del suo metodo: - Il vocabolario di base, proprio perché costituito (per definizione) da significati universali, naturali, presenti in tutte le lingue, non dovuto ad elementi culturali ma attinenti all’esperienza del genere umano e alla natura (padre, madre, occhio, mano, piede, acqua, fuoco…), è molto meno portato ad acquisire prestiti rispetto al vocabolario culturale, come manufatti o oggetti (“Basic vocabulary is much less readily borrowed than cultural vocabulary”). - I morfemi derivazionali, flessionali e pronominali, e le alternazioni morfologiche sono le meno soggette di tutti al prestito ("Derivational, inflectional, and pronominal morphemes and morph alternations are the least subject of all to borrowing."). - Qualunque tipo di item linguistico può essere preso in prestito occasionalmente; tuttavia, il vocabolario fondamentale di base è prova di per sé, per definizione, contro l’eventualità di un “prestito di massa” (“Any type of linguistic item may be borrowed "on occasion". However, "fundamental vocabulary” is proof against mass borrowing”). - E’ vero che la mass comparison non possiede i mezzi per distinguere il prestito in ogni caso, ovvero "in particolari e rari casi il problema della possibilità di un prestito può essere dubitabile" (“Mass comparison does not possess means to distinguish borrowing in every instance: "in particular and infrequent instances the question of borrowing may be doubtful"). Tuttavia, è sempre possibile rilevare se il prestito è responsabile di "una somiglianza di massa" fra due o più lingue: "Dove una massa di somiglianze è dovuta alla presa in prestito, tenderanno a comparire nel vocabolario culturale e a raggrupparsi in determinati campi semantici che riflettono la natura culturale del contatto-parentela." (However, it is always possible to detect whether borrowing is responsible for "a mass of resemblances" between languages: "Where a mass of resemblances is due to borrowing, 18 19 Greenberg 2000 e 2002. Greenberg 1957, p. 39. 11 they will tend to appear in cultural vocabulary and to cluster in certain semantic areas which reflect the cultural nature of the contact."). - Il metodo della mass comparison, in contrasto con il “confronto bilaterale” tradizionale (bilateral comparison), permette proprio di controllare se le forme sono prese in prestito o no (The technique of mass comparison, as opposed to bilateral comparison, provides a check on whether forms are borrowed or not)20. Il prestito non può mai essere una spiegazione generale di una massa di somiglianze di base ricorrenti in molte lingue che si trovano su un’ampia zona geografica (“Borrowing can never be an over-all explanation of a mass of recurrent basic resemblances in many languages occurring over a wide geographical area”). Quando si trovano insiemi indipendenti di somiglianze fra ogni coppia di lingue, fra ogni gruppo di tre lingue, e così via, si dovrebbe ritenere che ogni lingua dovrebbe aver preso in prestito da ogni altra ("Since we find independent sets of resemblances between every pair of languages, among every group of three languages, and so on, each language would have to borrow from every other”). - “Ricorrenti corrispondenze di suono” (assunto tipico del metodo comparativo tradizionale) non bastano a rilevare i prestiti, giacché "dove i prestiti sono numerosi, questi mostrano spesso tali corrispondenze" ("Recurrent sound correspondences" do not suffice to detect borrowing, since "where loans are numerous, they often show such correspondences")21. Greenberg ritiene quindi che i risultati raggiunti con questo metodo si avvicinino alla certezza: "La presenza di somiglianze nel vocabolario fondamentale di base e di somiglianze negli items con funzione grammaticale, specialmente se ricorrente in un certo numero di lingue, è un'indicazione sicura di relazione genetica ("The presence of fundamental vocabulary resemblances and resemblances in items with grammatical function, particularly if recurrent through a number of languages, is a sure indication of genetic relationship")22. 2.a. 3. Il ruolo delle “regolari corrispondenze di suono” Viene spesso evidenziato che Greenberg ha cercato di sostituire il metodo comparativo con un nuovo metodo, la mass comparison appunto (o, com’è definita dai suoi critici meno scrupolosi, "mass lexical comparison"). Greenberg ha rifiutato costantemente questa definizione, dichiarando: "I metodi descritti qui non sono in conflitto in alcun modo con il metodo comparativo tradizionale” 23 ed esprimendo meraviglia riguardo alla “sconosciuta e ampiamente diffusa idea che cerchi di sostituire il metodo comparativo con una sua nuova e sconosciuta invenzione" 24. Greenberg 1957, p. 40. Greenberg 1957, pp. 39-40. 22 Greenberg 1957, p. 39. 23 Greenberg 1957, p. 44. 24 Greenberg 2002, p. 2. 20 21 12 Secondo Greenberg, il confronto di massa dovrebbe essere, ed è, il "primo necessario step del metodo comparativo (mass comparison is the necessary "first step" in the comparative method)25 e afferma: "una volta raccolto uno stock ben definito di lingue, io vado avanti a comparare e a ricostruire come chiunque altro, come può essere visto nei miei vari contributi di linguistica storica” ("once we have a well-established stock I go about comparing and reconstructing just like anyone else, as can be seen in my various contributions to historical linguistics")26. Riflettendo sull'empirismo metodologico, che pure è presente nel suo lavoro tipologico, egli ha osservato fatti di maggior peso rispetto alle loro interpretazioni, dichiarando27: “La ricostruzione di un sistema fonologico originale ha la condizione di una teoria esplicativa per rappresentare le etimologie già forti in altri campi. Fra il *vaida di Bopp e il *γwoidxe di Sturtevant si trovano più di cento anni di sviluppo intenso di ricostruzione fonologica indoeuropea. Ciò che è rimasto costante è stata la validità del rapporto etimologico fra sanscrito veda, greco (#)oŒda /woida/, gotico wita, tutti con il significato di “Io so”, e molte altre incrollabili etimologie sia di radice che di morfemi non-radice riconosciuti a prima vista. E chi sarà abbastanza audace da congetturare da quale forma originaria l’indoeuropeista tra cento anni deriverà queste stesse forme?” “Reconstruction of an original sound system has the status of an explanatory theory to account for etymologies already strong on other grounds. Between the *vaida of Bopp and the *γwoidxe of Sturtevant lie more than a hundred years of the intensive development of Indo-European phonological reconstruction. What has remained constant has been the validity of the etymologic relationship among Sanskrit veda, Greek woida, Gothic wita, all meaning "I know", and many other unshakable etymologies both of root and of non-root morphemes recognized at the outset. And who will be bold enough to conjecture from what original the Indo-Europeanist one hundred years from now will derive these same forms?”). In sintesi, la teoria della mass comparison sostiene, riguardo alla questione delle “corrispondenze di suono”, che: - un gruppo di lingue è genealogicamente correlato da parentela quando mostrano numerose somiglianze nel vocabolario di base, compresi i pronomi e i morfemi, formando un modello di collegamento comune al gruppo; - se è vero che la mass comparison non può identificare ogni singola istanza di prestito, può tuttavia identificare vasti percorsi di prestito (broad patterns of borrowing), che sono sufficienti a stabilire un rapporto genetico; 25 Greenberg 1957, p. 44. Greenberg 1990, citato in Ruhlen 1994b, p. 285. 27 Greenberg 1957, p. 45. 26 13 - i risultati raggiunti si avvicinano alla certezza; - è inutile stabilire gli insiemi di regolari corrispondenze fonetiche o di forme ancestrali ricostruite per identificare i rapporti genetici. Al contrario, non è possibile stabilire tali corrispondenze o ricostruire tali forme finché i rapporti genetici non sono identificati. 2. a. 4. Confronto del lessico e di elementi grammaticali. E’ ampiamente dato per scontato fra i linguisti che il metodo di Greenberg di classificazione delle lingue si limiti soltanto alla comparazione di parole, del lessico quindi, e che trascuri gli elementi grammaticali, i quali, giacché più stabili, sarebbero in grado spesso di fornire la prova più decisiva per il rapporto o il non-rapporto di parentela tra lingue. Tali detrattori affermano, infatti, che il metodo di Greenberg sarebbe conosciuto come “mass lexical comparison” (comparazione lessicale di massa)28. In realtà, come già ricordato, Greenberg non ha mai usato l’espressione “mass lexical comparison”. Non si trova in nessuno dei suoi principali lavori sulla classificazione delle lingue o in qualsiasi altro luogo dei suoi lavori. Non si trova ad esempio in Greenberg 1955, 1957, 1960, 1971, 1987, 2000-2002, o 2005. Inoltre, l’espressione “mass lexical comparison” non è usata neppure dai sostenitori di Greenberg, per esempio John Bengtson29, Harold C. Fleming30 , Paul Newman31, Merritt Ruhlen32, ed altri. Vd. Kessler 2001, p. IX. 29 Vd. Bengtson 1994, e altri lavori: 1994. Edward Sapir and the 'Sino-Dene' Hypothesis. Anthropological Science 102.3: 207-230; 1995. (with Václav Blažek) Lexica DeneCaucasica. Central Asiatic Journal 39.1: 11-50; 39.2: 161-164.; 1997. Ein Vergleich von Buruschaski und Nordkaukasisch. Georgica 20: 88-94; 1998. Caucasian and Sino-Tibetan: A Hypothesis of S.A. Starostin. General Linguistics 36.1/2: 33-49; 1999. Wider genetic affiliations of the Chinese language. Journal of Chinese Linguistics 27.1: 1-12; 2000. (with Václav Blažek) Lexical Parallels Between Ainu and Austric, and Their Implications. Archiv Orientální 68: 237-258.; 2003. Notes on Basque Comparative Phonology. Mother Tongue 8: 21-39; 2004. Some features of DeneCaucasian phonology (with special reference to Basque). Cahiers de l'Institut de Linguistique de Louvain, 30.4: 33-54. 30 Vd. Fleming 2000-2001 e una selezione dei suoi lavori: 1969. "The classification of West Cushitic within Hamito Semitic." In Eastern African History, edited by Daniel McCall, Norman Bennett, and Jeffrey Butler, 3-27. Boston University Studies in African History 3; 1976. "Cushitic and Omotic." In Language in Ethiopia, edited by M. Lionel Bender et al., 34-53.; 1978. "Microtaxonomy: Language and blood groups in the Horn of Africa." In Proceedings of the Fifth International Conference of Ethiopian Studies, Session B, April 13-16, 1978, edited by Robert Hess, 25-49.; 1982. "Kuliak external relations: Step one." In Nilotic Studies, from Proceedings of the International Symposium on Languages and History of the Nilotic Peoples, Cologne, January 4-6, 1982, Volume 2, 423-478.; 1987. "Hadza and Sandawe genetic relations." In Proceedings of the International Symposium on African Hunters and Gatherers, edited by Franz Rottland, 157-189. Sprache und Geschichte in Africa, Volume 7.2.; 1988. "Towards a definitive classification of human languages", review of A Guide to the World’s Languages by Merritt Ruhlen. Diachronica4, 28 14 Probabilmente la critica più influente contro la mass comparison è stata quella da parte di Lyle Campbell33, il quale afferma appunto che il metodo di Greenberg di classificazione della lingua “si basa solo sulle somiglianze superficiali del vocabolario (lessico)” ("relies on inspectional similarities in vocabulary alone"). In particolare Campbell, nella sua Linguisitca, presenta Greenberg stesso e il suo metodo in questi termini: “Il più noto dei metodi che contano sulle somiglianze superficiali fra unità lessicali è quello sostenuto da Joseph Greenberg, metodo denominato “comparazione multilaterale (o di massa)”: esso si basa sull’esame di “molte lingue attraverso alcune parole, piuttosto che alcune lingue attraverso molte parole” (It is based on 'looking at ... many languages across a few words' rather than at 'a few languages across many words')34. “Le somiglianze lessicali determinate tramite controllo visivo superficiale che sono condivise attraverso molte lingue, da sole sono prese come prova, evidenza, del rapporto genetico. Questo metodo si arresta dove altri cominciano, al montaggio delle somiglianze del lessico. Queste somiglianze superficiali devono essere analizzate per determinare perché esse sono tali, se la somiglianza è dovuta a eredità da un antenato comune (il risultato di un rapporto genetico distante) o al prestito, al caso accidentale, all’onomatopea, al simbolismo fonetico, alle formazioni infantili” 35. Poiché il confronto multilaterale non fa questo, i relativi risultati sono stati considerati discutibili, controversi e rifiutati dalla maggior parte dei “linguisti storici tradizionali”. In breve, nessuna tecnica che conta 159-223.; 1991. "A new taxonomic hypothesis: Borean or Boralean." Mother Tongue 14 (Newsletter of ASLIP), 16 pp.; 2000. "Glottalization in Eastern Armenian." Journal of IndoEuropean Studies 28.1-2, 155-196.; 2002. "Shabo: A new African phylum or a special relic of Old Nilo-Saharan?" Mother Tongue: The Journal 7, 1-38; 2002. "Afrasian and its closest relatives: The Borean hypothesis" (Abstract of paper.); 2006. Ongota: A Decisive Language in African Prehistory. Wiesbaden: Otto Harrassowitz. 31 Newman 1995; e altri lavori: 1977: Modern Hausa-English Dictionary / Sabon Kamus Na Hausa Zuwa Turanci. Ibadan, Nigeria: Oxford University Press; 1980: The Classification of Chadic within Afroasiatic. Leiden: Universitaire Pers Leiden.; 1990: Nominal and Verbal Plurality in Chadic. Dordrecht: Foris; 2000: The Hausa Language: An Encyclopedic Reference Grammar. New Haven: Yale University Press; 2001: With Martha Ratliff (editors). Linguistic Fieldwork. Cambridge: Cambridge University Press; 2002: Chadic and Hausa Linguistics: Selected Papers of Paul Newman, with Commentaries, edited by Philip J. Jaggar and H. Ekkehard Wolff. Köln: Rudiger Köppe Verlag.; 2004: Klingenheben’s Law in Hausa. Köln: Rudiger Köppe Verlag; 2007: A Hausa-English Dictionary. New Haven: Yale University Press. 32 Ruhlen 1987, 1994a e b. 33 Campbell 2004, p. 348. 34 Greenberg 1987, p. 23. 35 The lexical similarities determined by superficial visual inspection which are shared 'across many languages' alone are taken as evidence of genetic relationship. This approach stops where others begin, at the assembling of lexical similarities. These inspectional resemblances must be investigated to determine why they are similar, whether the similarity is due to inheritance from a common ancestor (the result of a distant genetic relationship) or to borrowing, accident, onomatopoeia, sound symbolism, nursery formations. (Campbell 2004, p. 348sg.). 15 esclusivamente sulle somiglianze superficiali nel lessico da solo è dimostrata come sufficientemente adeguata per stabilire rapporti di parentela distanti. Greenberg ha confutato nei fatti l'affermazione secondo la quale egli si sarebbe basato solo sulla comparazione della somiglianza superficiale del lessico: è arrivato a pubblicare il primo volume del suo lavoro sulla “famiglia Eurasiatica” del 2000-200236, basato sui confronti grammaticali, due anni prima del secondo volume, basato sui confronti di vocabolario, proprio nel tentativo di dare una dimostrazione di ciò: “questa prova grammaticale è abbastanza sufficiente in sé per stabilire la validità della famiglia linguistica Eurasiatica. Ho scelto di pubblicarlo per primo per vari motivi. Uno di questi…è che, malgrado tutti i fatti riguardanti la presentazione delle prove per i ceppi linguistici nel mio lavoro precedente, continua a persistere il mito che io considero soltanto la prova della comparazione del lessico” 37. Tipico dell’uso del confronto morfologico di Greenberg è il seguente38: “In fonologia, la prova più importante dei rapporti di parentela tra Khoisan e Ottentotto è fondamentalmente la frequenza dei suoni occlusivi (click sounds) e il ruolo essenziale che essi giocano nell’economia del linguaggio. Come in altre lingue Khoisan, essi ricorrono soltanto all’inizio di parola. L’Ottentotto condivide con le lingue dei boscimani il seguente metodo distintivo della formazione di radici in cui le occlusive giocano un ruolo fondamentale di divisione. Le radici di verbo, nome e aggettivo sono principalmente bisillabiche, o possono essere ricostruite come se una volta fossero state bisillabiche. Le radici cominciano il più delle volte con una consonante occlusiva, a volte con una consonante non-occlusiva ovvero continua (non-click consonant). Questa è seguita da un gruppo limitato di vocali in seconda posizione, fondamentalmente /o/ o /a/. La terza posizione è libera oppure vi si trova una delle poche consonanti continue: /r/, /m/, /n/ o una labiale (nell’Ottentotto di Nama il fonema /p/). Nella quarta posizione o in finale di parola troviamo l'insieme completo delle vocali /a/, /e/, /i/, /o/, o /u/. 39 36 Greenberg 2000 e 2002. “This grammatical evidence is quite sufficient in itself to establish the validity of the Eurasiatic language family. I have chosen to present it first for several reasons. One of these ... is that, despite all the facts regarding the presentation of evidence for linguistic stocks in my previous work, the myth persists that I only take into account vocabulary evidence”. (Greenberg 2000, cap. VII) 38 Greenberg 1955, pp. 82-83. 39 “In phonology, the most important evidence of the basically Khoisan relationships of Hottentot is the frequency of the click sounds and the essential part they play in the economy of the language. As in other Khoisan languages, they only occur initially. Hottentot shares with the Bushman languages the following 37 16 Nel suo lavoro sulle classificazioni africane, il metodo è lo stesso: comincia con una discussione sulla morfologia e poi continua con alcune pagine di comparazione lessicale. Vari confronti tra il numero di pagine dedicate alle comparazioni grammaticali contro quelle del lessico, dall’inizio, alla metà e alla fine della carriera di Greenberg, mostrano lo stesso modello: in Greenberg 1955 (sulle lingue dell’Africa), ci sono 38 pagine dei confronti grammaticali, contro 25 di confronti del lessico. In Greenberg 1971 (sull’Indo-Pacifico) ci sono 21 pagine di confronti grammaticali contro 34 di comparazioni lessicali. In Greenberg 2000-2002 (sull’Eurasiatico) ci sono 179 pagine di confronti grammaticali contro 181 di confronti del lessico. Greenberg non ha raggiunto quindi questa posizione alla fine della sua carriera, ma è stata fin dall’inizio una sua impostazione ben chiara. Come già aveva fatto nel 1956, così ha dichiarato nel 200540: “Soltanto quelle somiglianze che coinvolgono simultaneamente sia il suono sia il significato sono considerate rilevanti per connessioni storiche. Quando i morfemi in questione sono radici, questo è denominato confronto del lessico, quando sono affissi, confronto grammaticale. Non c’è contraddizione nei risultati raggiunti dal confronto del lessico e dal confronto grammaticale ed entrambi i metodi sono impiegati il più possibile”. In sintesi, i linguisti storici tradizionali ritengono che Greenberg abbia sostenuto e abbia praticato una tecnica limitata al confronto del lessico (lexical comparison), ma gli scritti pubblicati da Greenberg mostrano che egli ha sostenuto l'uso sia dei dati del lessico sia dei dati grammaticali e che questi desiderata teorici sono stati da lui messi effettivamente in pratica nei suoi lavori. Nessuna tecnica come pura "mass lexical comparison" è mai esistita, se non nelle parole dei detrattori del metodo. distinctive method of root formation in which the clicks play a fundamental part. Verb, noun and adjective roots are mostly disyllabic, or can be reconstructed as once having been disyllabic. The roots begin most frequently with a click, sometimes with a non-click consonant. This is followed by a restricted group of vowels in the second position, basically o or a. The third position is either vacant or one of a small number of nonclick consonants occur: r, m, n or a labial (in Nama Hottentot phonemically a p). In the fourth or final position we find the full set of vowels - a, e, i, o, or u.” (Greenberg 1955, pp. 83sg.). 40 Greenberg 2005, p. 60: “Only those resemblances which involve both sound and meaning simultaneously are considered relevant for historical connections. When the morphemes involved are roots this is called lexical comparison, when they are affixes, grammatical. There is no contradiction in the results attained by lexical and grammatical comparison and both methods are employed as far as possible”. 17 2.a. 5. L’eredità del metodo comparativo classico Il dibattito sulla mass comparison può essere visto anche, e soprattutto, come disputa sulla validità ed eredità del tradizionale metodo comparativo, sviluppato nel XIX secolo dai linguisti danesi e tedeschi (Bopp, Rask, Grimm, Delbruck, Brugmann, cosiddetti Neogrammatici) per lo studio delle lingue indoeuropee. I detrattori di Greenberg sostengono tenacemente che, sin dallo sviluppo della linguistica comparativa, un linguista che affermi che due lingue sono tra loro imparentate, indipendentemente dal fatto che esista una prova storica di tale relazione, è tenuto a sostenere quell’affermazione presentando regole generali che descrivono le differenze fra i loro lessici, morfologie e grammatiche.41 Com’è noto, ad esempio, uno potrebbe dimostrare che lo Spagnolo è imparentato con l’Italiano mostrando che molte parole della prima lingua possono essere associate alle parole corrispondenti della seconda da un insieme relativamente piccolo di regole di rimontaggio (replacement rules) – come ad esempio la corrispondenza di -es e -s iniziale, - di -os e -i finali. Molte simili corrispondenze esistono fra le grammatiche delle due lingue. Poiché è molto improbabile che quelle corrispondenze sistematiche siano coincidenze casuali (systematic correspondences are extremely unlikely to be random coincidences), la spiegazione molto più probabile è che le due lingue si siano evolute da una singola lingua atavica, da una comune matrice (il Latino, in questo caso). Tutti i raggruppamenti preistorici di lingua che sono oggi ampiamente accettati - come le famiglie linguistiche dell'Indoeuropeo, delle lingue Uraliche, Algonchine e Bantu -sono stati dimostrati in questo modo, secondo questo metodo, ritenuto rigorosamente scientifico e inoppugnabile. All’assunto fondamentale dei detrattori di Greenberg si può rispondere che in realtà lo sviluppo effettivo del metodo comparativo dei Neogrammatici fu un processo più graduale di quanto i suddetti detrattori supponessero, e che il metodo di Greenberg è molto più immediato, semplice e intuitivo. Il metodo comparativo, infatti, ha avuto tre momenti decisivi di sviluppo: il primo fu l’osservazione di Rasmus Rask nel 181842 in riferimento ad un possibile regolare cambiamento di suono nelle consonanti germaniche; il secondo fu l’estensione da parte di Jacob Grimm di quest’osservazione in un principio generale (la nota legge di Grimm) nel 1822; il terzo fu l’individuazione, da parte di Karl Verner, di un'irregolarità in questo cambiamento di suono (la celebre legge di Verner) nel 1875. 41 42 vd. Beekes 1995; Campbell 2004. Rask 1818. 18 Soltanto nel 1861, August Schleicher, per la prima volta, fece ricostruzioni sistematiche delle proto-forme indoeuropee43. Schleicher, tuttavia, ha definito queste ricostruzioni come estremamente sperimentali44. Egli non ha mai sostenuto che queste hanno dimostrato l'esistenza della famiglia indoeuropea, esistenza che comunque aveva accettato come dato dalla ricerca precedente – soprattutto da quella di Franz Bopp, il suo grande predecessore negli studi indoeuropei. Karl Brugmann45, che considerò Schleicher esponente di primo piano degli studi dell’Indoeuropeo, e gli altri Neogrammatici di fine XIX secolo, hanno tratto dal lavoro di questi eruditi il famoso principio secondo il quale "ogni cambiamento di suono, finché accade automaticamente, avviene secondo leggi che non ammettono eccezioni”46. I Neogrammatici, tuttavia, non hanno considerato le corrispondenze regolari di suono o le ricostruzioni comparative come rilevanti rispetto alla prova del rapporto genetico fra le lingue. Infatti, non hanno quasi rilasciato dichiarazioni su come le lingue devono essere classificate47. L'unico neogrammatico a occuparsi di questo problema fu Berthold Delbrück, collaboratore del Brugmann su “Der di Grundriß vergleichenden il der di Grammatik indogermanischen Sprachen (1886-1916)48. Secondo Delbrück49 Bopp aveva dimostrato l'esistenza dell’Indoeuropeo nel modo seguente: “La prova è stata prodotta giustapponendo parole e forme di significato simile. Quando si considera che in queste lingue la formazione delle forme flessive del verbo, del nome e del pronome, concorda negli elementi essenziali e similarmente che un numero straordinario di parole flesse coincide nelle loro parti del lessico, l’assunto di probabilità di accordo deve sembrare irragionevole, assurdo.” 50 43 Lehmann 1993, p. 26. Schleicher 1874, p. 8. 45 Vd. http://www.utexas.edu/cola/centers/lrc/books/read14.html: Winfred P. Lehman, A Reader in Nineteenth Century Historical Indo-European Linguistics, cap. XIV: "Hermann Osthoff and Karl Brugmann, Preface to Morphological investigations in the Sphere of the IndoEuropean Languages, I, From Morphologische Untersuchungen auf dem Gebiete der indogermanischen Sprachen I (Leipzig: S. Hirzel, 1878) pp. iii-xx. 46 Brugmann 1878, "every sound change, insofar as it occurs automatically, takes place according to laws that admit of no exception" . 47 Greenberg 2005, p.158. 48 Greenberg 2005, p.158-159 e p. 288. 49 Delbrück 1904, p.121-122, citato da Greenberg 2005, p.159. 50 “The proof was produced by juxtaposing words and forms of similar meanings. When one considers that in these languages the formation of the inflectional forms of the verb, noun and pronoun agrees in essentials and likewise that an extraordinary number of inflected words agree in their lexical parts, the assumption of chance agreement must appear absurd.” 44 19 Inoltre, Delbrück ha assunto la posizione in seguito enunciata proprio da Greenberg sulla priorità delle etimologie rispetto alle leggi fonetiche: "Le etimologie evidenti sono il materiale da cui sono dedotte le leggi fonetiche"51. L'opinione che le corrispondenze fonetiche o, in un'altra versione, la ricostruzione di una proto-lingua, sono necessarie per mostrare relazioni tra lingue, quindi, risale al XX secolo, non al XIX secolo, e non fu mai una posizione dei Neogrammatici. In effetti l’Indoeuropeo era stato riconosciuto da studiosi come William Jones (1786)52 e da Franz Bopp (1816) molto prima dell'elaborazione del metodo comparativo. Inoltre, l’Indoeuropeo non è stato la prima famiglia linguistica a essere stata individuata dagli studiosi di Linguistica: la lingua Semitica era stata identificata dagli studiosi europei nel XVII secolo; l’ugro-finnico nel XVIII; il Dravidico a metà del XIX secolo da Robert Caldwell53, molto prima della pubblicazione delle ricostruzioni comparative di Schleicher. Per finire, l’affermazione che tutte le famiglie linguistiche, generalmente accettate dai linguisti oggi, sono state dimostrate con il metodo comparativo è falsa. Per esempio, anche se l'Eschimese-Aleutino è stato lungamente accettato come famiglia valida, il Proto-EschimeseAleutino ancora non è stato ricostruito (reconstructed) 54. Altre famiglie sono state accettate per decenni prima che fossero proposte le loro ricostruzioni comparative, per esempio l’Afro-Asiatico e il Sino-Tibetano. Molte lingue sono generalmente accettate come appartenenti a una famiglia linguistica, anche se nessuna ricostruzione comparativa esistesse, spesso perché le lingue sono attestate soltanto in forma frammentaria, come la lingua anatolica Lidia55. Al contrario, dettagliate ricostruzioni comparative esistono per alcune famiglie linguistiche che tuttavia rimangono discutibili, quali l’Altaico e il Nostratico. Tuttavia, è qui necessario fare dei distinguo: il Nostratico è una 51 Delbrück 1884, p. 47, citato da Greenberg 2005, p.288: “obvious etymologies are the material from which sound laws are drawn." 52 E’ nota la celebre osservazione di Sir William Jones, il filologo inglese vissuto in India, nel 1786: “The Sanscrit language, whatever be its antiquity, is of a wonderful structure; more perfect than the Greek, more copious than the Latin, and more exquisitely refined than either, yet bearing to both of them a stronger affinity, both in the roots of verbs and the forms of grammar, than could possibly have been produced by accident; so strong indeed, that no philologer could examine them all three, without believing them to have sprung from some common source, which, perhaps, no longer exists. There is a similar reason, though not quite so forcible, for supposing that both the Gothick and the Celtick, though blended with a very different idiom, had the same origin with the Sanscrit; and the old Persian might be added to the same family.” 53 Caldwell 1856. 54 Bomhard 2008, p.209. 55 Greenberg 2005, p. 161. 20 proto-lingua proposta, mentre l’Altaico è una "semplice" protolingua - con le lingue Altaiche ampiamente accettate come tipologicamente correlate. I detrattori di entrambe le proposte semplicemente sostengono che i dati raccolti, per provare, attraverso la comparazione, l'esistenza di entrambe le famiglie, sono limitati, errati e non sufficienti. Si tenga presente che le regolari corrispondenze fonologiche hanno bisogno che migliaia di liste lessicali siano preparate e confrontate prima di essere stabilite. Queste liste sono carenti per entrambe le famiglie proposte. Inoltre, altri problemi specifici interessano le liste "comparative" di entrambe le proposte, come l'attestazione tarda per le lingue Altaiche, o il confronto di proto-forme non certe, come il proto-Kartveliano, per il Nostratico56. Greenberg ha sempre sostenuto che in fondo egli stava solo continuando il semplice ma efficace metodo di classificazione delle lingue che aveva portato alla scoperta di numerose famiglie linguistiche prima dell'elaborazione del metodo comparativo classico dei Neogrammatici57 e che aveva continuato a operare allo stesso modo da allora in poi, come nel caso della classificazione dell’Ittito come lingua indoeuropea nel 191758, classificazione effettuata solo sulla base di un limitato numero di parole attestate. Questo metodo consiste essenzialmente in due passaggi: confronto della forma del significato di una parola “attraverso” una molteplicità di lingue, e analisi delle somiglianze nel vocabolario di base (lessico) e nei morfemi flessionali. Se la mass comparison differisce in qualche modo dal metodo comparativo, sembrerebbe essere nella teorizzazione di un metodo, di un approccio che era stato in precedenza applicato in un modo relativamente ad hoc e con i seguenti presupposti: - la preferenza esplicita per il vocabolario di base anziché per il vocabolario culturale (the explicit preference for basic vocabulary over cultural vocabulary); - l'esplicita enfasi sul confronto di una molteplicità di lingue piuttosto che su confronto bilaterale tra due sole lingue (the explicit emphasis on comparison of multiple languages rather than bilateral comparisons); - il numero molto grande di lingue confrontate simultaneamente, fino a diverse centinaia (the very large number of languages simultaneously compared (up to several hundred); - l'introduzione di percorsi di cambiamento fonetico basati sulla tipologia (the introduction of typologically based paths of sound change). Le posizioni di Greenberg e dei suoi critici sembrano quindi fornire una scelta rigidamente contrapposta: Per un’approfondita visione dell’applicazione di questo metodo comparativo vd. Trask 1996, capp. 8-13 e Ciancaglini 2005. 57 Greenberg 1955, pp.1-2 e Greenberg 2005, p.75. 58 Greenberg 2005, pp.160-161. 56 21 - secondo Greenberg l'identificazione delle corrispondenze fonetiche e la ricostruzione delle protolingue risultano dalla classificazione genetica; -secondo i critici di Greenberg la classificazione genetica risulta dall'identificazione di corrispondenze fonetiche o dalla ricostruzione di protolingue. Come si è ripetutamente ricordato, oltre ai cambiamenti sistematici, le lingue sono anche soggette alle mutazioni casuali (quali i prestiti dalle altre lingue, flessioni irregolari, formazioni di composti e abbreviazioni), che influenzano una parola alla volta, o piccoli gruppi di parole. Per esempio, lo spagnolo perro (cane) non viene dal Latino, e non potrebbe essere “intabellato”, messo in relazione, al suo equivalente italiano cane (la parola spagnola can dovrebbe essere l'equivalente discendente dal Latino, ma è molto meno utilizzata nelle conversazioni quotidiane, essendo riservata per scopi più formali). Potrebbero essere comunque indicati entrambi come sinonimi semantici. Come quegli sporadici cambiamenti si andranno accumulando, essi andranno a oscurare sempre di più i cambiamenti sistematici - proprio come delle macchie e graffiature su una fotografia invecchiata alla fine renderanno l’immagine irriconoscibile. Su questo punto, Greenberg e i suoi critici concordano, così come contro la scuola di Mosca, ma traggono conclusioni contrastanti: - i critici di Greenberg sostengono che il metodo comparativo ha un limite inerente di 6.000-10.000 anni (a seconda dell'autore) e, oltre questo tempo, troppe irregolarità di cambiamento fonetico si sono accumulate perché il metodo funzioni. Poiché, secondo loro, l'identificazione delle regolari corrispondenze fonetiche è necessaria per stabilire rapporti genetici, essi deducono che i rapporti genetici più vecchi di 10.000 anni (o meno) non possono essere determinati. Di conseguenza, non è possibile andare molto oltre a quelle classificazioni genetiche alle quali si è già arrivati 59. - Greenberg affermò che le parole ereditate (cognates) rimangono spesso riconoscibili anche quando ricorrenti cambiamenti fonetici sono stati ricoperti da quelli idiosincratici, caratteristici, o sono stati interessati dall'analogia, citando i casi dell’inglese brother (fratello) 60, che è facilmente riconoscibile come un “parente” del tedesco Bruder, anche se viola la legge di Verner, e il latino quattuor61, facilmente riconoscibile come derivante del proto-Indoeuropeo *kwetwor anche se i cambiamenti /e/ > /a/ e /t/ > /tt/ violano l’usuale cambiamento fonetico dal proto-Indoeuropeo al Latino. Nel caso di brother, i cambiamenti fonetici sono conosciuti in realtà, ma risultano complessi e sono decifrabili soltanto perché la lingua è abbondantemente documentata a partire da una data relativamente recente. 59 Vd. 60 ad esempio Ringe 1992, p.1. Greenberg 2002, p. 4. 61 Greenberg 1957, p. 45. 22 Nel caso di quattuor, i cambiamenti sono genuinamente irregolari e la forma della parola può essere spiegata soltanto con mezzi diversi dal “regolare cambiamento fonetico”, come ad esempio un’operazione di analogia. - In opposizione, la Scuola linguistica di Mosca, forse meglio nota per la sua difesa dell'ipotesi del Nostratico, ha fiducia nel concetto di tracciabilità dei cambiamenti fonetici regolari a una grande profondità di tempo e crede che le protolingue ricostruite possano essere piramidate in cima a ciascuna di queste, in modo da raggiungere ancora le protolingue precedenti, senza violare i principi del metodo comparativo tradizionale. 2.a.6. Critiche all’approccio matematico della mass comparison. Un ramo di ulteriore polemica sulla mass comparison è stato il dibattito sul ruolo della matematica (linguistica computazionale) nella classificazione linguistica. Sin dall’inizio, Greenberg capì che la mass comparison si fonda su una base matematica62, cioè statistico-probabilistica, anche se “il metodo più diretto per eliminare la probabilità, la casualità, sarebbe il calcolo del numero previsto di probabilità di somiglianza fra due lingue”, ma “in pratica questo si dimostra estremamente difficile”63. Da un lato "richiede…una ponderazione di frequenza dei fonemi", insieme ad una valutazione delle “possibilità di combinazione fonematica” ("it requires ... a frequency weighting of phonemes", along with an evaluation of "the possibilities of phonemic combination" (ib.). Complicando l’assunto, si verifica spesso il caso che le lingue con livelli molto diversi di rapporto di parentela genetica "mostrano approssimativamente il medesimo numero di somiglianze (ib.) (“show "approximately the same" number of resemblances”). La soluzione, secondo Greenberg, è di considerare molteplici lingue in una sola volta (ib.): la chiave si trova nei loro rapporti di sovrapposizione, non nelle loro somiglianze “due a due” (“the key lies in their overlapping relationships, not in their two-by-two resemblances”). Greenberg osserva in proposito64: “Si applicano le seguenti fondamentali considerazioni di probabilità”. La probabilità di individuazione di somiglianza nel suono e nel significato in tre lingue è il quadrato della relativa probabilità in due lingue. In generale la probabilità per una singola lingua deve essere elevata alla potenza (n - Th) per n lingue. Così se cinque lingue hanno indicato ciascuna un totale dell’8% di somiglianza “di suono e di significato” a un’altra lingua, su una base di probabilità si dovrebbe prevedere (0.08) o 0.00004096 somiglianze in tutte e cinque le lingue. 62 Greenberg 1957, pp. 36-44. Vd. anche http://it.wikipedia.org/wiki/Joseph_Greenberg. Greenberg 1957, p. 37. 64 Greenberg 1957, pp.38-39. 63 23 Questo equivale a circa “1/25.000 (ib.).65 A proposito di tali assunti, in una serie di articoli, Donald Ringe (1992, 1993, 1995, 1996) ha attaccato la classificazione dell’Amerindio, del Nostratico ed altre proposte di classificazione linguistica ad ampio raggio ("long-range" language classification) fondate su un terreno matematico. Dal suo punto di vista “i rapporti più distanti non possono essere dimostrati perché le lingue in questione si sono troppo distanziate” ("have diverged too much") (ib.). Basti pensare ai casi di gr. qug£thr /thygatèr/ e ing. daughter per capire che l’assunto di Greenberg è invece corretto. Secondo Ringe, il cambiamento del suono rende i rapporti linguistici intracciabili (untraceable) col passare del tempo. Il livello elevato della probabilità di somiglianze fra le lingue, tuttavia, è relativamente alta (“The level of chance resemblances between languages, however, is relatively high”). Non avendo considerato la possibilità delle probabilità di somiglianza, le relazioni che Greenberg adduce sono indistinguibili dalla pura coincidenza e casualità(“the relationships Greenberg alleges are indistinguishable from coincidence”). Greenberg66 ha risposto che aveva considerato questa possibilità stessa nel suo lavoro precedente, che Ringe aveva sbagliato a citare e così, presumibilmente, a leggere. Ciò ha dato inizio a una serie continua di scambi fra gli studiosi inclini a sostenere la mass comparison e quelli inclini a opporsi ad essa. 2.a. 7. Stato della questione Oggi ci sono tre punti di vista distinti sull’applicazione della matematica-statistica nella classificazione linguistica basata sul confronto di massa o multilaterale (mass o multilateral comparison): 1. Una visione rappresentata da Donald Ringe, il quale sostiene che la classificazione di una lingua può essere matematizzata ma i risultati indicano che la mass comparison non è valida, dal momento che si basa soltanto su somiglianze che non vanno al di sopra del livello di probabilità. 2. Un'altra visione, rappresentata da Baxter-Ramer67 e da Greenberg68 stesso, secondo il quale la classificazione di lingua può essere matematizzata e i risultati indicano che la comparazione di massa è valida, 65 “The following fundamental probability considerations apply. The likelihood of finding a resemblance in sound and meaning in three languages is the square of its probability in two languages. In general, the probability for a single language must be raised to the (n – th) power for n languages. Thus if five languages each showed a total of 8 per cent soundmeaning resemblance to one another, on a chance basis one would expect (0.08) or 0.00004096 resemblances in all five languages. This is approximately 1/25,000”. 66 Greenberg 1993, p. 79. 67 Baxter-Ramer 1999. 68 Greenberg 1993, p. 79. 24 trovando somiglianze che vanno molto al di là di ciò che può essere preveduto da pura casualità. 3. Una terza posizione, rappresentata da Johanna Laakso69, la quale afferma che la classificazione delle lingue non può essere ridotta a matematica. La Laakso non intende respingere le corrispondenze che sembrano essere "intuitive", ma, in effetti, rappresenta le percezioni logiche che la maggior parte della gente è poco disposta a teorizzare a causa della loro sottigliezza e finezza, e che tuttavia sono abbastanza reali e indispensabili. Come dichiara in una rivista di Angela Marcantonio “La famiglia linguistica Uralica”70: “Il modello tradizionale di parentela linguistica non può essere completamente ed esattamente ridotto ad algoritmo; piuttosto, è una spiegazione del modello che consiste di molte parti interconnesse, complesso e che tollera ancora dei buchi nella sua costruzione. In molti dettagli sembra essere basato sull'intuizione e sulla “sensazione a pelle”, ma, in realtà, esso è dipendente da vari fattori di background interni ed esterni”. Nonostante la natura apparentemente insolubile del dibattito fra Greenberg e i suoi critici, alcuni linguisti hanno cominciato a parlare a favore di una relativa risoluzione. Oggi si tende a tentare di estrapolare una posizione che è compatibile sia al metodo di Greenberg sia dei relativi critici, quali Campbell71 e Nichols.72 George Starostin73, membro della scuola di Mosca, sostiene che il lavoro di Greenberg, pur non andando oltre il controllo (inspection), presenta interessanti insiemi di forme che richiedono ulteriore esame accurato da ricostruzione comparativa, specificamente riguardo alle famiglie proposte del Khoisan e dell’Amerindio. In ogni modo, anche se molto di ciò che Greenberg ha proposto, è sembrato valido, i suoi metodi sono stati in seguito universalmente criticati dalla comunità linguistica storica tradizionale, forse, in parte, semplicemente perché allora la tecnologia non era disponibile per permettergli di eseguire i suoi calcoli statistici (abbastanza rigorosi) in modo trasparente, facendo sembrare i processi di base in qualche modo opachi ai suoi critici. Oggi il suo metodo è stato rivalutato, e la multilateral comparison è ampiamente seguita in quelli che sono definiti cross-linguistic studies, come si vedrà in seguito dalle Global etymologies di Bengston-Ruhlen, e dalle Laakso 2003. Marcantonio 2002, da http://homepage.univie.ac.at/Johanna.Laakso/am_rev.html (23Aprile, 2003). 71 Campbell –Poser 2008. 72 Nichols 2007, pp. 231–238. 73 Starostin 2002. 69 70 25 implementazioni automatizzate di Holman–Brown; dagli Steps toward a systematic cross-linguistic study of lexical borrowability di Haspelmath, o da Crosssemantic linguistics di Goddard74. Effettivamente, molti studiosi hanno criticato l’approssimazione e l'apparente arbitrarietà dei presupposti di somiglianza del metodo 75. Hanno criticato similarmente il suo uso dei dati-errore guida, la sua mancanza di uso di parentele conosciute, genuine ma dissimili, il grande numero di lingue che ha studiato simultaneamente e parecchie altre scelte metodologiche fatte dal suo approccio 76, tutti elementi che sono stati sollevati da chi non ha mai personalmente osservato a fondo il suo metodo. Bengston-Ruhlen 1994, Holman–Brown 2008a; Haspelmath 2008, Goddard 2008. Croft-Denning-Kemmer 1990, pp. xxvii-xxviii : “many critics criticized the sloppiness and seeming arbitrariness of his assumptions of similarity”. 76 Croft-Denning-Kemmer 1990, pp. xxvii: They likewise criticized his use of error-ridden data, his lack of use of known genuine but dissimilar cognates, the large number of languages he investigated at a time, and several other methodological choices made by the methodology. 74 75 26 2. b. Ulteriori sviluppi degli studi di Tipologia linguistica 2.b.1 Obiettivi, metodi e strumenti del modello tipologico Com’è noto, la tipologia linguistica77 si occupa della variazione interlinguistica classificando le lingue storico-naturali in base ad affinità strutturali sistematiche, non in base alla parentela genetica. Le lingue vengono ripartite in gruppi ovvero tipi linguistici (modelli di descrizione delle lingue) e la scelta delle proprietà su cui si fondano i tipi deve consentire di operare previsioni attendibili sulla struttura delle lingue indagate. L’errore che spesso si fa a proposito della tipologia, è che si crede che essa si occupi esclusivamente di sintassi (dislocazione di SVO nelle varie lingue) e al massimo di morfologia, mentre si ritiene che escluda, tra i suoi oggetti d’indagine, la fonologia e il lessico. - Ambito di studio dell’indagine tipologica: metodi e obiettivi: il criterio fondamentale dell’indagine tipologica deve tenere presente la funzione cui la lingua deve assolvere, cioè consentire alle comunità di comunicare. Primo passo è quello di individuare i parametri pertinenti del sistema lingua (potenzialità predittiva), e stabilire quanti e quali tipi possano essere ricondotte a lingue storico-naturali; secondo passo è cogliere la ratio profonda del fenomeno e abbandonare il livello descrittivo e spostarsi sul livello predicativo e predittivo. - La costruzione del campione: considerando che oggi sono parlate più di 6000 lingue e circa 100 sono parlata da più dell’80% della popolazione, il campione deve riprodurre al suo interno questi rapporti numerici, poiché è impensabile procedere alla comparazione di tutte le lingue del mondo, per tracciare un quadro esauriente è necessario selezionare un campione altamente rappresentativo che dovrebbe essere immune da: a) distorsioni genetiche, quindi rappresentare in egual misura le famiglie linguistiche; b) distorsioni areali, le lingue possono sviluppare tratti comuni in virtù dei contatti tra i parlanti; d) distorsioni tipologiche, non deve essere sbilanciato a favore di alcune tipologie; e) distorsioni legate alla consistenza numerica delle comunità parlanti. - L’oggetto della tipologia linguistica e la definizione di “tipo”: Tipologia e Fonologia; Tipologia e Lessico: Il livello fonetico/fonologico è ritenuto più impermeabile alle influenze provenienti dall’esterno. Morfologia e sintassi occupano una posizione intermedia perché da un lato hanno inclinazioni assolutamente specifiche e dall’altro rivelano gli effetti di tendenze linguistiche generali; in questo senso sono da sempre considerate un ottimo banco di prova per la tipologia linguistica. Un parametro è rappresentato dall’ordine in cui gli elementi della frase sono disposti (SOV, SVO…). 77 Vd. Grandi 2010. 27 Quanto le unità della fonologia paiono assolutamente refrattarie ad assecondare condizionamenti extrasistemici, tanto il lessico appare vulnerabile rispetto a perturbazioni provenienti dall’esterno. Solitamente si ritiene infatti che il lessico debba essere pressoché escluso dal dominio della tipologia, perché è il componente della lingua più vulnerabile. Questo non è vero invece per Greenberg il quale, come si è già visto78, nel suo confronto multilaterale mette il lessico sullo stesso livello della fonologia e della morfologia. - Non esistono tipi puri: Le lingue storico-naturali si caratterizzano come tipologicamente miste. Ad esempio l’inglese esibisce un ricco campionario d’incongruenze e di contraddizioni tipologiche, si configura come una lingua VO. Nel sintagma nominale l’aggettivo precede sempre il nome (the black dog) in aperta contrapposizione con il principio soggiacente al tipo VO. Pertanto l’inglese è spesso ascritto al tipo isolante: ogni parola è morfema e invariabile; il plurale dei nomi e il comparativo degli aggettivi vengono realizzati con strategie di natura agglutinante; sono fusive le forme pronominali di terza persona singolare. Quindi l’inglese, di tipo isolante, ha anche una componente agglutinante non trascurabile, una quantità non indifferente di elementi fusivi e qualche forma introflessivi. Si tratta certamente di una condizione estrema e sotto molti aspetti eccezionale. - Classificazione tipologica e genetica delle lingue: Vi sono alcuni importanti punti di contatto tra la classificazione tipologica e la classificazione genetica delle lingue, o più in generale tra la linguistica e la linguistica storicocomparativa: 1) essi ricorrono di norma al medesimo procedimento di analisi, quello comparativo; 2) la tipologia non può prescindere dall’apporto della linguistica storico-comparativa e viceversa; per sancire l’esistenza di una tendenza tipologica più o meno generale, è necessario escludere che questi tratti siano la conseguenza di una comune filiazione genetica. La tipologia può supportare la classificazione genetica delle lingue e quindi la linguistica storico-comparativa per tre motivi: a) la tipologia può suggerire alla linguistica storico-comparativa una sorta di “gerarchia di pertinenza” di tratti linguistici nei processi di legami di parentela. b) La tipologia può contribuire ad avvalorare o smentire le ipotesi ricostruttive formulate dalla linguistica storico-comparativa. c) La classificazione tipologica può sostenere la classificazione genetica in aree geolinguistiche particolarmente intricate e l’assenza di un’adeguata documentazione scritta; d) sono le affinità di natura tipologica a dare l’input alle ipotesi ricostruttive della linguistica storico-comparativa. - Il ruolo della tipologia in una teoria del linguaggio79: La tipologia può classificare tanto le lingue storico-naturali quanto singoli elementi delle lingue storico-naturali. Nel primo caso le singole lingue sono classificate in 78 79 Vd. supra cap. 2.a. Vd.anche http://www.scicom.altervista.org/linguistica.html. 28 virtù di proprietà strutturali condivise, nel secondo caso, viene proposta una classificazione tipologica di particolari strategie formali. In entrambi i casi rimane imprescindibile il metodo comparativo, non ha senso realizzare un’indagine tipologica basata su una sola lingua. Ciò non significa che non sia possibile tracciare un ritratto tipologico di una singola lingua. La tipologia linguistica non può e non vuole essere una teoria generale del linguaggio, ma una tipologia del linguaggio ambisce a capire come funzioni il linguaggio inteso come capacità cognitiva e come esso si realizzi nelle lingue storico-naturali. La tipologia si propone di individuare schemi e strutture ricorrenti a livello interlinguistico, esplicitando i principi che ne giustifichino le correlazioni (il termine cross-linguistic rimanda immediatamente a uno studio tipologico). Per trovare la spiegazione di fatti linguistici, la tipologia svolge uno sguardo sovente all’esterno del singolo sistema, tendono a privilegiare condizionamenti intrasistemici. In chiave tipologica è naturale attendersi che ogni segmento del sistema lingua obbedisca a un proprio principio organizzativo. In sintesi: - La tipologia linguistica si occupa essenzialmente della variazione interlinguistica sul piano sincronico, con l’obiettivo primario di rendere espliciti i limiti di quest’ultima. - Lo strumento d’indagine privilegiato della tipologia linguistica è rappresentato dai tipi linguistici, insiemi di proprietà strutturali reciprocamente indipendenti ma correlate in virtù dell’azione di un unico principio organizzativo soggiacente. - I tipo sono modelli di descrizione linguistica, cioè entità astratte, non oggetti linguistici esistenti nella concreta realtà linguistica. Le lingue storiconaturali, fatte salve pochissime eccezioni, tendono, dunque a essere tipologicamente miste. - Tipologia e universali linguistici: Gli universali linguistici indicano proprietà o correlazioni di proprietà che si suppone contraddistinguano ogni lingua storico-naturale del presente come del passato. La tipologia e la ricerca sugli universali paiono perseguire obiettivi diametralmente opposti, la prima si occupa della variazione interlinguistica; la seconda studia ciò che è comune a tutte le lingue. I punti di contatto tra le due discipline sono molteplici, entrambe si collocano a livello sincronico; hanno un carattere descrittivo e non normativo né esplicativo; fotografano uno stato di cose: osservano che una specifica proprietà occorre in tutte le lingue storico-naturali; né gli universali né le correlazioni tipologiche hanno in sé la ragione della propria esistenza. La tipologia e la ricerca sugli universali ricorrono ai medesimi fattori, interni o esterni, per spiegare le generalizzazioni proposte. Gli universali 29 individuano ciò che è tipologicamente irrilevante, delimitano e circoscrivono il campo d’indagine della tipologia stessa. Non tutti gli universali hanno la medesima rilevanza per la tipologia: bisogna distinguere tra universali assoluti e implicazionali, e sono questi ultimi a interagire più fruttuosamente con la tipologia. Gli universali assoluti sanciscono la presenza (o l’assenza) di una particolare proprietà in ogni lingua storico-naturale, senza fare riferimento ad alcun altro parametro e senza stabilire correlazioni fra tratti differenti (ad esempio che tutte le lingue hanno vocali orali). Gli universali assoluti non lasciano alcuno spazio alla variabilità, la rilevanza di questi universali sta nel fatto che, stabilendo dei requisiti imprescindibili per ogni lingua, forniscono informazioni sulla natura profonda del linguaggio umano. Il fatto che nell’interazione comunicativa l’uomo impieghi principalmente la memoria “a breve termine”, rende problematico il recupero di informazioni legate a strutture sintattiche molto complesse. Gli universali implicazionali pongono in relazione due (o più) proprietà, vincolando la presenza di una di esse alla presenza dell’altra, ponendo in relazione due proprietà distinte e teoricamente indipendenti. Un universale implicazionale offre parametri affidabili e attendibili per lo studio della variabilità interlinguistica. Gli universali implicazionali stabiliscono i limiti estremi della variazione interlinguistica, indicando i terreni sui quali le lingue non possono avventurarsi, per cui la tipologia proietta queste generalizzazioni sulla realtà concreta. - Come spiegare gli universali? : A livello intuitivo gli universali indicano una serie di requisiti che ogni lingua storico-naturale deve soddisfare, e paiono proiettare sulla concreta realtà linguistica proprietà essenziali del linguaggio. Gli universali, in base alle loro specifiche caratteristiche e al livello della lingua cui fanno riferimento, possono obbedire a fattori di natura diversa. Se il fine ultimo di ogni lingua storico-naturale è la comunicazione, gli universali possono essere concepiti come strategie comunicative così efficaci da essere condivise da tutte le lingue storico-naturali. - Economia, iconicità e motivazione comunicativa: Vari principi sono in grado di giustificare la presenza o l’assenza di particolari strutture linguistiche: 1) il principio di economia, che può essere definito come la tendenza ad ottenere il massimo risultato con il minimo sforzo, ovvero la tendenza a snellire il più possibile l’apparato formale di un sistema linguistico, pur preservando intatte le sue potenzialità comunicative, e che si manifesta a vari livelli: nel contenimento entro limiti compatibili per la memoria umana dell’inventario delle unità di base della lingua e nella limitazione di strutture ridondanti; 2) l’iconicità, cioè la tendenza a riprodurre le sequenze di base cui viene organizzata l’informazione da trasmettere, per 30 cui il piano dell’espressione mira a “fotografare” con una certa fedeltà la scansione dell’informazione che avviene a livello mentale; 3) la motivazione comunicativa, dato che la lingua ha come traguardo essenziale la comunicazione, per cui è logico attendersi che essa faccia convergere tutte le proprie risorse su quest’obiettivo. E proprio questa motivazione comunicativa offre una spiegazione dell’universale secondo cui tutte le lingue hanno categorie pronominali implicanti, almeno tre persone (prima, seconda e terza persona) e due numeri (singolare e plurale). - Universali e tendenze: Proprio Greenberg, negli anni ’60, con l’allargamento del campione di lingue comparate ha fatto affiorare una considerevole quantità di eccezioni e di controesempi a molte generalizzazioni ipotizzate. Tutto ciò ha obbligato a rimettere in discussione lo statuto stesso degli universali. La distinzione tra universali e tendenze universali risiede nel fatto che i primi indicano quelle proprietà, correlazioni o strutture linguistiche che, senza alcuna eccezione, ricorrono in ogni lingua sorico-naturale. Le seconde designano le proprietà, le correlazioni o le strutture linguistiche che sono attestate in una porzione statisticamente rilevante delle lingue storiconaturali. Il valore delle tendenze, intese come descrizioni di situazioni significative, sta nel fatto che esse dimostrano inequivocabilmente che la distribuzione dei tratti linguistici e delle correlazioni tra essi non è casuale, ma obbedisce a una ratio rigorosa. - La tipologia e il contatto interlinguistico: Ogni lingua è intrisa di elementi alloglotti per gran parte delle proprie componenti. L’interferenza interlinguistica può manifestarsi a più livelli: 1) attraverso semplici prestiti lessicali, mediante l’assimilazione di regole morfologiche; 2) con l’adozione di costrutti più complessi a livello micro-sintattico. L’interferenza è uno di quei fenomeni in cui può essere ricondotto il fatto che non esistono, nella concreta realtà delle lingue storico-naturali, tipi puri. Le lingue storico-naturali rappresentano una fonte estremamente preziosa per la ricostruzione delle intricate vicende storiche delle singole comunità umane e dei territori da esse abitate. Se il popolamento di una regione si è concretizzato mediante una fitta relazione di scambi tra i diversi gruppi umani, le abitudini linguistiche possono serbare tracce di questi contatti. Si possono ricavare testimonianze preziose per far luce sulle vicende passate delle comunità umane. Basti pensare alla parola per “Vino”: ittito wajana, licio wiyana, sanscrito Vyanam, armeno gina (*waiana), celtico gwyn; gaelico fin; gotico Wein; antico islandese vijina, greco (#)oŒnoj, latino vinum, etrusco vinu 80, inglese wine, lituano vijas; sumerico winu. 80 Vd. Agostiniani 1998 sull’origine del nome del “vino” in Etrusco. 31 L’insieme dei tratti linguistici che si sono imposti in una data regione geografica a seguito di una profonda contaminazione interlinguistica costituisce un “tipo areale”. Vi è stata una spinta propulsiva degli eventi storico-sociali che hanno innescato i processi di convergenza. Per poter asserire che le somiglianze hanno una motivazione di natura areale è indispensabile escludere che esse siano dovute a tendenze tipologiche generali o a familiarità genetica. - Implicazioni metodologiche: 1) Per poter individuare eventuali tracce di contatto areale è indispensabile operare una comparazione più ampia tra le situazioni osservate nell’area in esame e le tendenze tipologiche prevalenti nelle lingue del mondo. Le regioni geografiche in cui tipi areali si concretizzano maggiormente, cioè le regioni in cui le lingue sviluppano tratti comuni per il fatto di essere fisicamente contigue, sono definite aree linguistiche. 2) Un’area linguistica deve caratterizzarsi per la presenza di più lingue parlate nel medesimo contesto geografico, ma non immediatamente imparentate e di tratti linguistici da esse condivisi. - Storia e linguistica: Un’area linguistica per poter essere tale deve aver assistito a movimenti di popoli di vaste proporzioni e alla conseguente creazione di aree bilingui o plurilingui. L’implicazione teorica più rilevante, del rapporto tra storia e linguistica nella verifica delle ipotesi di diffusione areale di tratti linguistici consiste nell’ineludibile necessità di attribuire un ruolo preminente alla storia. Non si può prevedere la formazione di un’area linguistica contro l’evidenza della storia, al contrario è del tutto plausibile che l’evidenza storica non si trasformi in evidenza linguistica. Un’area linguistica deve essere prima di tutto un’area culturale e storica. Si può arrivare ad ipotizzare una matrice comune originaria del linguaggio, di tipo cognitivo, che forse risale al Paleolitico, al momento in cui l’homo sapiens ha iniziato a "comunicare", prima di differenziarsi nelle diverse "etnie", come hanno suggerito l’archeologo Colin Renfrew, il glottologo Mario Alinei nella loro teoria della “continuità”, e il genetista antropologo Luca Cavalli Sforza81 . Oppure si può pensare ad una migrazione, da est a ovest (Mesopotamia-Babilonia, Egitto, Anatolia, Caucaso, Balcani, Grecia, Italia, Centro Europa...), di popoli e culture che, una volta estinte, hanno colonizzato nuove terre. - La tipologia areale e la nozione di area linguistica: Alcune aree linguistiche: I Balcani: L’area Balcanica, teatro d’intricati fenomeni di convergenza interlinguistica, è il territorio europeo in cui si concentra il maggior numero di lingue appartenenti a gruppi linguistici diversi: oltre al neogreco e all’albanese, due lingue cosiddette “isolate”, va notata la presenza di lingue slave meridionali, di una lingua romanza, di una lingua altaica e di una lingua uralica. Di fatto i Balcani sono divenuti il primo limes naturale tra Oriente e Occidente. La stratificazione etnica, certamente 81 Renfrew 1987, 2000 e 2003; Alinei 1996-2000; Cavalli Sforza-Menozzi-Piazza 1994. 32 senza pari in Europa, è conseguenza di una serie di ondate migratorie, che hanno più volte stravolto l’assetto complessivo della regione. I tratti essenziali del tipo areale balcanico sono: - sistema vocalico neogreco articolato su 5 fonemi vocalici (/i/, /u/, /e/, /o/, /a/); -sincretismo tra i casi genitivo e dativo e la tendenza prevalente di far confluire nel genitivo le funzioni prima esercitate dal dativo; - formazione di un futuro perifrastico e verosimilmente come effetto di attrazione del greco bizantino e medievale; - formazione dei numeri da 11 a 19 che prevede una matrice “numero + preposizione su + 10”; - perdita dell’infinito, sostituito da preposizioni finite di natura finale, consecutiva o dichiarativa (finse che dormiva, finse di dormire); -preposizione dell’articolo definito tra le lingue balcaniche; collocazione postnominale dell’articolo definito inl bulgaro, macedone, albanese e rumeno dove l’articolo posposto consente di preservare la distinzione tra un caso nominativo-accusativo e un caso genitivo-dativo. L’Europa centro occidentale (l’area di Carlo Magno): In Europa si registra la presenza di oltre 100 lingue diverse, non tutte immediatamente imparentate, ma caratterizzate da una serie di tratti comuni e condivisi. Alcuni tratti che sembrano caratterizzare in modo quasi esclusivo alcune lingue d’Europa e il cui insieme è noto come Standard Average European (SAE) alcuni di questi tratti sono: 1) somiglianze lessicali che, di fatto, si articolano su due livelli distinti (presenza di un comune lessico di matrice greca e/o latina e presenza di comuni strategie nella formazione delle parole); 2) ordine dei costituenti maggiori della frase indipendente, assertiva relativamente rigida e di tipo SVO; 3) presenza di preposizioni e di genitivi postnominali; 4) uso di “avere ed essere” come ausiliari nella formazione di alcuni tempi verbali complessi; 5) presenza simultanea di articoli definiti e indefiniti; 6) carattere no pro-drop, giacché le lingue prodrop, altrimenti dette a soggetto nullo, tollerano l’omissione del pronome personale in posizione di soggetto nella frase dichiarativa, senza che ciò pregiudichi la grammaticalità e la conseguente piena comprensibilità della struttura linguistica prodotta (nelle lingue non pro-drop la mancata espressione del soggetto produce stringhe del tutto agrammaticali e quindi incomprensibili, come in inglese e francese, per cui le lingue romanze sono tutte pro-drop; 7) possibile divergenza tra agente e soggetto: il ruolo semantico di “agente” è assegnato all’argomento che designa l’autore dell’azione, il costituente cui è attribuito il ruolo semantico di agente corrisponde al soggetto grammaticale della frase; 8) la forma passiva consente l’espressione dell’agente; 9) accordo delle forme finite del verbo con il soggetto nella maggior parte delle lingue europee il verbo nelle sue forme finite concorda solo con il soggetto; 10) paradigmi di caso molto 33 semplificati e di tipo nominativo-accusativo è la tendenza piuttosto marcata, che emerge da una disamina della morfologia flessiva nominale delle lingue europee, è quella che porta a una progressiva riduzione delle terminazioni del caso. La combinazione dei dieci tratti rappresenta la combinazione centrale del nucleo del SAE: in Tedesco/francese/nederlandese la quasi totalità dei tratti si realizza; in Basco/turco solo un numero esiguo dei tratti si realizza; in Italiano/inglese/lingue slave/ neogreco/ albanese/lingue baltiche, celtiche e maltese i tratti 1,3,4,5,7,8,9 trovano una piena realizzazione. Le lingue che realizzano il maggior numero di tratti del SAE si collocano nella regione Renana. Assunto fondamentale è comunque che un’area linguistica non copre uno spazio omogeneo. -Il Mediterraneo e il Baltico: Vi sono nel mondo vari contesti regionali in cui i sistemi linguistici non hanno intrapreso alcuna marcia di progressivo avvicinamento a un tipo strutturale parzialmente unitario. Né il Mediterraneo né il Baltico possono essere considerati aree linguistiche. Nel Mediterraneo e nel baltico emergono delle costellazioni di microprocessi di convergenza, ma mancano tratti condivisi globalmente. E per sancire l’esistenza di un’area linguistica quest’ultima condizione pare imprescindibile. In sintesi, secondo l’attuale indagine tipologica, le condizioni necessarie alla formazione di un’area linguistica sono: la presenza in una stessa regione di più lingue non strettamente imparentate; la condivisione, da parte di queste lingue, di tratti tipologicamente significativi; contatti prolungati e sistematici tra le diverse comunità di parlanti. 34 2. b. 2. La Tipologia e il mutamento linguistico: punti di contatto con la linguistica storico-comparativa Il paradigma dinamico: La tipologia linguistica costituisce un procedimento di classificazione delle lingue che si colloca su un piano sincronico, tuttavia i possibili punti di contatto con la linguistica storicocomparativa (che opera su un piano diacronico) sono molti. La storia ci pone davanti agli occhi sia mutamenti marginali e quasi irrilevanti nell’equilibrio complessivo della lingua, sia trasformazioni radicali, nelle quali non sono solo singoli segmenti del sistema a mutare, ma è l’intero sistema ad essere coinvolto o addirittura sconvolto dal cambiamento. Nessuna configurazione tipologica può essere considerata come un’acquisizione definitiva, ma in continua trasformazione (dinamizzazione della tipologia). - Tipi stabili e tipi frequenti: I tipi linguistici non hanno la medesima probabilità di occorrenza e quest’ultima dipende solo in parte dalla loro coerenza interna. Vi sono tipi diffusissimi e altri assolutamente rari, tipi apparentemente duraturi e altri particolarmente vulnerabili, tipi diffusi in modo uniforme e altri che caratterizzano solo lingue concentrate in regioni limitate. I fattori in grado di influenzare la distribuzione dei tipi linguistici sono due, indipendenti l’uno dall’altro: - la stabilità, cioè la probabilità che un determinato tipo sia abbandonato o mantenuto; - la frequenza, cioè la probabilità che un determinato tipo sia assunto dalle lingue storico-naturali in termini areali. La combinazione dei due criteri consente di giustificare la diffusione di tutti i tipi linguistici secondo lo schema seguente: 1) tipi stabili e frequenti: diffusi geneticamente; 2) tipi stabili e infrequenti: diffusi in singole famiglie linguistiche, ma non geograficamente; 3) tipi instabili e frequenti: diffusi geograficamente e sporadico nelle varie famiglie linguistiche; 4) tipi instabili e infrequenti: piuttosto rari sia nelle famiglie linguistiche che geograficamente; - Tendenze tipologiche e areali nel mutamento linguistico: L’azione dei criteri di stabilità e frequenza nella diffusione dei tipi linguistici e la loro efficacia nel prevedere le strategie coinvolte nel mutamento linguistico possono essere esemplificate in modo piuttosto chiaro, analizzando la distribuzione sincronica e il percorso evolutivo dei diminutivi e degli accrescitivi. Ad esempio: - Latino: trasmissione dei propri diminutivi alle lingue romanze; - Greco antico: trasmissione dei propri diminutivi al neogreco; - Slavo comune alle moderne lingue slave; - Protogermanico alle moderne lingue slave; I diminutivi trasmessi fanno parte dell’eredità del protoindoeuropeo, mentre gli accrescitivi sono una strategia linguistica molto recente e più 35 vulnerabile: i diminutivi sono un fenomeno contraddistinto da un alto grado sia di stabilità sia di frequenza; gli accrescitivi sono un fenomeno instabile ma frequente. I diminutivi stabili e frequenti si svilupparono diacronicamente secondo una matrice tipologica piuttosto generale e interlinguisticamente diffusa. Gli accrescitivi piuttosto frequenti ma instabili ricorrono a cliché diversi e ben connotati in senso areale. In sostanza in questo caso non è la parentela tra le lingue coinvolte, ma l’interferenza con i sistemi geograficamente adiacenti a indirizzare il processo evolutivo. - I tipi devianti: quando la diacronia spiega la sincronia: Se ci avvaliamo di un approccio in grado di conciliare le dimensioni sincronica e diacronica, le lingue della fisionomia problematica non devono necessariamente essere relegate ai margini, ma trovano una loro ragion d’essere e una piena legittimazione come espressione della sintomatologia di un più o meno complesso mutamento in atto. Ad esempio, riguardo al latino, operando su un livello puramente sincronico, non potremmo fare altro che certificare la natura incoerente del latino pompeiano. Se però aprissimo una finestra sulla diacronia, il quadro complessivo ci apparirebbe in una luce diversa, vedremmo il latino classico e le lingue romanze. Il latino pompeiano collocandosi in una posizione intermedia rispetto a questi due estremi, rivela che la transazione tipologica che ha accompagnato la formazione dei primi volgari romanzi era già avviata nel I secolo d.C. - Universali implicazionali e mutamento linguistico: Il rapporto interlinguisticamente difforme tra diminutivi e accrescitivi è stato schematizzato nell’universale implicazione accrescitivi-diminutivi: in sostanza, se una lingua dispone di un procedimento morfologico per realizzare gli accrescitivi, allora dispone necessariamente di un procedimento morfologico per realizzare i diminutivi, ma non viceversa. - E’ possibile prevedere la direzione del mutamento linguistico? Rimane innegabile l’esistenza di mutamenti più naturali di altri e, una volta individuate le premesse tipologiche pertinenti, dovrebbe essere possibile stabilire almeno le direzioni precluse al cambiamento in atto. Tuttavia, poste queste premesse, niente garantisce che il mutamento giunga, in effetti, al suo compimento. Edward Sapir82 ha definito “deriva” la lenta trasformazione della lingua. Il termine rende bene l’idea di un movimento libero e incontrollato. La storia delle lingue è in parte governata da agenti esterni, cioè dai successi e dagli insuccessi delle comunità umane, che possono intervenire in qualunque momento sulla deriva della lingua imponendole deviazioni di percorso, arrestandone l’azione o dirottandola verso mete inizialmente impreviste. 82 Sapir 1969. Vd. Anche www.tuttowebitalia.com/.../lingue/linguistica.html 36 In sintesi la tipologia dinamica studia il mutamento linguistico nell’ambito del complesso slittamento tipologico che coinvolge ogni lingua nel corso della propria storia; le caratteristiche dei mutamenti tipologici sono in parte desunte dal valore che è attribuito agli indici di stabilità e frequenza; gli universali implicazionali possono fungere da efficaci strumenti di previsione circa le fasi del mutamento. 2. b. 3 Tipologia e universali linguistici in Greenberg La notorietà di Greenberg risiede, oltre che al metodo della mass comparison, nel suo contributo alla linguistica sincronica e nella ricerca degli universali linguistici. La raccolta e l’esame di insiemi linguistici con ampia distribuzione geografica e genetica, gli ha permesso di individuare quelli che ritenne essere alcuni interessanti potenziali universali linguistici e diverse tendenze linguistiche incrociate. In particolare ha introdotto il concetto di "implicazione universale" che prende la seguente forma: "se un linguaggio ha struttura X, allora deve anche avere la struttura Y". Questo genere di ricerche fu in seguito condotto da diversi altri studiosi e continua ad essere tema dell'analisi dei dati nell'ambito della linguistica sincronica. Analogamente a Noam Chomsky, Greenberg desiderava determinare la struttura universale sottesa al linguaggio umano, ma a differenza dello studioso citato, il suo approccio era empirico anziché logico-deduttivo ed è stato spesso definito come funzionalistico, in opposizione al razionalismo dell'approccio chomskiano. Un tentativo di ricongiungere queste due interpretazioni si trova in Mairal-Gil 2006. Sebbene i suoi metodi per la classificazione delle lingue siano stati considerati molto controversi, anche i suoi oppositori riconoscono l'importanza del suo lavoro tipologico. Particolare influenza ha avuto in questo campo un suo articolo del 1963, "Some universals of grammar with particular reference to the order of meaninful elements". Come si è già ricordato, l’aspetto più controverso del metodo della “mass o multilateral comparison proposto da Greenberg, sta nell’identificare le relazioni storiche nel confronto di più linguaggi diversi in numero superiore a quelli che possono essere gestiti con i metodi tradizionali in modo pratico, situazione che si presenta di frequente quando si tenti di stabilire famiglie storiche di linguaggi ad ampio raggio in regioni del mondo dove poche o nessuna famiglia linguistica di livello inferiore sia già stata ricostruita, in altre parole dove la diversità linguistica è particolarmente accentuata. Resta il fatto che attraverso il suo metodo e con l’analisi tipologica, Greenberg ha formulato diverse nuove classificazioni linguistiche, che furono tuttavia respinte al loro primo apparire, perché basate su dati scorretti e metodologicamente errate, per poi essere recuperate in seguito ed accettate, in tutto o in parte. Nel suo lavoro Greenberg coniò anche il 37 termine di "afro-asiatico" per sostituire il precedente termine di lingue camitosemitiche, ritenendo di aver dimostrato che il camitico non costituisca una vera famiglia linguistica. Accettate risultano che sono tuttavia abbastanza favorevoli alle classificazioni di Greenberg, riconobbero che almeno alcune delle sue macrofamiglie, in particolare il gruppo delle lingue nilo-sahariane e della lingua khoisan, non siano pienamente accettabili e necessitano di un riesame. Nel 1971 Greenberg propose la superfamiglia linguistica delle lingue indo-pacifiche, che raggrupperebbe insieme le lingue papua (diverse famiglie linguistiche parlate nella Papua Nuova Guinea e nelle regioni circostanti, estranee al gruppo delle lingue austronesiane, così come i linguaggi indigeni della Tasmania e delle Isole Andaman). Le lingue aborigine australiane furono invece escluse. La proposta è ritenuta altamente ipotetica e non è stata accettata da nessun linguista. Se da una parte i linguisti specialisti delle lingue dei nativi americani classificano tutte le lingue parlate nel continente americano in lingue eschimesi-auletine e le lingue Na-Dené, e in un ampio numero di altre lingue distinte (tra i 600 e i 2.000) parlate nella parte restante dell'America settentrionale, nell'America centrale e nell'America meridionale, dall’altra Greenberg, grazie ai suoi studi tipologici, propose fin dal 1957 di classificare i linguaggi in raggruppamenti più ampi. Nel 1987, nell'opera Language in the Americas propose che tutti i gruppi non appartenenti ai due raggruppamenti delle lingue eschimesi auletine o Na-Dené, fossero ricompresi in una singola famiglia, di cui ipotizzò il nome in lingue amerindie. Recentemente Greenberg ha proposto di riunire molte famiglie linguistiche di Europa e Asia in un singolo gruppo, le lingue eurasiatiche83, riprendendo la teoria del nostratico84, ma con alcune significative differenze: in particolare ne sarebbero esclusi i linguaggi afro-asiatici. Resta aperto il problema riguardante le tante classificazioni linguistiche caratterizzate da una così grande quantità di somiglianze superficiali, tanto da essere classificabili nella stessa famiglia linguistica: non è ancora chiaro se ciò si possa spiegare con una teoria monogenetica del linguaggio o se si pieghi solo sulla base degli universli linguistici. 83 84 Greenberg 2000 e 2002. Vd. Bomhard 2008; Dybo 2004. 38 2.b. 4 Tipologia e Indoeuropeo: la teoria del doppio strato Agli studi tipologici di Greenberg si devono aggiungere le ipotesi del glottologo olandese Christiaan Cornelius Uhlenbeck85, che ha proposto l’esistenza di un doppio strato nel lessico e nella morfologia indoeuropea tra le teorie per identificare i caratteri dell'indoeuropeo stesso. Da una parte focalizza la presenza di forme lessicali nominali derivate da cosiddette radici verbali apofoniche e completamente chiare nella loro costituzione ed etimologia; dall'altra nomi etimologicamente isolati, non trasparenti in quanto non ulteriormente analizzabili, e che stranamente comprendono oggetti e concetti tra i più importanti e basilari del lessico: designazioni di parentela, denominazioni del corpo umano, animali e alberi, numerali. Inoltre, Uhlenbeck rileva, da una parte, la preponderanza di formazioni monoschematiche e regolari, dall'altra di sistemi eterocliti di flessioni e paradigmi di ogni genere: - alla prima categoria appartengono, ad esempio: i derivati della radice *gen (generare, nascere) come genitor "genitore", (g)natus "nato", natio "nazione", genus "genere", germen "germe", etc., oltre alle formazioni verbali come gi-gn-o "genero", perfetto genui e cosi' via; i paradigmi normali della declinazione e coniugazione, la comparazione del tipo latino longus "lungo", longior "più lungo", longissimus "lunghissimo". - alla seconda categoria appartengono parole come pater "padre", mater "madre", frater "fratello", manus "mano", caput "capo", crus "gamba", cor "cuore"; inoltre paradigmi costituiti di vari temi con iecur "fegato" (genitivo: iecinoris), femur "femore" (genitivo: feminis), iter "viaggio" (genitivo: itineris) o diversi radicali, come la comparazione bonus "buono", melior "migliore", optimus "ottimo", o il sistema verbale che si ha nel presente fero "porto", contro il perfetto tuli oppure nel presente sum "sono" contro il perfetto fui, etc. Lo stesso Benveniste86, analizzando l’origine dei nomi di parentela indoeuropei, dopo aver evidenziato la forte unità e la costante suffissazione in -ter (*méH2-tēr “madre”, *pH2-tér “padre”, *bhrétH2-tēr “fratello”), osserva che tali parole non sono ulteriormente analizzabili, sembrano prive di apofonia, apparentemente opache. Si può supporre quindi, nell’Indoeuropeo, la fusione di due sistemi linguistici differenti, di cui il primo ricorda il tipo delle lingue uraliche (o anche altaiche), il secondo assomiglia a schemi propri di certe lingue caucasiche. Ciò sembra indicare abbastanza chiaramente che il sistema dell’indoeuropeo 85 Uhlenbeck 1935. Vd. anche: http://it.wikipedia.org/wiki/Doppio_strato_dell%27indoeuropeo. 86 Benveniste 1962, pp.1sg. 39 si compone di almeno due gruppi fondamentali d’isoglosse derivati da dialetti in origine completamente diversi e non geneticamente collegati, un ramo uralide e uno caucasico che si sarebbero successivamente creolizzati. Tuttavia molti linguisti, in particolare Oswald Szémerenyi87, hanno fornito una diversa spiegazione riguardo ai paradigmi dei verbi suppletivi, alle forme irregolari presenti nell’Indoeuropeo e a quelle radici nominali apparentemente isolate, opache, prive di apofonia e quindi non ulteriormente analizzabili (come nei nomi di parentela, nei numerali e in alcuni termini del corpo umano…). Ai linguisti è noto che la presenza di radici differenti in uno stesso verbo è un processo che viene attuandosi nell'evoluzione linguistica, quando voci usurate, foneticamente, devono essere sostituite. Questo è il caso del verbo ire, anomalo ma con una sola radice (i-) sostituito in italiano dal verbo andare. Sembra dunque probabile che il suppletivismo non sia originario, ma sia frutto di evoluzioni successive. Il caso di lat. fero e del gr. φέρω /phérw/ suo equivalente sembra essere un'innovazione locale, giacché ad esempio la stessa radice nel germanico non è suppletiva. Quanto ai nomi di genere irregolare, sembrano essere l'ultimo relitto della fase più arcaica dell'Indoeuropeo, in cui non esistevano generi distinti grammaticalmente, piuttosto che la testimonianza di una creolizzazione. Le declinazioni tematiche con generi distinti sono, infatti, un'innovazione tarda. Da questo punto di vista, l'Indoeuropeo sembra una lingua flessiva in assestamento dopo una serie di trasformazioni tipologiche e di derive interne, più che una lingua creola. L'assestamento e la regolarizzazione delle strutture della protolingua vengono in qualche modo continuate dalle lingue figlie. E’ possibile che alcune delle affinità strutturali e tipologiche con i dialetti uralici da un lato e con quelli caucasici dall'altro derivino da remotissime forme d’influsso ad-stratico, senza dover necessariamente pensare a un'effettiva creolizzazione. Come si può notare, gli apporti del modello tipologico come completamento delle teorie sull'origine dell'Indoeuropeo e sulla sua ricostruzione ed evoluzione, costituiscono un capitolo assai complesso della storia degli studi linguistici. L'inventario fonetico e i paradigmi presentati dallo studioso, conformi a una ricostruzione tradizionale e "neogrammatica" in parte riveduta e ampliata, non riscuotono un consenso unanime presso tutti i linguisti. Di fronte a così tante ipotesi e constatazioni di somiglianze più o meno fondate, si capisce facilmente come, in linguistica, ci sia stata la volontà di perfezionare gli strumenti analitici, allo scopo di poter costruire e discutere teorie sempre più attendibili. 87 Szémerenyi 1974. 40 2.c. Un esempio di “multilateral comparison”: Global etymologies (Bengtson-Ruhlen) Un esempio di applicazione di un approccio combinato di multilateral comparison e tipologia, come classificazione iniziale cui può seguire la ricostruzione di approccio comparativo tradizionale, è quello descritto nell’articolo Global etymologies di Bengtson-Ruhlen88, i quali citano una frase di Greenberg per spiegare l’obiettivo del loro lavoro sulle lingue amerindie: If the strength of Indo-European studies is largely based on the existence, in a few instances at least, of very old sources, the strength of Amerindian studies is simply the vast number of languages. Thus synchronic breadth becomes the source of diachronic depth. — Greenberg 1987. 89 I due studiosi intendono dimostrare, attraverso una grande quantità di esempi di lingue confrontate e di etimologie, che la variazione sincronica può diventare principio per la variazione diacronica: per cui lo studio di mass comparison delle lingue Amerindie, esteso in un contesto globale, può essere un valido supporto per lo studio del cambiamento linguistico in generale e per gli studi indoeuropeistici. 2.c.1. La base della tassonomia linguistica (Linguistic Taxonomy) Premessa fondamentale per ogni studio linguistico è che la forma (significante) di parole ordinarie sia la base della tassonomia linguistica, come diretta conseguenza della proprietà fondamentale del linguaggio umano, in altre parole il rapporto arbitrario fra significante e significato. Poiché tutte le sequenze dei suoni sono ugualmente ben adattate per rappresentare ogni significato, non c’è tendenza o predisposizione affinché determinati suoni o sequenze di suono siano associati a determinati significati (lasciando da parte l’onomatopea, che in qualunque caso è irrilevante per la classificazione). Nella classificazione genetica delle lingue la tassonomia cerca solitamente, fra gli elementi formativi grammaticali e lessicali disponibili, somiglianze che coinvolgono sia il suono sia il significato (similarities that involve both sound and meaning), e si usa dire che le somiglianze tipologiche (typological similarities) che coinvolgono solo il suono o il significato, non danno risultati certi del rendimento (not reliable results). I principi fondamentali di tassonomia non sono specifici alla linguistica, ma sono, piuttosto, applicabili in campi disparati come biologia 88 Bengtson- Ruhlen 1994. “Se la forza degli studi indoeuropei in gran parte è basata sull'esistenza, almeno in alcuni casi, di fonti molto antiche, la forze degli studi Amerindii è semplicemente il gran numero di lingue. Così la larghezza sinconica diventa la fonte di profondità diacronica”. 89 41 molecolare, botanica, etnologia e astronomia. Quando uno identifica le somiglianze fra le strutture molecolari, le piante, le società umane, o le stelle, l'origine di tali somiglianze può essere spiegata soltanto da uno di tre meccanismi: 1) origine comune, 2) prestito, o 3) convergenza. Per dimostrare che due lingue (o famiglie linguistiche) siano imparentate, è così sufficiente indicare che le loro somiglianze comuni non sono il risultato né di prestito né di convergenza. Per quanto riguarda la convergenza, cioè la manifestazione di somiglianze motivate o accidentali, i linguisti sono in una situazione più favorevole dei biologi. Nella biologia, la convergenza può essere accidentale, ma più spesso è motivata dall'ambiente (environment); non avviene accidentalmente che i pipistrelli assomigliano agli uccelli, o che i delfini assomigliano ai pesci. Nella linguistica, al contrario, dove l'associazione significato/significante è arbitraria, la convergenza è sempre accidentale. Raramente si è dato risalto al fatto che le somiglianze fra le famiglie linguistiche sono esse stesse suscettibili delle stesse tre spiegazioni. Il fatto che vediamo così raramente la menzione di questo principio-corollario è dovuto in gran parte al fatto che la linguistica storica di XX secolo è radicata nella certezza che le famiglie linguistiche indoeuropee non condividono parentele con altre famiglie, non offrendo niente da comparare. A questo punto si è presunto che il concetto di somiglianza semplicemente non esiste. Ciò che colpisce è che questa posizione -per cui la considerevole prova del contrario è esistita già all'inizio di questo secolo90 e che per i motivi a priori sembra per lo più improbabile91 - è venuta ad essere accettata quasi universalmente dai linguisti, la maggior parte dei quali non ha mai studiato la questione in prima persona. Quei pochi studiosi che realmente hanno affrontato il problema della parentela tra Indoeuropeo e altre famiglie linguistiche sono stati Trombetti 1905, Swadesh 1960 e Greenberg 1987. Anche Edward Sapir, spesso considerato un esempio di sobrietà linguistica, sembrò essere favorevole al lavoro di Trombetti, come si vede in una lettera a Kroeber nel 192492: “C’è molto materiale eccellente e buon senso in Trombetti nonostante sia un fanatico monogenista. Non sono così sicuro che il suo punto di vista sia niente di meno che “il solito conservativo”. Ad ogni modo, una comparazione delle famiglie linguistiche del mondo senza preconcetti rivelano numerosi diffusi elementi da tenere in considerazione. 90 Trombetti 1905. Ruhlen 1988a. 92 “There is much excellent material and good sense in Trombetti in spite of his being a frenzied monogenist. I am not so sure that his standpoint is less sound than the usual ‘conservative’ one” (citato in Golla 1984, p. 420). 91 42 2. c. 2. Il problema dei prestiti Nell’ambito della comparazione linguistica a fini di ricostruzione genealogica, Bengston-Ruhlen escludono la possibilità di parlare di “prestito” nel lessico basico, che per definizione non è culturale ma universale perché legato ad elementi naturali, antropologici. I linguisti impiegano un certo numero di tecniche ben note per distinguere le parole prese in prestito dai termini ereditati. Più importante, è chiaramente il fatto che il vocabolario di base, come definito da Dolgopolsky 1964 e da altri, è altamente resistente ai prestiti (basic vocabulary is highly resistant to borrowing). Benché sia senza dubbio vero che ogni parola può occasionalmente essere presa in prestito da parte di una lingua da un’altra, è ugualmente vero che i termini di base come i pronomi e le parti del corpo umano raramente sono presi in prestito. Ancora, il prestito avviene fra due lingue, in un determinato tempo e in una località particolare, non fra intere famiglie linguistiche, attraverso le vaste distese di tempo e spazio. Così, attribuire le somiglianze globali che sono documentate nello studio di Bengston-Ruhlen ad un semplice fenomeno di prestito sarebbe ridicolo. E per quanto riguarda i casi presunti di prestito di massa nelle lingue americane (i cosiddetti “pan-americanismi")93, il fatto che “le parole e i pronomi di base possano essere presi in prestito da Tierra del Fuego alla Columbia Britannica, è così assolutamente improbabile che non ha neppure bisogno di discussione”. Sembra ancor meno probabile che il vocabolario di base - per la maggior parte delle etimologie che vengono riportate- abbia potuto essere preso in prestito da una lingua ad un’altra dall'Africa attraverso l’Eurasia al Sudamerica. 93 Greenberg 1990, p. 11. 43 2. c. 3. La convergenza Una critica comune a lavori di mass comparison, soprattutto a questo lavoro di Bengston-Ruhlen che analizza circa 5.000 lingue, è che non può essere troppo difficile trovare una parola in una certa lingua africana che è semanticamente e fonologicamente simile, o persino identica, a una certa parola in lingua indiano-americana. Ma ci sono poche possibilità che uno possa riuscire a trovare “somiglianze accidentali” (accidental lookalikes) dappertutto94. Questa specie di ricerca “irragionevole” è esattamente l'inverso di come il metodo comparativo procede. Le unità che vengono confrontate sono famiglie linguistiche, non lingue diverse, individuali (una lingua isolata come il basco è stata considerata tradizionalmente, tassonomicamente, una famiglia che consiste di una singola lingua). Specificamente, Bengston-Ruhlen confrontano termini nei seguenti 32 gruppi linguistici, ciascuno dei quali sono ritenuti essere geneticamente un gruppo valido a un certo livello della classificazione: Khoisan, Niger-Congo, Kordofaniano, Nilo-Sahariano, afroasiatico, Kartveliano, Indoeuropeo, Uralico, Dravidico, Turcico, Mongolo, Tungus, Coreano, GiapponeseRyukyuan, Ainu, Gilyak, Chukchi-Kamchatkan, Eschimese-Aleut, Caucasico, Basco, Burushaski, Yeniseiano, Cino-Tibetano, Na-Dene, IndoPacifico, Australiano, Nahali, Austroasiatic, Miao-Yao, Daic (= Kadai), Austronesiano e Amerindio. Ci si può domandare legittimamente perché questi studiosi abbiano confrontato le famiglie relativamente al basso livello di parentela, come Indoeuropeo e Sino-Tibetano piuttosto che famiglie a più alto livello di parentela (secondo i rami del modello ad albero) come Eurasiatico/Nostratico e Dene-Caucasico, soprattutto perché da parte di entrambi si supporta la validità di queste famiglie di più alto livello95. In tassonomia è normale che i raggruppamenti di più alto livello sono spesso più evidenti -e più facili da dimostrare- di quanto lo siano i nodi a livello più basso (lower-level nodes). Questo si evidenzia in particolar modo quando si considera il mondo intero. Nonostante l’opinione contraria, sembrerebbe ragionevolmente semplice da dimostrare che tutte le famiglie di lingua del mondo siano imparentate, come si può vedere nelle etimologie che vengono analizzate dai due studiosi96. Ciascuno dei trentadue gruppi genetici è definito da un insieme di etimologie che collega le unità grammaticali e lessicali che si presume siano imparentate all'interno di quel gruppo; l'insieme dei membri e il sottoraggruppamento presunto all'interno di ciascuno di questi gruppi è dato in Ruhlen 1987a. Goddard 1979, pp. 355–89. Bengtson 1991a e b; Ruhlen 1990a. 96 Bengtson-Ruhlen 1994, pp. 292sg. 94 95 44 Il numero preciso di etimologie che definisce ciascuno dei 32 gruppi varia da parecchie migliaia (per i gruppi strettamente imparentati e/o ben documentati come Dravidico o Indoeuropeo) a varie dozzine (per i gruppi antichi e/o poco studiati come Indo-Pacifico o Australiano). Così invece di ricavare le etimologie da migliaia di lingue, ognuna contenente migliaia di parole, i due studiosi si sono limitati piuttosto a meno di 3 dozzine di famiglie, alcune delle quali hanno non più di poche centinaia di parentele identificabili. Il mare di possibilità è notevolmente ridotto e le somiglianze accidentali (accidental look-alikes) risultano poche. Essi ritengono che l'omissione da parte dei critici di apprezzare la “davvero minuscola” probabilità di somiglianze accidentali sia l'impedimento principale alla loro comprensione di questo tipo di studio (We believe that the failure of our critics to appreciate the truly minuscule probability of accidental similarities is the chief impediment to their under standing …). Ciascuna delle etimologie che sono citate coinvolge almeno una mezza dozzina di 32 famiglie presunte indipendenti, precisamente perché la probabilità d’individuazione della stessa somiglianza accidentale in sei famiglie differenti è vicina a zero. La moltiplicazione dell’(im)probabilità di somiglianza accidentale (accidental resemblance), come sono considerate sempre più numerose famiglie, assicura rapidamente al tassonomista attento che le somiglianze condivise da numerose famiglie, separate spesso dalle grandi distanze, non possano essere dovute a probabilità. Proprio a questo punto cruciale Greenberg (1957, 1963, 1987) ha dato paticolare risalto, essendo bene informato dell’importanza statistica dell'attestazione in famiglie multiple, piuttosto che in appena due (well aware of the statistical importance of attestation in multiple families, rather than in just two). Ogni biologo sa che l’evoluzione convergente è realmente un genere speciale di coincidenza. Il fatto, riguardo alle coincidenze, è che, anche se accadono una volta, è molto meno probabile che accadano due volte. Ed è ancor meno probabile che accadano tre volte. Prendendo le molecole di proteina sempre più separate, non si può far altro che eliminare il concetto di coincidenza. Per vedere come sia improbabile che le coincidenze siano accidentali, basta considerare che due lingue che abbiano ciascuna appena sette consonanti e tre vocali: Consonanti Vocali p i t k s m n l u a Con poche eccezioni notevoli la vasta maggioranza delle lingue del mondo mostra almeno queste distinzioni fonologiche. Tuttavia persino 45 questo inventario minimo è capace di produrre 147 radici CVC, come mostrato nella seguente tabella: KAK KAL KAM KAN KAP KAS KAT KIK KIL KIM KIN KIP KIS KIT KUK KUL KUM KUN KUP KUS KUT LAK LAL LAM LAN LAP LAS LAT LIK LIL LIM LIN LIP LIS LIT LUK LUL LUM LUN LUP LUS LUT MAK MAL MAM MAN MAP MAS MAT MIK MIL MIM MIN MIP MIS MIT MUK MUL MUM MUN MUP MUS MUT NAK NAL NAM NAN NAP NAS NAT NIK NIL NIM NIN NIP NIS NIT NUK NUL NUM NUN NUP NUS NUT PAK PAL PAM PAN PAP PAS PAT PIK PIL PIM PIN PIP PIS PIT PUK PUL PUM PUN PUP PUS PUT SAK SAL SAM SAN SAP SAS SAT SIK SIL SIM SIN SIP SIS SIT SUK SUL SUM SUN SUP SUS SUT TAK TAL TAM TAN TAP TAS TAT TIK TIL TIM TIN TIP TIS TIT TUK TUL TUM TUN TUP TUS TUT TAB. 5 (Bengston-Ruhlen, p.282). Possibili radici CVC per una lingua con 7 consonanti e 3 vocali. La probabilità dell'identità fonologica accidentale è soltanto di 1/147, benché la probabilità di somiglianza fonologica accidentale possa essere 2/147, 3/147, ecc., in base a quante altre figure fonologiche nella tabella 5 siano ritenute sufficientemente simili. Un esame della tabella suggerisce, tuttavia, come, per la maggior parte, queste presunte radici siano fonologicamente abbastanza distinte e non siano connesse tramite processi fonologici comuni (most of these putative roots are quite distinct phonologically and are not readily connected by common phonological processes)97. 97 Bengston-Ruhlen, pp.282sg.: “With a few notable exceptions the vast majority of the world’s languages show at least these phonological distinctions. Yet even this minimal inventory is capable of producing 147 CVC roots, as shown in Table 5. The probability of accidental phonological identity is only 1/147, though the probability of accidental phonological resemblance might be 2/147, 3/147, etc., depending on how many other phonological shapes in Table 5 are deemed sufficiently similar”. 46 Si paragonino poi due lingue con un inventario fonematico più tipico, per esempio 12 consonanti, 2 semi-consonanti e 5 vocali: Consonanti p t k b d g č s m n l r Semi-cons. j w Vocali i u e o a Con questo procedimento si troverebbe che il numero delle radici possibili CVC in ogni lingua arriva a 980. Di nuovo, naturalmente, la probabilità di somiglianza accidentale (the probability of chance resemblance) dipenderà da determinati presupposti fonologici, ma ci si potrebbe aspettare poche preziose identità o somiglianze accidentali, nell’ambito del confronto di una certa altra lingua con un gruppo di lingue (but precious few accidental identities or resemblances, vis-`a-vis the stock of some other language or group of languages, could be expected). Si può capire quanto sia improbabile una spiegazione di somiglianza casuale considerando la probabilità che le somiglianze notate nell’etimologia 21, riportata qui98, siano sorte da convergenza: Etimologia 21: PUTI vulva. Niger-Congo: Mande: Malinke butu ‘vulva,’ Guro buri, Bobo-Fing bido, Bisa bid; Bantu: Luganda -buto ‘womb,’ Kunda -budu, Swazi -Ngo-boti, Ki-sikongo buti. [HJ, M] Nilo-Saharan: Songhai: Gao buti ‘vulva,’ Djerma bute; Koman: Ganza pit, Koma bitt. [NS 145, NSD 59] Afro-Asiatic: Proto-Afro-Asiatic *pwt ‘hole, anus, vulva’; Omotic: Ganjule pote ‘vagina’; Semitic: Hebrew pot ‘vulva’ (“secret parts” in the King James Version, Isaiah 3:17); Cushitic: Somali f´uto ‘anus,’ Darasa f—ıdo ‘genitals,’ Oromo fuˇgi ‘vulva’; Chadic: Jegu paate, ‘vulva,’ paato ‘penis,’ Angas fut ‘hole.’ [CS 381, IS 340, WM 64] Kartvelian: Proto-Kartvelian *put’ ‘hole,’ Svan put’u. [IS 340] Indo-European: Proto-Indo-European *puto ‘cunnus’; Indic: Sanskrit pùtau ‘buttocks’; Italic: Vulgar Latin *putta ‘girl,’ Old French pute (mod. putain) ‘whore,’ Provencal puta(-na), Spanish puta; Germanic: Old Icelandic fu∂ ‘cunnus,’ Middle High German vut ‘vulva,’ Swiss German fotz > fotza, Swedish fitta, fod ‘rear end’ (dialectal). [WP II: 21, IE 848, SM 1013] (Aggiungo io: Greco: 98 Bengston-Ruhlen 1994, pp. 319-321. 47 Uralic: Proto-Uralic (Illich-Svitych) *putV ‘rectum,’ (R´edei) *put‰‘rectum, colon’; Ugric: Ostyak p˘uti ‘rectum’; Finnic: Saami butt˘eg˘e. [U 91, IS 340, R 410] Dravidian: Brahui pund. —u ‘anus, buttocks,’ p—os ‘vulva,’ Tamil pun.t. ai ‘vulva,’ p—ur — ul p—ır — u ‘anus,’ poccu ‘vulva, anus,’ Malayalam p—ur — u ‘buttocks, vulva,’ Kannada pucci ‘vulva,’ Telugu p—ud. a ‘anus,’ Tulu p—ut. i ‘vulva,’ Kodagu pur¨ı, Kota pid. , Toda p¨ıd. y ‘penis,’ Kuwi putki. [D 4273, 4379, 4476, NSD 59] Mongolian: Middle Mongolian h¨ut¨u-g¨un ‘vulva.’ Japanese-Ryukyuan: Old Japanese photo ‘vulva’ (mod. hoto). [SY] Eskimo-Aleut: Proto-Eskimo-Aleut *putu ‘hole.’ [EA] Caucasian: Proto-Caucasian *p˘ut’i ‘genitals (mostly female),’ Proto-Nax *but’ ‘vulva,’ Proto-Avar-Andi *but’a, Proto-Lak *put’i ‘tube,’ Proto-Dargi *put’i ‘anus,’ Proto-Lezghian *—pot’ ‘penis.’ [C 168] Basque poto-rro ‘pubis, vulva.’ ?Australian: Luridya pud˘a ‘vulva.’ [VB] ?Austronesian: Proto-Austronesian *betik ‘vagina,’ *puki ‘vulva’ (< *puti ?; cf. East Rukai pati ‘vulva’), Ami puki, Tsou buki ‘penis.’ [AN 121, WW 231, 233, PB 417] Amerind: Almosan-Keresiouan: Delaware saputti ‘anus,’ Mohegan sebud, Wiyot beˇs ‘vagina,’ Upper Chehalis -pˇs ‘anus’; Penutian: Chinook puˇc, Yaudanchi poto ‘penis,’ San Juan Bautista lapus ‘anus,’ Southern Sierra Miwok p—otol; Hokan: Washo (d-)—ıbis ‘vagina,’ Karok v—ıθ, Diegue˜no hap— ıˇcatt, Tequistlatec (la-)beˇsu÷; Chibchan-Paezan: Move butie, Paya peta-istapcca ‘anus,’ Chimu pot, Ayoman busi ‘vagina,’ Allentiac poru; Andean: Quechua upiti ‘anus,’ Yamana p—uta ‘hole,’ Aymara phuthu; MacroTucanoan: Gamella sebu ‘vulva,’ Uaiana mbitikope ‘anus,’ Uas¨ona hibitikope; Equatorial: Guahibo petu ‘vagina,’ Guayabero sil-fhuta ‘vulva,’ Kandoshi apˇcir(-iˇc), Toyeri apuit ‘vagina,’Wachipairi ped, Piapoko afhutani ‘buttocks,’ Tariana p—ati-niawa ‘vagina,’ Warakena p—ede ‘clitoris,’ Caranga piˇce ‘vulva,’ Uro piˇsi, (cf. also such Equatorial forms as Siusi tsu-pote ‘vagina,’ Campa sibiˇci ‘vulva,’ ˇsibiˇci ‘penis,’ Uro ˇsapsi ‘genital organ’); Macro-Carib: Jaricuna poita ‘vagina,’ Pimenteira p¨utze-maung, Waiwai boˇci ‘pubic hair,’ Motilon pirri ‘penis’; Macro-Panoan: Cavine˜na busu-kani ‘anus,’ Tagnani opet, Tiatinagua besi ‘penis,’ Panobo buˇsi,’ Lule pesu; Macro-Ge: Mekran putote. [AM 263, EQ 121, AMN] Questa etimologia è particolarmente indicativa per la presente discussione perché il significato implicato raramente è preso in prestito e non ha collegamenti onomatopeici (because the meaning involved is rarely borrowed and has no onomatopoeic connections). Esso così offre un caso chiaro in cui le somiglianze devono essere dovute o all'origine comune o a convergenza accidentale (the similarities must be due either to common origin or to accidental convergence). 48 Per provare a calcolare la probabilità che queste somiglianze siano generate indipendentemente, è necessario assumere determinati presupposti, e in ogni fase si adotterà un approccio minimalista che di fatto ne sottovaluti la reale probabilità. Presupponendo, come fatto sopra, che ogni famiglia linguistica usi soltanto sette consonanti e tre vocali, creando i 147 tipi di sillaba indicati nella tabella 5, ci si dovrebbe chiedere qual’è, allora, la probabilità che due lingue abbinino casualmente forma e significato per un particolare dominio semantico/fonologico, in questo caso “genitalia” femminili: è chiaramente di 1/147 o .007. Qualunque sia la forma che compare nella prima famiglia linguistica, la seconda famiglia ha soltanto una probabilità su 147 di accoppiamento significante/significato. E la probabilità che una terza famiglia offra un abbinamento coincidente sarà (1/147)2 o .000049; quello di una quarta famiglia, (1/147)3 o .0000003; e così via. Nell'etimologia proposta, 14 su 32 lingue mostrano parentele apparenti, benché la prova sia per il momento ridotta in Australiano e sebbene la vocale in Austronesiano (e in molte forme di Amerindio) sia e piuttosto che la u prevista. Se s’ignorano questi particolari, allora la probabilità che la particolare correlazione significante/significato di “PUT/organi genitali femminili” si sia verificata in modo indipendente quattordici volte saranno (1/147)13, o circa una probabilità in dieci octilioni, secondo calcoli approssimativi (then the probabilità that the particular sound/meaning correlation “PUT/female genitals” arose independently fourteen times will be (1/147)13, or about one chance in ten octillion, by our rough calculations). La derivazione da una fonte o matrice comune (common source) sembrerebbe la spiegazione più probabile. Le critiche più frequenti a questo tipo di studio, -definito appunto global comparison o global etymologies99-, sono ovviamente legate inestricabilmente alla tassonomia, a questioni come la ricostruzione della protolingua e le regolari corrispondenze fonologiche. 99 Bengston-Ruhlen 1994, p. 283. 49 2.c.4. Compatibilità tra “multilateral comparison” e “traditional method”. Bengston-Ruhlen affrontano la questione della presunta incompatibilità fra il metodo della mass o multilateral comparison di Greenberg e il metodo tradizionale della linguistica comparativa classica (a topic that is at the heart of many current disputes, the alleged incompatibility between Greenberg’s method of multilateral comparison and the traditional methods of comparative linguistics)100, confutando quei linguisti che ritengono che l’approccio che Greenberg chiama “confronto multilaterale” (Greenberg’s use of what he calls multilateral comparison) per classificare le lingue del mondo, sia incompatibile -o persino antagonistico - ai metodi della linguistica storica tradizionale (is incompatibile with—or even antagonistic to—the methods of traditional historical linguistics), e che, per rafforzare tale critica, enfatizzano il ruolo della ricostruzione e delle corrispondenze fonetiche (which emphasize reconstruction and sound correspondences)101. I due studiosi citano in particolare la Bynon102, la quale afferma arbitrariamente che: “l'uso del confronto del vocabolario di base non è semplicemente assunto come preliminare alla ricostruzione ma come un suo sostituto… I linguisti storici tradizionali… sono stati solerti nel precisare le inesattezze che sono legate al voler derivare risultati da un ricorso a mera somiglianza della forma valutata intuitivamente e non fondata su ricostruzione”. E ancora viene citata Anna Morpurgo Davies103, la quale dichiarava: “Ancora non sappiamo se le superfamiglie descritte in questo modo abbiano le stesse proprietà delle famiglie stabilite con il metodo comparativo standard. Se non lo fanno, c’è un serio rischio che l'intero concetto di superfamiglia sia vuoto”. Allo stesso modo vengono chiamati in causa Derbyshire e Pullum104, i quali ritengono che l’ipotesi di Greenberg sull’Amerindio “faccia sussultare, come minimo, una volta giudicato in termini di metodologia standard”. 100 Bengston-Ruhlen 1994, p. 284. Bengston-Ruhlen 1994, p. 284 102 Bynon 1977, p.271: “the use of basic vocabulary comparison not simply as a preliminary to reconstruction but as a substitute for it is more controversial. . . . Traditional historical linguists . . . have not been slow in pointing out the inaccuracies which are bound to result from a reliance on mere similarity of form assessed intuitively and unsubstantiated by reconstruction.” 103 Morpurgo Davies 1889, p. 167: that “we do not yet know whether superfamilies outlined in this way have the same properties as families established with the standard comparative method. If they do not, there is a serious risk that the whole concept of superfamily is vacuous.” 104 Derbyshire and Pullum 1991, p. 13: “startling, to say the least, when judged in terms of the standard methodology. 101 50 Bergston-Ruhlen concordano nel ribadire che la confusione mostrata nelle tre citazioni precedenti (e se ne potrebbero dare molte altre) derivi dal fatto che i linguisti non considerano, o non si rendono conto, che in realtà il metodo comparativo consiste essenzialmente di due fasi: la prima fase è la classificazione, che in realtà non è diversa da quella che Greenberg chiama multilateral comparison; la seconda fase, che potrebbe essere denominata Linguistica storica, coinvolge questioni interne alla singola famiglia linguistica quali le corrispondenze fonetiche e la ricostruzione della proto-lingua. In pratica, non è mai stato assegnato fino ad oggi un nome ufficiale alla prima tappa del metodo comparativo semplicemente perché le due fasi sono raramente distinte nei manuali di base di Linguistica storica, nei quali, quasi senza eccezione, la fase iniziale, cioè la classificazione, viene trascurata, trascurata o non nominata affatto105. Inoltre nei manuali sono quasi sempre trascurate le lingue di famiglie non indoeuropee. L'origine di quest’anomalia è una conseguenza del fatto che l’Indoeuropeo si trova a essere il primogenito nel pantheon delle famiglie identificate e che la successiva elaborazione delle famiglie è stata fatta da parte di Europei, nel corso del XIX secolo. Il fatto che la fase iniziale della linguistica comparativa, cioè la classificazione, sia oggi così sistematicamente trascurata, è legato all'origine del concetto di Indoeuropeo in sé. I due studiosi ricordano, infatti, che quando sir William Jones annunciò nel 1786 che Sanscrito, Greco e Latino e probabilmente Gotico e Celtico – “derivano tutte da una qualche fonte comune” (“sprung from some common source”), essenzialmente egli non solo aveva risolto la prima fase della linguistica comparativa proprio al suo inizio -ha cioè identificato cinque rami di indoeuropeo e ipotizzato che tutti e cinque fossero le forme successivamente alterate di una singola lingua che non esiste più-, ma se solo avesse aggunto – o non avesse esclusolingue come Arabo, Ebraico e Turco (lingue che Jones conosceva bene) come appartenenti alla stessa famiglia indoeuropea, forse oggi, con il termine indoeuropeo, -che non è stato introdotto fino al XIX secolo-, si sarebbero considerate anche le suddette lingue, senza preconcetti106. Per gli Indoeuropeisti che hanno dominato la Linguistica storica, il problema della classificazione è stato quindi essenzialmente risolto da Jones e le aggiunte successive di alcuni rami più evidenti, come il Tocario A e B e l’Anatolico, non hanno alterato questo stato di cose. I problemi che Greenberg ha affrontato, tuttavia, quando ha classificato le lingue dell'Africa, erano abbastanza differenti da quelli che si pongono a un linguista storico che studia una famiglia già ben definita come quella indoeuropea. 105 106 Vd ad esmpio i manuali di Bynon 1977, Hock 1986, Anttila 1989. Bengston-Ruhlen 1994, p. 284-285. 51 Greenberg si è confrontato infatti con oltre 1.000 lingue, solo alcune delle quali s’inseriscono in famiglie ben definite (per esempio Semitico e Bantù) e delle quali c’era poca comprensione a quel tempo delle reciproche relazioni. In tali circostanze, ovviamente l’unico modo di cominciare era tramite il confronto delle unità lessicali di base e degli elementi formativi grammaticali in tutte le lingue, che conduce inevitabilmente a una classificazione delle lingue in un certo numero di gruppi definiti ricorrendo proprio alle somiglianze ricorrenti (Obviously the only way to begin is by the comparison of basic lexical items and grammatical formatives in all the languages, which inevitably leads to a classification of the languages into a certain number of groups defined by recurring similarities). Ciò è esattamente quello che Jones aveva fatto quando ha identificato l’Indoeuropeo, rilevando, come ha fatto, “un’affinità, sia nelle radici dei verbi sia nelle forme di grammatica, più forte di quella che probabilmente potrebbe essersi prodotta per puro caso (“a stronger affinity, both in the roots of verbs and in the forms of grammar, than could possibly have been produced by accident”). Non ha detto niente a proposito delle corrispondenze fonetiche o della ricostruzione, poiché, in effetti, questi concetti sono emersi (nonostante il lavoro precedente di Rask, Grimm e Bopp) soltanto nella seconda metà del XIX secolo. Questo studio esemplifica in modo evidente, concreto, quello che si è precedentemente dimostrato, e cioè che non c’è realmente conflitto fra il metodo di classificazione delle lingue di Greenberg e quello che viene considerato in modo non esplicito come “metodo standard”. La metodologia standard è usata per studiare problemi interni alla famiglia linguistica; non dice –per lo meno com’è spiegata nei manuali di base sopra citati- come identificare le famiglie linguistiche. Di conseguenza, non dice come classificare le lingue del mondo. Questo, piuttosto, è ciò che il lavoro di Greenberg fa. Greenberg stesso chiarisce che tali raggruppamenti [come Altaico, Hokano e Amerindio] non possano essere subito confrontati con il metodo comparativo standard, ma è necessaria prima la comparazione di massa, che non sarebbe un nuovo metodo non ortodosso, ma una necessaria fase preliminare.107 Chiarita tale premessa, Bengston-Ruhklen passano in rassegna i vari argomenti addotti dai linguisti storici classici per contestare questo tipo di lavoro di multilateral o global comparison: 1) L’argomento dell’assenza della ricostruzione delle singole protolingue108 nel procedimento della ricerca di global etymologies è irrilevante per Bengston-Ruhlen. Infatti essi pongono l’accento sul fatto che la 107 Greenberg 1987, p. 3; “Statements from certain American Indianists that I have rejected comparative linguistics and have invented a new unorthodox method called mass or multilateral comparison are repeated again and again in the press. Vd. Anche Greenberg 1990, p. 8. 108 Bengston-Ruhlen 1994, pp. 284-286. 52 ricostruzione è frequentemente confusa con la tassonomia. Dovrebbe essere chiaro che si può cominciare a ricostruire una protolingua solo dopo che si è stabilito quali lingue appartengono alla famiglia presunta. Finché non si delinei un insieme di lingue apparentemente imparentate (a set of seemingly related languages), collettivamente distinto da tutte le altre, con i metodi descritti, semplicemente non c’è niente da ricostruire. Per quanto riguarda l'effetto di una presunta convalidazione da parte della ricostruzione, nessuno oserebbe mai sostenere che, eventualmente, una cattiva ricostruzione di una parola possa invalidare una famiglia ben definita come quella indoeuropea. Oppure che una ricostruzione brillante possa mostrare che Slavico, Ob-Ugrico e Basco possano formare una famiglia valida. Quindi, come processo, la ricostruzione è completamente diversa dalla tassonomia e i due procedimenti non dovrebbero essere confusi. È per questo motivo che la sopracitata affermazione della Bynon secondo cui Greenberg userebbe il confronto multilaterale come “un sostituto” per la ricostruzione, in realtà non ha significato ed è certamente qualche cosa che Greenberg non ha mai scritto o detto o persino suggerito109. 2) Altro argomento confutato dai due studiosi come la più grande fonte di confusione nei recenti dibattiti sulla tassonomia è costituito dal ruolo che le corrispondenze di suono (sound corrispondences), come ad esempio la legge di Grimm, giocano nella classificazione110. È chiaro che i linguisti storici vedano come le regolari corrispondenze fonetiche svolgano un ruolo cruciale nell'identificazione di gruppi linguistici validi. In realtà, le corrispondenze fonetiche sono state scoperte solo dopo che una famiglia linguistica è stata identificata, per la semplice ragione che le corrispondenze fonetiche sono proprietà di particolari famiglie linguistiche. Le corrispondenze fonetiche non sono -e non potrebbero essere -una tecnica per la scoperta delle famiglie linguistiche stesse. Quando le corrispondenze fonetiche indoeuropee sono state scoperte nel XIX secolo, nessun Indoeuropeista ha pensato per un solo istante che queste stessero “provando” l’Indoeuropeo, la cui validità non era stata mai messa in dubbio da decenni. Ci sono svariate ragioni per le quali le corrispondenze fonetiche sono state collegate alle problematiche tassonomiche, soprattutto perché si ritiene normalmente che è soltanto per mezzo di regolari corrispondenze di suono che i prestiti (borrowings) possono essere distinti dalle parole ereditate (cognates). E’ stato lungamente riconosciuto, tuttavia, che i prestiti-calco (loanwords) obbediscono spesso rigorosamente alle corrispondenze regolari quanto le parole veramente imparentate, un punto messo risalto in parecchie occasioni da Greenberg (1957, 1987). 109 Bengston-Ruhlen 110 1994, p. 286. Bengston-Ruhlen 1994, pp. 286-288. 53 Campbell fa lo stesso appunto: “Deve essere notato che tali accordi fra i suoni ricorrono frequentemente in un certo numero di forme prese in prestito, imitando le regolari corrispondenze dei veri cognates”. 111 Si suole affermare che l’uso del criterio delle “regolari corrispondenze di suono” permette di discriminare le forme con somiglianza superficiale (superficial look-alikes) dai veri cognates e che i cognates non “sembrano” simili, ma possono essere riconosciuti soltanto per mezzo di tali corrispondenze (cognates, it is claimed, do not look alike and can only be recognized by means of sound correspondences). Ad esempio, le corrispondenze regolari indoeuropee comunemente accettate indicano che l’Armeno erku (=due) e il Latino duo (=due) siano cognates, nonostante la loro forma superficiale (significante) sia differente, mentre l’inglese bad (=male) ed il persiano-farsi bad (=male) non sono cognates, nonostante l’identità della loro forma, essnedo il risultato della colonizzazione inglese di fine ‘800. Bergston-Ruhlen ritengono evidente che le coincidenze identiche o molto simili non implicano necessariamente prestiti o una prova debole del collegamento genetico. Con una profondità di tempo che si avvicina a quella delle lingue indoeuropee d’Europa, le corrispondenze Maya sono nel complesso identiche o sono il risultato di singoli cambiamenti naturali e ricorrenti. I suoni proto-Maya *p, *m, *n e *y sono riflessi immodificati, con corrispondenze identiche, in tutte le oltre 30 lingue Maya. Tutte le altre corrispondenze sono molto simili. Anche l'inglese, dopo i suoi numerosi cambiamenti, riflette i suoni ProtoIndoeuropeo *r, *l, *m, *n, *s, *w, e *y nel complesso immutati. Una rapida indagine dei rapporti genetici a distanza (remote genetic relationships), un tempo discussi ma ora comunemente accettati, rivela che le corrispondenze di suono identiche (o molto simili) non siano così insolite112. Campbell osserva che le corrispondenze identiche non dovrebbero essere attribuite troppo velocemente a fenomeni di prestito, quindi scartate. Mentre una più lunga separazione può offrire maggiori opportunità di corrispondenze insolite che si sviluppano nei casi del rapporto genetico distante; non è in nessun modo necessario che tali sviluppi siano avvenuti per corrispondenze non- identiche113. Effettivamente, quando si esaminano le ricostruzioni che sono state proposte per quasi ogni famiglia, è possibile trovare anche lingue moderne che conservano le forme ancestrali virtualmente immutate. Per citare alcuni esempi, il Proto-Indoeuropeo *nēpot-, “nipote”, inglese ‘nephew, son-in-law’ è simile al 111 Campbell 1986, p. 224: “It ought to be noted that such agreements among sounds frequently recur in a number of borrowed forms, mimicking recurrent sound correspondences of true cognates.” 112 Bengston-Ruhlen 1994, p. 287. 113 Campbell 1986, pp. 221-223: “Therefore, identical correspondences should not be shunned nor too speedily attributed to borrowing. While longer separation may provide greater opportunity for unusual and exotic correspondences to develop in cases of distant genetic relationship, it is in no way necessary for such developments to have taken place nor for correspondences to be non-identical”. 54 latino nepos, otis; rumeno moderno nepot (anche etrusco “nef” o napat) e il Proto-Indoeuropeo *mūs “topo”, ing. mouse è conservato immutato in lat. mus, muris 114, ma anche in gr. màj, muÒj /’mys//myòs/; e si potrebbe aggiungere ancora: scr. duhitṛ, ant. pers. doxtar, avest. dugðar , celtic. duxtīr, gr. qugat»r /thygátēr/, ing. daughter, ted. Tochter, sved. dotter, tutti riconducibili a PIE *dhugH₂-térb per ’FIGLIA’ (innovazione lat. filia). Bengston-Ruhlen portano altri esempi115: il proto-Austronesiano *sepat (“2”) è quasi identico al Rukai sepate e il proto-Autronesiano *matsa “occhio” è identico al Rukai matsa. Il proto-Uralico *tule “fuoco” è conservato in finlandese tule- e il proto-Uralico *mo´ska “lavare” differisce poco dall’estone m˜oske-. Ad una profondità ancora maggiore di tempo, troviamo il proto-Nostratico *nato “relazione femminile del matrimonio” sopravvissuto in Uralico, come il finlandese nato “sorella del marito o moglie” e in Dravidico, come in Malese, nātūn ‘sorella del marito”, “mogli del fratello”, mentre il Proto-Nostratico *phalV ‘tooth’ “dente”, sopravvive in Dravidico e Telugu palu e in Altaico come Ulch palu. Ad una profondità ti tempo ancora maggiore, forse di quello Nostratico, troviamo il ProtoAustraliano *buNku knee “ginocchio” conservato in Dyirbal buNku. (cfr. anche lat. genu; gr. gÑnu, gÑn#atoj /gonu/gonvatoj/). Questa fase iniziale dell'analisi è necessariamente caratterizzata dall'identificazione di somiglianze facilmente riconoscibili (by the identification of easily recognizable similarities)116, come è accaduto con la scoperta della famiglia indoeuropea o delle altre. Il perfezionamento rappresentato da regolari corrispondenze esotiche della varietà erku-duo attende inevitabilmente uno stadio avanzato nella seconda tappa di analisi-, la vera e propria “linguistica storica”. Ed è importante riconoscere che il lavoro di questa fase conduce quasi invariabilmente a un perfezionamento delle etimologie, piuttosto che a un perfezionamento della classificazione (the work of this stage leads almost invariably to a refinement of the etymologies, rather than a refinement of the classification). 3) Le precedenti osservazioni conducono al problema del limite cronologico delle persistenze delle corrispondenze di suono. Fra le famiglie linguistiche del mondo, ci sono senza dubbio corrispondenze fonetiche esotiche come pure quelle che non sono state rilevate, e che alludono a una potenziale monogenesi iniziale delle lingue storico-naturali e a una successiva differenziazione cuturale. Lo studioso russo Starostin117 ha recentemente pubblicato la dichiarazione più esplicita sulle corrispondenze interfiletiche di suono 114 Bengston-Ruhlen 1994, p. 287. Bengston-Ruhlen 1994, p. 287. 116 Bengston-Ruhlen 1994, p. 288. 117 Starostin 1991. 115 55 (interphyletic sound correspondences) fino ad ora, cui fanno seguito i recentissimi articoli di Huff 2009, McMahon-McMahon 2005, Holman-Brown 2011 (Sound correspondences in the World’s Languages), di cui si parlerà in seguito.118 La breve tabella di Starostin delle corrispondenze Nostratico-DeneCaucasico, rappresenta un ampio sguardo del mondo linguistico, sebbene non abbastanza globale. Per Starostin, il Nostratico comprende 10 dei 32 gruppi linguistici esaminati da Brengston-Ruhlen (Kartveliano, Indoeuropeo, Uralico, Dravidico, Turcico, Mongolo, Tungus, Coreano, GiapponeseRyukyuan ed Eschimese-Aleutino) e Dene-Caucasico include Caucasico, Sino-Tibetano, Yeniseiano e Na-Dene -al quale si può aggiungere anche il Basco119. Quindi, le equazioni di Starostin rappresentano approssimativamente la metà dei presenti 32 gruppi linguistici, come pure la vasta maggioranza della massa della terra euroasiatica. Nelle corrispondenze di Starostin non c’è nulla che sia in contraddizione con le etimologie proposte da BengstonRuhlen120. Recentemente è stato ampiamente asserito che il metodo comparativo in linguistica fornisce risultati certi per gli ultimi 5.000-10.000 anni. Secondo Kaufman121 “i metodi di ricostruzione linguistica comparativa si limitano a un tetto temporale di 7.000 - 8.000”, affermazione che sembra essere un tentativo da parte degli Indoeuropeisti di “spiegare” perché l’indoeuropeo non ha collegamenti genetici noti: in realtà il fatto che l’indoeuropeo sia collegato intimamente con numeroso altre famiglie è stato ampiamente dimostrato dal Nostraticista russo Illich-Svitych 1971, una dimostrazione che è stata appoggiata ed estesa da Greenberg Indoeuropean and its closet relatives122. Lo studio sulle global etymologies dimostra che nei numerosi casi di suono (specialmente stabili come le consonanti nasali e liquide) -e perfino intere parole- hanno persistito col passare del tempo virtualmente in maniera immutata per più di 8.000 anni. Questo solleva la questione sul perché questi suoni evidentemente abbastanza stabili devono cambiare improvvisamente tanto da risultare irriconoscibili, o sparire interamente, oltre la soglia presunto insormontabile di 10.000 anni (This raises the question why these evidently quite stable sounds must suddenly change beyond recognition, or disappear entirely, beyond the supposedly insuperabile threshold of 10,000 years). Se possiamo usare le lingue moderne per ricostruire le protolingue che sono esistito almeno 6.000-8.000 anni fa (per esempio proto-Indoeuropeo, protoUralico, proto-Dravidico, proto-Austronesiano), perché tali lingue iniziali Vd. oltre cap. 3.b. Bengtson 1991a, b 120 Bengston-Ruhlen 1994, pp. 292-328. Holman-Brown 2011. 121 Kaufman 1990, p. 23. 122 Greenberg 2002 e 2005. 118 119 56 non possono esse stesse essere confrontate per discernere i raggruppamenti ancor più antichi?123 4) Ulteriore critica spesso mossa contro quello che può essere definito anche “confronto a lungo raggio” (long-range comparison)124 è la presenza di errori nei dati, errori che “invaliderebbero” l'ipotesi generale (another often-cited criticism of is the presence of errors in the data, errors that invalidate the overall hypothesis). Questa discussione ignora sia il buonsenso sia le misure standard di significato statistico. Nella classificazione genetica il peso cumulativo di tutta la prova evidente non permette che un errore accidentale invalidi l’intera dimostrazione (Rather, the cumulative weight of all the evidence completely swap the effects of whatever random errors may be scattered through the work). Come Greenberg ha spesso sottolineato -e, in effetti, ha mostrato con il suo lavoro – è evidente che la comparazione multilaterale rende valide le classificazioni genetiche anche attraverso dati decisamente degenerati. Un esempio è la classificazione delle lingue australiane di Greenberg nel 1953, attraverso l’utilizzo di poco più dei vocabolari pubblicati da E. M. Curr, The Australian Race, Melbourne nel 1886-87. Il metodo storico tradizionale esige dal metodo della mass comparison, perché possa essere considerato un lavoro comparativo serio, che i dati siano incontaminati e copiosi. Kaufman125 esigerebbe almeno 500 lessemi di base e 100 punti di grammatica prima che possa essere accettato un lavoro di mass comparison, ma rimane il fatto che gli Indeuropeisti abbiano classificato il Lidio come Indoeuropeo, senza dissenso, sulla base di "una manciata" di parole, come ha notato lo stesso Greenberg126. In conclusione, multilateral comparison e traditional method non sono affatto incompatibili, né antagonisti, ma due fasi successive di un unico processo di comparazione linguistica, che privilegiando l’approccio tipologico e prescindendo dal rapporto genealogico tra le lingue può tuttavia portare ad individuare nuove parentele genealogiche, attraverso l’osservazione del cambiamento graduale fonetico e della somiglianza superficiale. Sono stati proprio i nuovi mezzi informatici, negli ultimi anni, 20082011, a offrire un valido supporto alla multilateral comparison, potenti databases che permettono di gestire una grande mole di dati, un gran numero di lingue, altrimenti ingestibili dall’uomo, e che offrono principi statistici e probabilistici come strumenti capaci di dare prevedibilità a pochi dati da 123 Bengston-Ruhlen 1994, p. 288-289. Bengston-Ruhlen 1994, p. 289. 125 Kaufman 1990, p. 18. "...at least 500 items of basic vocabulary and 100 points of grammar before “serious comparative work” can be carried out…” 126 Greenberg 1990, p. 10: “Indo-Europeanists have classified Lydian as Indo-European, without dissent, on the basis of a handful of words”. 124 57 confrontare, nonché un tentativo di dare piena scientificità al concetto di somiglianza superficiale. 58 3. Recenti studi di Linguistica computazionale: approcci combinati Come si è già ricordato, recentissimi studi di linguistica computazionale hanno promosso un approccio combinato nel modo di affrontare le questioni fondamentali del cambiamento linguistico e della relazione genetica tra le lingue. Alcuni studiosi hanno recuperato non solo il metodo della mass comparison di Greenberg, ma come si vedrà, anche le Liste di Swadesh. I metodi adottati da entrambi caddero nell’oblio forse perché non ben capiti dalla critica o solo perché negli anni ‘50 non si disponeva del potente mezzo informatico capace di supportare e confermare le loro teorie e i loro metodi, fornendo strumenti come super-softwares ed enormi databases capaci di confrontare migliaia di lingue e migliaia di parole e di combinazioni significante/significato, cui hanno unito modelli statistici e probabilisticostocastici, aprendo nuove strade alla linguistica storica. 3.a. Il recupero di Swadesh (Lexicostatistics e Glottochronology) 3.a.1. Dal “vocabolario basico” delle word-lists di Swadesh … Il nome di Morris Swadesh127 (Massachusetts 1909-Mexico City 1967) è rimasto associato alle sue Liste di parole universali ed è noto per aver fondato Lexicostatistics e Glottochronology, metodi matematici per la scoperta dei rapporti fra le lingue e per la teoria del cambiamento linguistico, approcci che non hanno avuto grande seguito nella storia della Linguistica perché oggetto di letture polemiche e ideologiche, ma soprattutto di malintesi. Allievo di Edward Sapir, Swadesh applica concetti di base della linguistica storica allo studio delle lingue indigene delle Americhe. Il suo assunto principale consiste nell’affermazione che ogni lingua cambia nei secoli (come ad esempio i cambiamenti in Inglese dal Medioevo), e che alcune lingue divergono e si trasformano in dialetti o in lingue separate che ancora appartengono alla stessa famiglia linguistica. Rifiuta quindi il concetto di sostituzione (replacement) da un sistema linguistico all’altro. Tracciare somiglianze e differenze fra le lingue nel loro cambiamento, appunto, sarebbe secondo lui lo scopo precipuo della linguistica storica. In particolare, rifacendosi al fatto che in Europa si era verificato un esempio molto chiaro di cambiamento linguistico diacronico, e cioè lo spostamento (shift) dal Latino alle lingue Romanze (italiano, francese, spagnolo, portoghese e rumeno) che si è verificate appunto nel continente nel corso di meno di 2000 anni, dato che queste lingue erano scritte, 127 Swadesh 1955. 59 propose di “misurarne” il tasso di cambiamento (to gauge the rate of change): egli ritenne che questo principio di base si sarebbe potuto applicare a tutte le lingue, ed ha trascorso gran parte della sua vita a confrontare le centinaia di lingue indigene delle Americhe e a tracciare la loro parentela (mapping their relatedness)128, proponendo un certo numero di collegamenti genetici a distanza fra le lingue (distant genetic links among languages). Negli anni ‘30 Swadesh fa parte di quella nuova generazione di linguisti che hanno cominciato a individuare una più grande famiglia indoeuropea (Nostratica) e di quei linguisti che, come Greenberg, stavano identificando le somiglianze di parola (identifying word similarities) per proporre famiglie linguistiche fra le lingue indio-americane. Dal 1940 in poi, Swadesh ha iniziato ad elaborare liste di lessico (vocabulary) con i significati di base che si riferiscono a parti del corpo, verbi, fenomeni naturali e altre parole universali per scopi comparativi. Ci sono molte versioni di tali Liste129. Swadesh ha iniziato con una lista di 225 significati, ridotta a 165 parole per la lingua Salish; nel 1952130 ha pubblicato una lista di 215 significati, di cui ha suggerito di cancellarne 16 non universali o abbastanza chiari (not universal or clear enough), con uno aggiunto per arrivare a 200 parole. Nel 1955131 ha creato ancora una "lexi(costatisti)cal test list" con 215 significati, 92 dei quali più favorevoli (most favourable) sono stati segnati con un asterisco. Altri 8 meno adatti (lesser suitable ones) furono aggiunti per raggiungere le 100 parole. Ufficialmente solo la lista finale di 100 parole del 1971132, il risultato dell’esperienza di tutta una vita, testata ripetutamente per un possibile impiego universale e non ambiguità (for universal usability and unambiguity), merita l'etichetta di “Lista di Swadesh”: Lista finale di Swadesh (1971, p.283, post mortem) con spiegazioni essenziali date soltanto in Swadesh 1952, pp. 456-7 e 1955: No. 1 2 3 4 5 Meaning / Concept I (Pers.Pron.1.Sg.) You (2.sg! 1952 thou & ye) we (1955: inclusive) this that Swadesh 1960, pp. 894–924 e 1971. R.B. Lees 1953, J.A. Rea 1958, Wilson 1969, Bender 1969, Oswald 1971, Lehmann 1984, Ringe 1992, Starostin 1984, Dyen 1992, Wang 1994, Lohr 2000, Kessler 2002. 130 Swadesh 1952, p..456sg. 131 Swadesh 1955, p.127 132 Swadesh 1971, p.283 128 129 60 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 who? (“?” left off 1971) what? (“?” left off 1971 not all (of a number) many one two big long small woman man (male human) person (human being) fish (noun) bird dog louse tree (not log) seed (noun!) leaf root bark (of tree) skin (1952: person’s) flesh (1952 meat, flesh) blood bone grease (1952: fat, orgc. subst.) egg horn (of bull etc, not 1952) tail feather (large, not down) hair (?) head (anatomic) ear eye nose mouth tooth (front rather than molar) tongue (anat.) claw (not in 1952) foot knee (not 1952) 61 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 hand belly neck (not nape!) breasts ( female; 1955: breast) heart liver drink (verb) eat (verb) bite (verb) see (verb) hear (verb) know (facts) sleep (verb) die (verb) kill (verb) swim (verb) fly (verb) walk (verb) come (verb) lie (on side, later? recline?) sit (verb) stand (verb) give (verb) say (verb) sun moon (not 1952) star water (noun) rain (noun, 1952 verb) stone sand earth (=soil) cloud smoke (noun, of fire) fire ash(es) burn (verb intr. !) path (1952 road, trail; not street) mountain red green yellow 62 90 white 91 black 92 night 93 hot (adv.; 1952 warm, of weather) 94 cold (of weather) 95 full 96 new 97 good 98 round (not 1952) 99 dry (substance!) 100 name La lista Swadesh–Yakhontov è un sottoinsieme di 35 parole della lista di Swadesh presupposta come particolarmente stabile dal linguista russo Yakhontov133: 1. I 2. you (singular) 7. this 11. who 12. what 22. one 23. two 45. fish 47. dog 48. louse 64. blood 65. bone 67. egg 68. horn 69. tail 73. ear 74. eye 75. nose 77. tooth 78. tongue 83. hand 103. know 109. die 133 Starostin 1991. 63 128. give 147. sun 148. moon 150. water 155. salt 156. stone 163. wind 167. fire 179. year 182. full 183. new 207. name Holman et alii 2008134 hanno evidenziato come la lista di SwadeshYakhontov sia meno accurata della lista originaria Swadesh-100 nell'identificazione dei rapporti fra i dialetti. Tuttavia, hanno calcolato la relativa stabilità delle parole confrontando la permanenza fra lingue in famiglie linguistiche stabilite, e non hanno trovato differenza statisticamente significativa nelle correlazioni tra le famiglie del Vecchio e del Nuovo Mondo. Quella che segue è la lista Swadesh-100 allineata, con i numeri di Swadesh e la relativa stabilità:135 1. 22 *louse (42.8) 2. 12 *two (39.8) 3. 75 *water (37.4) 4. 39 *ear (37.2) 5. 61 *die (36.3) 6. 1 *I (35.9) 7. 53 *liver (35.7) 8. 40 *eye (35.4) 9. 48 *hand (34.9) 10. 58 *hear (33.8) 11. 23 *tree (33.6) 12. 19 *fish (33.4) 13. 100 *name (32.4) 14. 77 *stone (32.1) 15. 43 *tooth (30.7) 16. 51 *breasts (30.7) 17. 2 *you (30.6) 18. 85 *path (30.2) 134 135 Holman et al. 2008. Holman et alii., vd. tabelle riportate Appendice. 64 19. 31 *bone (30.1) 20. 44 *tongue (30.1) 21. 28 *skin (29.6) 22. 92 *night (29.6) 23. 25 *leaf (29.4) 24. 76 rain (29.3) 25. 62 kill (29.2) 26. 30 *blood (29.0) 27. 34 *horn (28.8) 28. 18 *person (28.7) 29. 47 *knee (28.0) 30. 11 *one (27.4) 31. 41 *nose (27.3) 32. 95 *full (26.9) 33. 66 *come (26.8) 34. 74 *star (26.6) 35. 86 *mountain (26.2) 36. 82 *fire (25.7) 37. 3 *we (25.4) 38. 54 *drink (25.0) 39. 57 *see (24.7) 40. 27 bark (24.5) 41. 96 *new (24.3) 42. 21 *dog (24.2) 43. 72 *sun (24.2) 44. 64 fly (24.1) 45. 32 grease (23.4) 46. 73 moon (23.4) 47. 70 give (23.3) 48. 52 heart (23.2) 49. 36 feather (23.1) 50. 90 white (22.7) 51. 89 yellow (22.5) 52. 20 bird (21.8) 53. 38 head (21.7) 54. 79 earth (21.7) 55. 46 foot (21.6) 56. 91 black (21.6) 57. 42 mouth (21.5) 58. 88 green (21.1) 59. 60 sleep (21.0) 60. 7 what (20.7) 61. 26 root (20.5) 65 62. 45 claw (20.5) 63. 56 bite (20.5) 64. 83 ash (20.3) 65. 87 red (20.2) 66. 55 eat (20.0) 67. 33 egg (19.8) 68. 6 who (19.0) 69. 99 dry (18.9) 70. 37 hair (18.6) 71. 81 smoke (18.5) 72. 8 not (18.3) 73. 4 this (18.2) 74. 24 seed (18.2) 75. 16 woman (17.9) 76. 98 round (17.9) 77. 14 long (17.4) 78. 69 stand (17.1) 79. 97 good (16.9) 80. 17 man (16.7) 81. 94 cold (16.6) 82. 29 flesh (16.4) 83. 50 neck (16.0) 84. 71 say (16.0) 85. 84 burn (15.5) 86. 35 tail (14.9) 87. 78 sand (14.9) 88. 5 that (14.7) 89. 65 walk (14.4) 90. 68 sit (14.3) 91. 10 many (14.2) 92. 9 all (14.1) 93. 59 know (14.1) 94. 80 cloud (13.9) 95. 63 swim (13.6) 96. 49 belly (13.5) 97. 13 big (13.4) 98. 93 hot (11.6) 99. 67 lie (11.2) 100. 15 small (6.3) Ma qual è il principio su cui si basano le Liste di Swadesh? Uno dei frequenti errori sul principio di Swadesh consiste nel fatto che il concetto di lista "basica" è stato interpretato nel senso di “parole di base per 66 l’acquisizione di una lingua” (language acquisition), paragonabile per esempio al "Basic English Vocabulary". Un altro frequente errore è il presupposto che Swadesh abbia scelto i significati per la loro stabilità (stability). In realtà le parole-significato (meanings) delle liste sono state scelte per la loro presenza e disponibilità universale, indipendente da fattori culturali, e nel maggior numero possibile di lingue (for their universal, cultural independent, availability in as much as possible languages): mano, piede, occhio, padre, madre, acqua,… sono significati universalmente presenti, non culturali (come manufatti o strumenti legati ad una particolare civiltà), e quindi “basici”. Nondimeno, è vero che anche il concetto di stabilità è stato preso in considerazione136. Le liste di Swadesh sono comunque ritenute tutt’oggi uno strumento utile per l'apprendimento delle lingue e può essere usata per realizzare velocemente la conoscenza di base di altre lingue (a useful tool for learning languages, and can be used to rapidly achieve basic knowledge of other languages). Questo perché, per la comunicazione di base, la conoscenza del lessico (vocabulary), è più importante della conoscenza della grammatica e della sintassi. A volte è persino possibile raggiungere le abilità di comunicazione di base senza conoscenza della sintassi di qualunque lingua di arrivo (it is even possible to achieve (very) basic communication skills with no knowledge of the target language syntax whatsoever)137. Per queste caratteristiche, Swadesh è diventato consulente presso l’ International Auxiliary Language Association138, che ha standardizzato la cosiddetta Interlingua139, una lingua ausiliaria di comunicazione interlinguistica costruita con il vocabolario latino, greco, germanico, slavo…, e una grammatica molto elementare, per permettere una comunicazione immediata in tutto il mondo, senza frontiere, una lingua presentata al Lohr 2000, vol. 1, pp. 209-223. Swadesh 1971. 138 Vd. http://www.interlingua.com/. 139 L'interlingua è una lingua ausiliaria internazionale (IAL), sviluppata fra 1937 e 1951 dall'associazione ausiliaria internazionale di lingua (IALA). È seconda o terza IAL più ampiamente usata, dopo esperanto e forse Ido; lo IAL naturalistico è più ampiamente usato (il relativo vocabolario, la grammatica ed altre caratteristiche in gran parte sono derivati dai linguaggi naturali). L'interlingua è stata sviluppata per unire una grammatica semplice e principalmente normale con un vocabolario comune alla più larga gamma possibile di lingue, rendendola insolitamente facile da imparare, almeno per quelli la cui lingua madre era una fonte del vocabolario e grammatica Talvolta è usata come introduzione veloce a molti linguaggi naturali. Le parole in Interlingua possono essere prese da tutte le lingue, finchè la loro internazionalità è verificato dalla loro presenza in sette lingue di controllo: spagnolo, portoghese, italiano, francese ed inglese, con tedesco e russo come controlli secondari. Queste sono le lingue più ampiamente parlate, Romanze, germaniche e Slave. A causa del loro stretto rapporto, lo Spagnolo ed il Portoghesi sono trattati come un'unità. La maggior parte delle parole dell'interlingua è di origine latina, con le lingue greca e germanica che forniscono il secondo ed il terzo più grande numero. Il resto del vocabolario proviene dallo Slavo e dalle lingue non occidentali. 136 137 67 pubblico nel 1951 e che è tuttora in via d’implementazione140, tanto che il blog del sito dell’International Auxiliary Language Association è totalmente scritto in Interlingua. 3.a. 2. … alla Lexicostatistics e Glottochronology Swadesh ha proposto di usare le sue word-Lists al fine della misurazione della prossimità di coppie di lingue (measuring the closeness of any pair of languages), un metodo che ha denominato Lexicostatistics, in altre parole la valutazione quantitativa di parentela linguistica (“lexicostatistics, quantitative language relatedness assessment”), tentando di classificare le lingue in base al tasso di cambiamento con cui hanno sostituito le parole di base ricostruibili nella protolingua (which attempts to classify languages on the basis of the extent to which they have replaced basic words reconstructible in the proto-language). Questo metodo sin dall’inizio è stato ampiamente discusso, perchè ritenuto poco meritevole di reale dignità scientifica, e perché forniva risultati di nessun'affidabilità prevedibile. Swadesh arriva a proporre che tali liste potessero essere usate per valutare il tempo trascorso da quando ciascuna delle due lingue correlate ha cominciato a divergere (to estimate the amount of time elapsed since any two related languages first began to diverge), come estensione della lesxcostatistics, computando le date di divergenza dal tasso di persistenza del lessico (which extends lexicostatistics by computing divergence dates from the lexical retention rate), proponendo quella tecnica denominata Glottochronology (dal greco-Attico glîtta “lingua” e crÒnoj “tempo”), cioè datazione di divergenza delle lingue (“glottochronology, language divergence dating”)141, un tentativo di determinare la data approssimativa della prima separazione di lingue geneticamente imparentate (to determine the approximate date of first separation of genetically related languages). Il linguista riteneva che la prossimità del rapporto tra le lingue sia approssimativamente proporzionale al numero di parole imparentate, ereditate (cognates), in altre parole con la medesima origine etimologica, presenti nella lista. Anziché andare a considerare le innovazioni, come fa il metodo comparativo tradizionale, Swadesh si soffermò piuttosto sulla persistenza. La ragione per cui si è usato un insieme fisso di concetti (a fixed set of concepts), piuttosto che una lista di parole arbitrarie (a list of arbitrary words), è che si presuppone che il vocabolario di base imparato durante la prima infanzia cambi molto lentamente col passare del tempo. Si noti che l'operazione di conteggio del numero delle parole cognates nella lista è lontano dall’essere casuale, insignificante (trivial) e può essere soggetto a disputa, perché i cognates non necessariamente sembrano simili (cognates do not 140 141 Esterhill 2000. Swadesh et alii 1972, pp. 271-284. 68 necessarily look similar) e il riconoscimento dei cognates presuppone la conoscenza delle leggi fonetiche delle rispettive lingue (recognition of cognates presupposes knowledge of the sound laws of the respective languages). Per esempio, l'inglese “wheel”, il sanscrito “chakra”, il latino “ciclus”, sono cognates anche se non sarebbero riconoscibili come tali senza la conoscenza della storia di tutte e tre lingue. Inoltre, persino nei casi in cui il numero dei cognates è accettato, è l'uso delle liste di Swadesh per la datazione a essere disputato, a causa del presupposto di fondo che il tasso di sostituzione del vocabolario di base è costante per lunghi periodi di tempo (the rate of replacement of basic vocabulary is constant over long periods of time). L’attuale linguistica storica tradizionale è solitamente molto scettica circa i reclami di parentela basati esclusivamente sulle liste di Swadesh, per gli stessi motivi visti e dibattuti per Greenberg e la mass o multilateral comparison. Tuttavia, se il concetto di vocabolario di base (basic vocabulary) era stato usato informalmente prima, Swadesh lo ha reso esplicito disegnando proprio quella lista di 100 significati (list of 100 word meanings) che un ricercatore che studia ogni lingua potrebbe usare per l'identificazione del vocabolario basico di quella lingua. Il vocabolario di base di una lingua viene ufficialmente definito come quello che descrive le parti del corpo e le funzioni, quali pelle, sangue, anima, bevanda, i fenomeni naturali come acqua, cielo, uccello, fumo, esperienze immediate di senso e le dimensioni fisiche, come lungo, rosso, freddo. In seguito a questa enunciazione, molti linguisti hanno obiettato sostenendo che sia impossible enumerare i significati universali e che l'identificazione di parole semanticamente equivalenti in lingue differenti sia spesso altamente problematica. Swadesh stesso aveva abbandonato infatti la lista di 200 parole per il sospetto che avesse troppi termini presi in prestito (borrowed items) e che quindi non fosse affidabile142. Pertanto, proprio in seguito al sollevamento di questioni inerenti all’effettiva possibilità di individuare parole universali per ogni cultura, e al problema dell’individuazione dei prestiti, l'entusiasmo per l'uso delle liste di Swadesh e della Glottochronology è calato durante gli anni ‘60 e la discussione sul metodo e sul merito è diventata di tipo emotivo, conducendo ad un crollo provvisorio dell’approccio, considerato inaffidabile (unreliable). 142 Vd. Embleton 1995. 69 3. a. 3. Il dibattito sull’eredità di Swadesh Nel corso degli anni ’70, sono stati tentati perfezionamenti del metodo di Swadesh, individuando modi per scartare i possibili prestiti (borrowings) e usando robusti modelli statistici, presi in prestito dalla filogenetica. Un esempio dell'uso recente delle liste di Swadesh per la datazione assoluta è lo studio di Gray e di Atkinson143, che hanno calcolato un albero delle lingue indoeuropee con le date assolute per i relativi nodi, usando i principi Bayesani144, che datano la lingua Proto-Indoeuropea al 7000 a.C. circa (Indo-Hittita)145. Atkinson e Gray usano modelli sviluppati per l'analisi dei rapporti filogenetici nella biologia. Rimane da vedere se il metodo ottenga ampia accettazione in linguistica. Il tentativo di rivalutare la Lexicostatistics è legato alla volontà di unire al processo di individuazione dei significati universali la componente fonematica. Non tutti sanno infatti che mentre Sapir, Bloomfield, Trubetzkoy già proponevano il concetto di “fonema„ come rappresentazione astratta dei tipi di suono, Swadesh stava fondando il suo primo lavoro teorico sull'analisi fonematica, cioè l'analisi della struttura del suono o fonologia delle lingue. Il contributo di Swadesh fu quello di sviluppare un insieme di principi per aiutare il fonologista a scoprire i fonemi in base alla distribuzione dei suoni in una data lingua. L'inglese, per esempio, usa differenti suoni “p” (bilabiale sorda) in pit, upper, e spill. Poiché la pronuncia è chiaramente in ogni caso dipendente dall’esatta posizione all'interno della parola, Swadesh ha suggerito che queste varianti posizionali di suono fossero in “distribuzione complementare” (“complementary distribution”) e dovrebbero quindi essere considerate come “istanze” dello stesso tipo di suono o fonema. Questi principi furono applicati in seguito agli elementi di parola e frase dal linguista Harris. L'analisi distributiva si è così trasformata in “una procedura di scoperta generale” (“general discovery procedure”) per gli elementi di base della struttura linguistica ed è rimasta una parte integrante della metodologia linguistica fino ad oggi. Sulla base del principio fonologico della complementary distribution, nelle sue vaste indagini su numerose lingue, Swadesh aveva raggiunto un crescente interesse per le cosiddette apparenti somiglianze lessicali e strutturali in lingue differenti. Poiché il suo studio sulle lingue quasi estinte è stato condotto con risorse limitate, avvertì l'esigenza di una procedura standardizzata per la raccolta rapida di dati cruciali che rendono evidenti gli Gray-Atkinson 2003. Howson-Urbach 2005; http://en.wikipedia.org/wiki/Bayesian_inference. 145 Holm 2008; http://en.wikipedia.org/wiki/Indo-Hittite. 143 144 70 indizi riguardo ai rapporti linguistici (a standardized procedure for quickly collecting crucial data yielding clues about language relationships). Egli tentò quindi di ricostruire una lingua antenata in base ai cognates, cioè parole intuitivamente imparentate provenienti da lingue differenti (per cui l’inglese hound è un cognate del tedesco Hund, “cane”). Poiché lo sviluppo culturale è sempre accompagnato dalle innovazioni del lessico (lexical innovations), Swadesh -e molti linguisti prima di lui- hanno ritenuto che “il vocabolario di base” presumibilmente più stabile, sia il migliore posto per cominciare a cercare i cognates (presumably more stable “basic vocabulary” would be the best place to start looking for cognates). In conformità a questo principio, la lexicostatistics può essere definita come un affidabile metodo quantitativo per la misurazione della somiglianza delle lingue (lexicostatistics, a quantitative method for measuring the similarity of languages). Se il vocabolario di base di una lingua coincide con quello di un’altra per oltre il 90%, Swadesh ha dedotto, queste lingue devono essere strettamente connesse (If the basic vocabulary of one language matches that of another to over 90 percent, these languages must be closely related). Tuttavia, proprio perché la maggior parte dei linguisti ritiene che la ricostruzione delle lingue-ancestrali, antenate (proto-lingue) fornisca una prova più certa e affidabile per la parentela delle lingue rispetto alle analisi statistiche (statistical analyses), la lexicostatistics continua ad essere vista con sospetto. Al contrario, i linguisti moderati oggi concedono che la lista di Swadesh e la lexicostatistics possono essere utili per le indagini iniziali approssimative o per le situazioni dove i dati completi sono semplicemente non disponibili -cosa che è, infatti, vicino a ciò che Swadesh aveva avuto in mente sin dall’inizio (moderate linguists today concede that the Swadesh list and lexicostatistics may be useful for rough initial investigations or for situations where complete data are simply unavailable--which is, in fact, close to what Swadesh had in mind). Resta invece ancora controversa l’affermazione di Swadesh per cui “il deperimento” del vocabolario di base potrebbe essere usato per la “datazione delle lingue ancestrali in modo analogo al procedimento che permette di determinare l'età dei fossili in base al decadimento radioattivo (that the “decay” of basic vocabulary could be used for “glottochronology,” the dating of ancestor languages analogous to determining the age of fossils on the basis of radioactive decay). Swadesh infatti arrivò a credere che il vocabolario di base decadesse con un tasso di 14 per cento in 1000 anni (with a rate of 14 percent over 1000 years), in modo che le lingue manterrebbero in media circa l’86% del loro vocabolario di base nel corso di questo spazio di tempo. Quindi, se i vocabolari di base di due lingue imparentate risultano essere coincidenti per il 70%, si può 71 presumere che si siano sviluppati da una singola lingua che è esistita approssimativamente 12 secoli prima. Il presupposto che il deperimento del vocabolario di base sia generalmente uniforme (basic vocabulary decay is generally uniform) è stato in gran parte rifiutato. Se uno ammette che le lingue, proprio come le società, possano svilupparsi in tassi differenti in tempi differenti, il presupposto di un deperimento costante del vocabolario in particolare, ed il metodo glottocronologico in generale, ne risulta seriamente minato alla base. Nonostante i meriti indiscutibili di Swadesh, certe sue affermazioni sulla glottochronology hanno fatto cadere nell’oblio il suo metodo e inserito il suo nome tra gli studiosi “malfamati” della Linguistica. Per esempio, egli è stato accusato dell’utilizzo della lexicostatistics come scorciatoia per la ricerca, nel tentativo di evitare il duro lavoro di ricostruzione, nonostante Swadesh abbia dichiarato ripetutamente che una conoscenza dettagliata delle lingue in esame è di cruciale importanza e che altri dati devono essere considerati prima (Swadesh stated repeatedly that a detailed knowledge of the languages under investigation is crucial, and that other data must be considered). Inoltre, Swadesh è stato erroneamente citato come sostenitore della teoria che tutte le lingue si sono sviluppate da un singolo antenato, la teoria “della monogenesi” (Swadesh is misleadingly cited as a supporter of the theory that all languages have developed from a single ancestor (the “monogenesis” theory)146. Certamente Swadesh ha concesso che le vocalizzazioni istintive dei primi ominidi possano essere denominati “una lingua specifica della specie” (a species-specific “language”) ma ha anche congetturato che non appena dei segni arbitrari -cioè parole reali e strutture linguistiche complesse- sono entrate nel repertorio umano, il risultato istantaneo è stato la differenziazione (He certainly conceded that the instinctive vocalizations of early humanoids may be called a species-specific “language”, but he also surmised that as soon as arbitrary signs -i.e. true words and complex linguistic structures--entered the human repertoire, diversification was the instant result). Queste idee furono il fulcro della sua opera principale, “The Origin and Diversification of Language”, “L'origine e differenziazione della lingua”, ma egli morì prima che potesse completarlo. Le sue discussioni sono rimaste così in qualche modo imprecise, cosicché possono spiegare il motivo per cui anche le affermazioni più documentate e accurate di Swadesh tendono a essere oscurate e sottovalutate. 146 Ruhlen 1994b, p.215. 72 3.a.4. Sviluppi successivi strumenti, limiti della Lexicostatistics: metodi, Dopo Swadesh, la Lexicostatistics è stata usata come un metodo della linguistica comparativa che coinvolge il confronto quantitativo di parenti lessicali (lexical cognates). L’esponente principale dell'applicazione di metodi lessicostatistici è stato Isidore Dyen147, per classificare le lingue Austronesiane così come quelle Indoeuropee. Altri studi inoltre sono stati effettuati sull’Amerindio e sulle lingue Africane. Il metodo della recente Lexicostatistics148 è una tecnica semplice e veloce vicina al metodo comparativo ma con delle differenze. Innanzitutto, il termine “Lexicostatistics" è ingannevole poiché in essa vengono normalmente usate equazioni matematiche (mathematical equations) non statistiche (but not statistics) e inoltre non sottopone ad analisi solo il lessico di una lingua, ma anche altri elementi grammaticali (verbi, avverbi, preposizioni). Inoltre, è collegata al metodo comparativo, ma non ricostruisce una protolingua, perlomeno non è questo il suo obiettivo. Si è andata sempre più distinguendo dalla glottochronology, che tenta di usare i metodi lessicostatistici (use lexicostatistical methods) per valutare lo spazio di tempo entro il quale due o più lingue si sono diversificate da una comune precedente protolingua (which attempts to estimate the length of time since two or more languages diverged from a common earlier proto-language). Tuttavia, questa è solo una delle applicazioni della lexicostatistics; altre applicazioni di questa possono non condividere il presupposto di un tasso di cambiamento costante per le unità lessicali di base (lexical items). Inoltre, considerando che il metodo comparativo usa identificate e condivise innovazioni per determinare i sottogruppi, la lexicostatistics non identifica tali innovazioni, ma piuttosto si concentra sulla persistenza, sulla conservazione, ed è un metodo basato sulla distanza (a distance based method). I risultati della Lexicostatistics possono essere convalidati facendo una contro-verifica degli alberi prodotti con entrambi i metodi (by cross-checking the trees produced by both methods). Queste le fasi attualmente seguite per un’indagine lessicostatistica: - Generare una lista di parole (word list): Lo scopo è di compilare una lista di significati universalmente usati (mano, bocca, cielo, io). Le parole sono quindi raccolte per queste classi di significato per ogni lingua considerata. Solitamente si usa la lista di Swadesh di 100 parole, per evitare di considerare i prestiti. 147 Dyen et alii 1992. Per una rassegna sulla Lexicostatistics vd. Hymes 1960; Dyen 1962 ed Embleton 1986. più recentemente Holman-Brown 2008b e Holman-Brown et alii 2009, pp. 167-179. 148 73 - Determinare le parentele (determine cognacies): Le scelte di parentela devono essere fatte da un linguista affermato e con esperienza. Tuttavia, le decisioni possono avere bisogno di essere ridefinito man mano che lo stato delle conoscenze evolve. Tuttavia, la lexicostatistics non conta sul fatto che tutte le decisioni siano corrette. Per ogni coppia di liste la comune origine di una forma potrebbe essere positiva, negativa o indeterminata. A volte una lingua ha due parole per un significato, per esempio in inglese: small e little per not big (“piccolo” e “poco” per “non grande”): in tal caso si parla di sinonimi semantici, degni di essere presi in considerazione. - Calcolare le percentuali lessicostatistiche: Questa percentuale è collegata con la proporzione di significati per una particolare coppia di lingue imparentate. Questo valore è inserito in una tabella di distanza NxN, dove N è il numero delle lingue che sono confrontate. Una volta completata, questa tabella è riempita a metà in forma triangolare (When complete this table is half-filled in triangular form). Più alta è la proporzione di parentela più vicina è la parentela tra le lingue (The higher the proportion of cognacy the closer the languages are related). - Generare l’albero di famiglia: La creazione dell'albero linguistico è basata sulla tabella precedentemente individuata. Vari metodi di sottoraggruppamento possono essere usati, ma quello adottato da Dyen, da Krustal e Black149 è: - tutte le liste sono disposte in un unico insieme; - i due membri più vicini sono rimossi e formano un nucleo che è disposto nello stesso gruppo d’origine; - si ripete questo punto per tutte le lingue interessate; - in determinate circostanze un nucleo si trasforma in un gruppo; - ciò è ripetuto fino a che l’insieme non contenga soltanto un gruppo. I calcoli devono essere costituiti dalle percentuali del lessico del gruppo e del nucleo. - Limiti: Hoijer150 aveva già mostrato che ci sono difficoltà nell'individuazione degli equivalenti di significato tra le varie lingue, e molti hanno ritenuto necessario modificare le liste di Swadesh, come si è visto nelle sue varie edizioni. Gudschinsky151 si è chiesto se sia possibile ottenere una lista universale. Fattori quali i prestiti, la tradizione e i tabù (borrowing, tradition and taboo) possono deviare i risultati, come con altri metodi. Ad ogni modo la Lexicostatistics è usata secondo il principio della somiglianza lessicale per cui diventa un valido supporto alla “mass comparison”, purché si limiti la scelta di ampie aree di significato, che è troppo soggettiva, com’è la scelta dei sinonimi. Alcune delle moderne ipotesi di calcolo statistico in via di collaudo possono essere considerate come miglioramenti del metodo lessicostatistico152. Dyen et alii 1992. Hoijer 1956. 151 Gudschinsky 1956, pp. 175–210. 152 Holman-Brown 2008b e Holman-Brown et alii 2009, pp. 167-179. 149 150 74 3.a.5. Sviluppi strumenti, limiti. recenti della Glottochronology: metodi, Il metodo della Glottochronology153 è stato notevolmente perfezionato dai mezzi informatici, rispetto ai suoi primi risultati. - La lista di parole: Il metodo originale presumeva che il vocabolario centrale di una lingua fosse costituito da un costante (o quasi) tasso (rate) di differenziazione in tutte le lingue e culture, che potesse essere usato per misurare in modo uniforme il passaggio del tempo. Oggi il processo usa solo la lista di 100 termini lessicali di Swadesh, che per definizione si presuppone essere resistente, immune ai prestiti (assumed to be resistant against borrowing). Viene quindi misurata solo la percentuale dei cognates (parole che hanno un'origine comune) in queste liste di parole: più grande è la percentuale dei cognates, più recentemente le due lingue confrontate sono presunte essersi separate. Si ribadisce che questo vocabolario centrale (core vocabulary) è stato pensato per comprendere i concetti comuni a ogni lingua umana (quali i pronomi personali, parti del corpo, enti celesti, verbi delle azioni di base, numerali, ecc.), eliminando tutti i concetti che sono specifici di una determinata cultura o di un tempo particolare. Si può obiettare che questo ideale non sia possibile nella pratica e che l'insieme dei significati abbia bisogno di essere adeguato a ciascuna delle lingue da confrontare. - Costante glottocronologica: Robert Lees154 ha ottenuto un riconoscimento per aver individuato la cosiddetta "constante glottocronologica” delle parole, considerando i cambiamenti conosciuti in 13 coppie di lingue usando la lista di 200 parole. Ha ottenuto un valore di 0.806 ± 0.0176 con un’affidabilità del 90%. Per la lista di 100 parole, Swadesh aveva ottenuto un valore di 0.86, il più alto valore che riflette l'eliminazione delle parole semanticamente instabili (unstable). Questa costante può essere collegata al tasso di permanenza delle parole da: L = 2ln (r) dove L è il tasso di rimontaggio, ln è il logaritmo per basare la costante, e la r è la costante glottocronologia. - Tempo di divergenza: La formula di base della glottochronology è così calcolata: dove t è un periodo di tempo dato da una fase della lingua a un altro, c è uguale alla proporzione di elementi della lista mantenuti alla conclusione di quel periodo e L è il tasso di sostituzione per quella lista di parola. Provando storicamente i casi verificabili dove abbiamo conoscenza di t attraverso dati non-linguistici (per esempio la distanza approssimativa fra 153 Lees 1953, pp. 113–127; Gudschinsky 1956, pp. 175–210; Bergsland-Vogt 1962, pp. 115– 153; Embledon 1992, p. 131. Lohr 2000, pp. 209-223. 154 Lees 1953, pp. 113–127. 75 Latino classico e le lingue Romance moderne), già Swadesh era arrivato al valore empirico di circa 0.14 per L (significando che il tasso di sostituzione costituisce circa 14 parole dalla lista di 100 parole al millennio). - Risultati: La Glottochronology è stata progettata per funzionare nel caso dell’Indoeuropeo, rappresentando l’87% della varianza. Inoltre si presuppone che funzioni con l’Hamito-Semitico, il Cinese e l’Amerindio. Per questi ultimi, le correlazioni sono state ottenute con gli stessi procedimenti usati nella datazione al radiocarbonio o per valutare i gruppi sanguigni così come per l'archeologia. Il presupposto di un tasso di sostituzione di una sola parola (a single-word replacement rate) può distorcere la stima di divergenza del tempo quando sono incluse le parole prese in prestito. - Discussione: La domanda di base cui la Glottochronology cerca di dare una risposta è: “Perché i linguisti non fanno datazioni?" ("Why linguists don't do dates?"). Nonostante la legittimità della domanda, linguisti come Embleton155 e McMahon156 si concentrano sulle sue istanze di esattezza del modello, come spiegato in Bergsland e Vogt157, e la validità dei suoi assunti di base, cioè il concetto di cambiamento linguistico, com’è esaminato in Hymes158; Chrétien159 ha preteso di confutare la matematica del modello di Swadesh, anche se ad un congresso a Yale nel 1971 le sue critiche sono state ritenute non valide. Una descrizione delle discussioni recenti può essere ottenuta dalle carte di un congresso tenuto all'istituto McDonald nel 2000160. Si noti che l’approccio di Gray e di Atkinson161, che prevede il concetto di “language-tree divergence times”, per loro stessa ammissione, non ha niente a che fare con la glottochronology. Ad ogni modo, la Glottochronology continua ad essere rifiutata da molti Indoeuropeisti della scuola del metodo comparativo tradizionale soprattutto intorno a due punti di discussione: - il concetto di più alta stabilità dei lessemi delle liste di Swadesh162; - il presupposto secondo il quale la lingua cambia secondo un tasso stabile (at a stable rate). Bergsland-Vogt163 presentano una dimostrazione significativa, in base ai dati reali di lingua verificabili da fonti extralinguistiche, che il "tasso di cambiamento" per l’islandese si è costituito intorno al 4% al millennio, Embleton 1986. McMahon- McMahon 2005, p. 95. 157 Bergsland-Voigt 1962. 158 Hymes 1960; Wittmann 1969, pp.1-10. 159 Chretien 1962, pp. 11–37. 160 Renfrew 2000 e 2003. Vd. anche McMahon 1994. 161 Gray-Atkinson 2003. 162 Sankoff 1970. 163 Bergsland-Vogt 1962, pp.115sg. 155 156 76 mentre per quelle strettamente connesse al Riksmal (il norvegese letterario) ammonterebbe fino al 20% (il “tasso costante” proposto da Swadesh è stato supposto essere intorno al 14% al millennio). Questo e molti altri esempi simili hanno dimostrato efficacemente che la formula di Swadesh non lavorerebbe su tutto il materiale disponibile –una seria accusa considerando che la prova che può essere usata per "calibrare" il significato di L (cioè la storia della lingua registrata durante prolungati periodi di tempo) non è così pesantemente ampia. È possibile che la probabilità di sostituzione sia in effetti differente per ogni parola o caratteristica ("ogni parola ha la sua propria storia" ("each word has its own history") fra centinaia di altre fonti. Altro punto di discussione è il fatto che il cambiamento linguistico risulta dagli eventi socio-storici che sono naturalmente imprevedibili e, pertanto, incomputabili. Nuovi metodi messi a punto da Grey-Atkinson164 evitano queste istanze, ma sono ancora viste come controverse, soprattutto poiché sostengono l'origine Anatolica dei popoli indoeuropei165 piuttosto che l'ipotesi più popolare dell’origine Kurganica166. In qualche punto, fra il pensiero originario di Swadesh e il rifiuto della Glottochronology nella sua totalità si trova l'idea che questa come metodo formale di analisi linguistica diventa valido con l'aiuto di parecchie modifiche importanti. Ad esempio Dyen167 ha permesso che ogni significato della lista, spezzato in classi, avesse un proprio tasso di differenziazione. Egli ha studiato anche la valutazione simultanea della divergenza di tempo e del tasso di sostituzione. Sankoff168 ha suggerito di introdurre un parametro di prestito ed ha permesso la possibilità di prendere in considerazione i sinonimi. I miglioramenti nella metodologia statistica si sono riferiti a un ramo completamente diverso della scienza, la biologia, -sui cambiamenti nel DNA col passare del tempo – ed hanno suscitato un rinnovato recente interesse. Un altro tentativo di introdurre tali modifiche è stato compiuto dal linguista russo Starostin169, il quale ha posto l’attenzione sul fatto che i loanwords (calchi) sistematici, presi in prestito da una lingua all'altra, sono un fattore disgregativo e devono essere eliminati dai calcoli (systematic loanwords, borrowed from one language into another, are a disruptive factor and have to be eliminated Gray-Atkinson 2003. Renfrew 1987 e 2003. Haak et al. 2005, sostengono un antenato Paleolitico per i moderni Europei". Balaresque et al. 2010 hanno proposto un’origine Anatolica per il predominante DNA maschile, aplogruppo in Europa, conosciuto come R1b (Y-DNA). Vd. anche la teoria della continuità di Alinei 1996-2000. 166 Krell 1998 sulle ipotesi di Gimbuta. 167 Dyen et alii 1967 168 Sankov 1970. 169 Starostin 2002. 164 165 77 from the calculations); la cosa che realmente importa è la sostituzione nativa (“native replacement") degli elementi lessicali da elementi della stessa lingua. Starostin sostiene inoltre che il tasso di cambiamento non è realmente costante, ma in realtà dipende dal periodo di tempo durante il quale la parola è esistita nella lingua (cioè le probabilità che il lessema X sia sostituito tramite l'aumento del lessema Y in proporzione diretta al tempo trascorso), il cosiddetto “invecchiamento delle parole”, empiricamente capito come "erosione” graduale del significato primario nell'ambito del peso di quei significati secondari acquistati (the rate of change is not really constant, but actually depends on the time period during which the word has existed in the language (i. e. chances of lexeme X being replaced by lexeme Y increase in direct proportion to the time elapsed – the so called "aging of words", empirically understood as gradual "erosion" of the word's primary meaning under the weight of acquired secondary ones). Starostin indica inoltre che gli elementi individuali (monosillabici) nella lista di 100 parole di Swadesh hanno differenti tassi di stabilità: per esempio, la parola “I” (Io) ha generalmente una probabilità molto più bassa di essere sostituita rispetto alla parola “yellow" (individual items on the 100 wordlist have different stability rates (for instance, the word "I" generally has a much lower chance of being replaced than the word "yellow", etc.). La formula considerata da Starostin, considerando sia la dipendenza di tempo sia i quozienti di stabilità individuale, appare la seguente: In questa formula, −Lc riflette il rallentamento graduale del processo di sostituzione dovuto ai diversi tassi individuali (gli elementi meno stabili sono i primi e i più rapidi a essere sostituiti), mentre la radice quadrata rappresenta la tendenza d'inversione - accelerazione della sostituzione come elementi nella lista originale “age" ed è diventato più incline allo spostamento di significato. La formula è ovviamente più complicata di quella originale di Swadesh, ma, secondo le indicazioni di Starostin nella sua opera, porta risultati più credibili dei precedenti (e più o meno è d'accordo con tutti i casi della separazione del linguaggio che può essere confermata dalla conoscenza storica). D’altra parte, tale formula indica che la Glottochronology può essere usato realmente soltanto come strumento scientifico serio sulle famiglie linguistiche la cui fonologia storica è stata meticolosamente elaborata (almeno al punto di potere distinguere chiaramente fra cognates e loanwords).170 170 “In this formula, −Lc reflects the gradual slowing down of the replacement process due to different individual rates (the less stable elements are the first and the quickest to be replaced), whereas the square root represents the reverse trend – acceleration of replacement as items in the original wordlist "age" and become more prone to shifting their meaning. The formula is obviously more complicated than Swadesh's original one, but, as shown in Starostin's work, yields more credible results than the former (and more or less agrees with 78 Il problema della valutazione della profondità di tempo (time-depth estimation) 171 è stato l'argomento di base del congresso tenuto dall'istituto del McDonald nel 2000, e le carte pubblicate Renfrew, McMahon e Trask danno un'idea dei punti di vista sulla glottochronology a quel tempo, ponendo l’accento sul metodo di Starostin e sulla necessità da parte dei linguisti storici di fare datazioni. all the cases of language separation that can be confirmed by historical knowledge). On the other hand, it shows that glottochronology can really only be used as a serious scientific tool on language families the historical phonology of which has been meticulously elaborated (at least to the point of being able to clearly distinguish between cognates and loanwords”. 171 Kessler 2003, pp. 373-377, vd. Lohr, “New approaches to lexicostatistics and glottochronology”, In: C. Renfrew, A McMahon, L. Trask, Time Depth in Historical Linguistics, Vol. 1, cap. 10, pp. 209223, 2000. 79 3.b. Approccio quantitativo e probabilistico nella Linguistica storica 3.b.1. Un metodo probabilistico per individuare relazioni di parentela tra lingue (Baxter-Ramer). Baxter e Ramer172 hanno dato inizio ad una serie di studi che tentano di applicare istanze probabilistiche alla comparazione linguistica. I due studiosi sostengono che la portata temporale della linguistica storica può essere estesa significativamente in modo probabilistico, ma soltanto se tali istanze probabilistiche sono affrontate in modo accurato e capite in profondità. Il punto di partenza della loro riflessione è stato il tentativo di provare a “risolvere” un interrogativo suggerito quasi in modo provocatorio da Hock-Joseph173: “Se avessimo soltanto dati dall’Inglese moderno e Hindi moderno, senza altre prove evidenti da altre lingue indoeuropee, saremmo in grado di rilevare il rapporto genetico fra loro?” Se da una parte Hock-Joseph avevano espresso pessimismo sulla possibilità di una risposta affermativa, dall’altra Baxter-ramer hanno intuito che il problema apre la strada a una tecnica probabilistica ragionevolmente semplice e attuabile. I risultati ottenuti dai due studiosi incoraggiano proprio a pensare che il campo d’azione degli studi probabilistici potrà penetrare più in profondità nel passato linguistico e assegnare criteri di prevedibilità ai dati. Baxter-Ramer si sono infatti posti l’ulteriore domanda: “Quanto è plausibile la logica della profondità di tempo (the logic of linguistic time-depth) nella linguistica storica?” Essi ritengono che le profondità di tempo raggiungibili saranno sempre limitate in tutta la ricerca, ma il limite varia da una ricerca all’altra, secondo la disponibilità d’informazioni, l'intelligenza e la fortuna dei ricercatori. I limiti della raggiungibilità della profondità di tempo in linguistica sono analoghi a quelli nella ricerca genealogica sulla storia di famiglia. Poiché l’evidenza tende a deteriorarsi col passare del tempo, l’informazione sul passato è sempre incompleta e si arriva a un punto dove la ricerca non fornisce ulteriori risultati. Tuttavia il limite non è generale, a priori; è specifico alla situazione. L'unico modo di sapere se uno ha raggiunto questo limite è di scavare più in profondità e valutarne i risultati; non c'è motivo, ancora meno un dovere, di smettere di scavare, finché c’è una probabilità di avere fortuna. Se con S si indica una variabile delle situazioni di ricerca in linguistica comparativa, e con T una variabile dei momenti di tempo, la risposta si può parafrasare: (esiste un tempo T) come quello (per ogni situazione di ricerca); quindi nessuno studio in S può dare risultati attendibili riguardo ai tempi prima di 172 173 Baxter-Ramer 1999. Hock-Joseph 1996, pp.491–493. 80 T174 . Soltanto se si accetta questa formulazione, ha significato discutere il valore del limite T di tempo-profondità. Con questi presupposti, Baxter –Ramer vedono nella linguistica storica una crisi nel proprio “sistema immunitario”. Le tradizioni e le microculture accademiche della linguistica storica hanno sempre presentato, infatti, svariati ostacoli per lo sviluppo di metodi matematici statisticoprobabilistici adatti alle questioni linguistiche, soprattutto perché: - i tecnici linguistici prediligono il “metodo comparativo” classico, che, seppur decisamente utile, è stato fondato prima che fossero sviluppate moderne prove significative, pertanto ignorano o non trattano problemi probabilistici in modo adeguato; - i linguisti storici hanno generalmente poche competenze matematiche e sono male attrezzati, anche come gruppo, a sviluppare o valutare i metodi probabilistici; - il discorso della linguistica storica ancora riflette atteggiamenti induttivi e positivisti rispetto al metodo scientifico che è prevalso nel XIX e all’inizio del XX secolo (soprattutto nelle scienze sociali e del comportamento). Questi atteggiamenti implicano un'avversione alla creazione di nuove ipotesi e la diffusa credenza che una ricerca scientifica adeguata aumenti gradualmente il deposito di determinate conoscenze solo applicando regole fisse d’induzione alle osservazioni e ai risultati precedentemente provati. Del resto, da un punto di vista sociologico, ogni disciplina accademica ha bisogno di un modo per proteggersi da speculazioni “a briglia sciolta”: un modo di allontanare i suoi praticanti da ipotesi che sono probabilmente improduttive o soggette a polemica, e una spiegazione razionale per la prevenzione di lunghe discussioni con i dilettanti entusiastici ma non informati. D’altra parte non è difficile illustrare la difficoltà che i linguisti storici hanno, come gruppo, con le discussioni matematiche. Donald Ringe è lodato dai due studiosi per la percezione dell'importanza della probabilità e per averla affrontata personalmente, anche se non è stato in grado di applicarla in modo adeguato175. Tornando quindi al sopra citato problema suggerito in modo provocatorio da Hock-Joseph 1996 nel loro manuale di linguistica storica (“che cosa accadrebbe se provassimo a valutare il rapporto fra Inglese moderno e Hindi moderno, senza il beneficio di altra prova indoeuropea che indichi chiaramente che sono geneticamente imparentate”)176, la sua risoluzione da parte di Baxter-Ramer ha dato la possibilità di mostrare il 174 Baxter-Ramer 1999, p.2: “(There exists a time T) such that (for every research situation S), no investigation in S can give reliable results about times earlier than T. 175 Ringe 1998, pp. 186–187; Ringe 1995; Snell 1995. 176 Hock-Joseph 1996, pp.491–493. 81 potere dei metodi probabilistici nell'estrazione di modelli significativi da dati esigui ed incompleti. Avendo precisato che “le lingue chiaramente imparentate possono diventare con il passare del tempo così diverse che molti dei loro parenti genuini sono difficili o persino impossibili da riconoscere ("that ‘clearly related languages can come to be different enough that many of their genuine cognates are difficult or even impossible to recognize’), Hock-Joseph avevano aggiunto: “Fingendo di non sapere ancora che siano imparentate, proviamo a stabilire il loro rapporto tramite il confronto di vocabolario (trying to establish their relationship by vocabulary comparison), cosa che è in realtà più difficile di quanto sembri. È troppo facile essere influenzati dalla conoscenza che si ha del rapporto storico fra le due lingue per individuare i cognates genuini, o persino per sottovalutare gli effetti del cambiamento linguistico nella riconoscibilità dei veri cognates.177 L’approccio che Hock-Joseph scelgono di mettere in atto, quindi, è di cercare in modo empirico, nei dizionari Hindi e Inglese, possibili parole ereditate (cognates). Senza altra prova, è naturalmente difficile identificare i cognates genuini in questo modo. Molte parole ereditate hanno subìto cambiamenti di suono così consistenti che la loro parentela non è immediatamente evidente (ad esempio per “corno”, inglese ‘horn' [hòrn] e Hindi [sĩ:g]), mentre ci sono molte probabili chances di parole che già sappiamo essere indipendenti da altra prova (ad esempio per “tagliare”, inglese ‘cut' [kVt], Hindi [ka:[-na:]). Essi concludono che tra i matches (abbinamenti sinificante/significato tra due o più lingue) trovati da una tale ricerca di dizionario si potrebbero individuare veri cognates soltanto con una probabilità circa del 50%. Tale risultato incerto, come dicono, inducono a dubitare che un più distante rapporto, ad esempio fra Indoeuropeo e Uralico, potrebbe essere mai stabilito in modo convincente178. Il pessimismo di Hock-Joseph deriva in parte dalla loro mancanza di criteri chiari per il concetto di “dismalness”179 (“decadenza, quindi dissimilarità”). Si noti che realmente essi non provano a valutare la probabilità che le somiglianze trovate fra inglese e Hindi potrebbero essere dovute al caso. Riguardo alla domanda di quante prove sarebbero necessarie per costruire un caso convincente, ancora Hock-Joseph commentano: “Chiaramente, una corrispondenza non è abbastanza; né lo sono 20. E appena chiaramente, un migliaio di corrispondenze con ricorrenze sistematiche delle somiglianze e differenze fonetiche sarebbero ragionevolmente convincenti” (“And just as clearly, a thousand correspondences with systematic recurrences of phonetic similarities and differences Hock-Joseph 1996, p. 491. Hock-Joseph 1996, p. 493. 179 Baxter-Ramer 1999, p.5. 177 178 82 would be fairly persuasive “). Forse neanche 500 sono abbastanza, allora, e neppure 501. Nessuno può dare una risposta soddisfacente a queste domande. E questa è senza dubbio la ragione per cui i linguisti possono essere in disaccordo se una particolare relazione genetica proposta è sufficientemente attendibile oppure no”.180 Finché il linguista storico non è in grado di dare una risposta soddisfacente alle domande sul significato dei propri dati, ci sarà poco consenso su quali rapporti di distanza sono reali e quali immaginari. D’altra parte, se si riesce a sviluppare risposte attendibili a tali domande, allora la portata temporale della linguistica storica può essere davvero estesa in modo probabilistico. Ad esempio è intuitivo che ing. population sia un caso di convergenza recente, dovuto all’influenza della colonizzazione francese dopo il 1066, quando termini del lessico latino sono entrati nella lingua inglese accanto a quelli di origine germanica (numerosi sono infatti i doppioni semantici come lucky e fortunate); ma se si analizza il lat. vulgus e ing. folk oppure lat. collis e ing. hill si vede che sono chiaramente cognates (in virtù della legge di Grimm), non prestiti successivi riadattati; allo stesso modo gr. qugat»r, ing. daughter, ted. Tochter indicano un rapporto di distanza che non può essere classificato come convergenza. Il problema è: come individuare e discriminare in modo asettico la differenza tra tali casi in un’analisi di rapporti di distanza per definire la reale relazione genetica tra due o più lingue confrontate? Proprio sulla base di riflessioni, Baxter-Ramer181 propongono un metodo differente al problema del confronto Inglese-Hindi, per illustrare come le procedure probabilistiche possono invece realmente funzionare. Di fatto essi evidenziano chiaramente un recupero del metodo della mass o multilateral comparison di Greenberg, ma anche delle word-Lists di Swadesh. La procedura usa, infatti, liste di parole controllate (solo vocabolario basico immune ai prestiti) e test di verifica espliciti per l'identificazione di abbinamenti fonetici (the procedure uses controlled word lists and explicit criteria for identifying phonetic matches); il numero dei matches ottenuti quando le parole sono accoppiate dal significato è confrontato con il risultato ottenuto quando sono accoppiate sistematicamente a caso (the number of matches obtained when words are paired by meaning is compared with the result when they are systematically paired at random). L'ipotesi nulla da provare è che il risultato ottenuto quando si accoppiano le parole per significato non è significativamente più grande dei risultati ottenuti quando si accoppiano le parole a caso (The null hypothesis to be tested is that the score obtained when pairing words by meaning is not significantly greater than the scores obtained when pairing words at random). 180 181 Hock-Joseph 1996, ib.. Baxter-Ramer 1999, pp. 6sg. 83 Gli elementi di base della procedura sono quindi: 1. una lista predeterminata di significati di parole base da testare (a predetermined list of basic word meanings to be tested) e 2. un algoritmo esplicito per decidere quando contare un accoppiamento come match fonetico (an explicit algorithm for deciding when to count a pairing as a phonetic match). Le parole sono scelte da due lingue per abbinare l'insieme scelto dei significati di parole di base. Nel caso attuale è stata usata una lista di 33 parole, con pronunce Inglese e Hindi: 33-word list (Baxter-Ramer 1999, pp. 6-7) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 meaning English Hindi blood bone to die dog ear egg eye fire fish full to give hand horn I know louse moon name new one salt stone sun tail this thou tongue tooth two water what wind year [blVd] [boUn] [daI] [dòg] [Ir] [Eg] [aI] [faIKr] [fiS] [fUl] [gIv] [h<nd] [hòrn] [aI] [noU] [laUs] [mun] [neIm] [nju] [wVn] [sòlt] [stoUn] [sVn] [teIKl] [DIs] [ju] [tVN] [tu†] [tu] [‘watKr] [hwVt] [wInd] [jIr] [qhu:n] [ha;;i:] [mar-na:] [kutta:] [ka:n] [an;a:] [ã:kh] [a:g] [matShli:] [bhara:] [de –na:] [ha:th] [sĩ:g] [mãĩ] [ʤa:n –na:] [ʤũ:] [tSẫ:d] [na:m] [naja:] [e:k] [namak] [patthar] [su:raʤ] [pũ:tSh] [je] [tu:] [ʤi:bh] [dã:t] [do:] [pa:ni:] [kja:] [hava:] [sa:l] 84 Questa lista è adattata soprattutto da una lista di 35 significati di parole di base182. Si ribadisce che questa lista di parole è preferibile perché è appunto di base, quindi relativamente resistente al prestito (basic, thus relatively resistant to borrowing) e convenientemente breve; ogni lista simile andrebbe bene, finché non è influenzata in qualche modo per o contro l'ipotesi nulla (the null hypothesis). La procedura-algoritmo consiste nel contare il numero di matches fra le liste di Hindi e Inglese (The procedure is to count the number of matches between the English and Hindi lists), in primo luogo quando gli elementi della lista sono accoppiati per significato e poi (molte volte) quando sono accoppiati a caso. Questi risultati sono usati per valutare la probabilità che l'accoppiamento casuale potrebbe produrre altrettanti matches quanto quelli ottenuti accoppiando le parole per significato. La procedura consiste in un modello generale di un test significativo nelle statistiche deduttive (The procedure fits the general pattern of a significance test in inferential statistics): si verifica qui l'ipotesi nulla che i matches ottenuti quando si accoppiano le parole per significato non sono nient’altro che quello che ci si aspetta quando si accoppiano le parole a caso (we test the null hypothesis that the matches obtained when pairing words by meaning are no more than would be expected when pairing words at random). Ciò si ottiene mediante la misurazione di quanto sia estremo il numero osservato di matches, data la previsione dell'ipotesi nulla. E in più viene fissato il livello di importanza dei test di verifica per l’”estremità”: si rifiuterà l'ipotesi nulla se la probabilità P di ottenere il numero osservato di matches (o più) è meno di .05, o meno di una su 20. Nell'identificare i matches fonetici, è importante che si usino espliciti test di verifica che possono essere applicati meccanicamente (tramite un computer appunto). Per la prova attuale, è stato usato un algoritmo molto generale che coinvolge soltanto la somiglianza delle consonanti iniziali: le parole si abbinano se le loro consonanti iniziali appartengono alla stessa di 10 classi di consonanti definite da Dolgopolsky, elencate qui sotto183: Le 10 classi di Dolgopolsky type description 1 2 3 4 P T S K labial obstruents [p, b, f] dental obstruents (except hissing and hushing sibilants) [s, S, z, Z] velar and postvelar obstruents [k, g, x] and affricates such as [ts, Starostin 1991, pp. 59-60 (parole scelte da Yakhontov dalla lista di 100-parole di Swadesh). Dalla lista di Yakontov, si omette il significato di nose a causa della possibilità che il simbolismo fonetico potrebbe favorire le consonanti nasali. Inoltre, poiché `what`e “who” sono simili in molte lingue (inglese compreso), non dovrebbero essere considerate scelte indipendenti; si include quindi soltanto `what'. 183 Dolgopolsky 1964-1986, citato in Baxter-Ramer 1999, p. 8. 182 85 5 6 7 8 9 10 M N R W J Ø tS, dz, ʤ] [m] [n], [ø], and non initial [n] [r, l] [w] and initial [u] [j] laryngeals, zero consonant, and initial [n] L'intenzione del Dolgopolsky era di definire le classi in modo che le consonanti nella stessa classe, cambiano con maggior probabilità in un altro membro della stessa classe piuttosto che in una certa consonante di un’altra classe; questa classificazione è semplicemente un modo per definire una relazione molto approssimativa (ma esplicitamente definita) di somiglianza fonetica (phonetic similarity) che può avere attinenza storica. Per un’identificazione conveniente, ogni classe è identificata con una lettera maiuscola. Ciascuna delle 33 parole in Inglese e Hindi è assegnata a una delle 10 classi come qui sotto; matches dove le parole Hindi ed Inglesi rientrano nella stessa classe sono indicate in neretto: English and Hindi 33-word lists, with Dolgopolsky classes (matches in bold) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 meaning English Class Hindi Class blood bone to die dog ear egg eye fire fish full to give hand horn I know louse moon name new one salt stone [blVd] [boUn] [daI] [dòg] [Ir] [E Eg] [aII] [faIKr] [fiS] [fU Ul] [gIv] [h< <nd] [hòrn] [aI] [noU] [laUs] [mun] [neIIm] [nju] [wVn] [sòlt] [stoUn] P P T T Ø Ø Ø P P P K Ø Ø Ø N R M N N W S S [qhu:n] [ha;;i:] [mar-na:] [kutta:] [ka:n] [an; ;a:] [ã:kh] [a:g] [matShli:] [bhara:] [de –na:] [ha:th] [sĩ:g] [mãĩ] [ʤa:n –na:] [ʤũ:] [tSẫ:d] [na:m] [naja:] [e:k] [namak] [patthar] K Ø M K K Ø Ø Ø M P T Ø S M K K K N N Ø N P 86 23 24 25 26 27 28 29 30 31 32 33 sun tail this thou tongue tooth two water what wind year [sV Vn] [teIKl] [DIs] [ju] [tVN] [tu† †] [tu] [‘watKr] [hwVt] [wInd] [jIr] S T T J T T T W Ø W J S P J T K T T P K Ø S [su:raʤ] [pũ:tSh] [je] [tu:] [ʤi:bh] [dã:t] [do:] [pa:ni:] [kja:] [hava:] [sa:l] (Baxter-Ramer 1999, p. 8, tab.7). Quando queste parole hindi ed inglesi sono accoppiate tramite il significato, questo algoritmo definisce i seguenti 9 accoppiamenti come matches fonetici, poiché in ogni caso le loro consonanti iniziali appartengono alla stessa classe di Dolgopolsky: English-Hindi matches from the 33-word lists 6 7 10 12 18 19 23 28 29 meaning English CLASS Hindi CLASS egg eye full hand name new sun tooth two [Eg] [aI] [fUl] [h<nd] [neIm [nju] [sVn] [tu†] [tu] Ø Ø P Ø N N S T T [an;a:] [ã:kh] [bhara:] [ha:th] [na:m] [naja:] [su:raʤ] [dã:t] [do:] Ø Ø P Ø N N S T T (Baxter-Ramer 1999, p. 9 tab.8). Questa procedura di corrispondenza (matching algorithm) è piuttosto grezza, approssimativa, naturalmente, e, come la ricerca di dizionario di HockJoseph 1996, non è molto valida per identificare i cognates reali. Dei 9 matches qui sopra, soltanto sei -‘egg’, ‘name’, ‘new’, ‘sun’, ‘tooth’, and ‘two’- sono realmente imparentati etimologicamente. Inoltre, la procedura è troppo approssimativa per identificare tali veri cognates nella lista come “horn” (Inglese [hòrn], Hindi [sĩ:g], entrambi dalla radice IE *kjer-) e “know” (inglese [noU], Hindi [ʤa:n–na:], entrambi da indoeuropeo *gjenh3-). Ad ogni modo, il passo successivo in questa procedura è di valutare la probabilità che un tale risultato (9 o più matches su 33 possibili) potrebbe essersi verificato per caso. Per fare questo, è necessario conoscere la 87 probabilità di ciascuno dei risultati possibili quando gli elementi della lista sono accoppiati a caso (random). E’ difficile calcolare direttamente queste probabilità, ma è facile (e intuitivamente diretto) valutarle usando una simulazione su computer: programmando un computer per far girare i trials ripetuti (to run repeated trials) in cui le parole delle liste di Hindi e Inglese sono accoppiate a caso (random), piuttosto che per significato (by meaning), e contando, per ognuno di questi accoppiamenti casuali, il numero dei matches fonetici fra le parole accoppiate, si può applicare lo stesso algoritmo usato quando sono state accoppiate per significato. Se si effettuano molte prove e si lascia traccia del risultato per ogni prova, è possibile vedere quanto spesso otteniamo 9 (o più) matches. La frequenza con cui questa accade, in un campione di 1000 prove, è una stima della probabilità che 9 (o più) matches si verificherebbero per puro caso (by chance). Tale simulazione è stata realizzata usando lo scripting HyperTalk, parte del pacchetto di programmi di HyperCard per Apple Macintosh. Lo scripting ha restituito mille trials. Si noti che la colonna delle classi dell’inglese hanno le stesse lettere, nello stesso ordine, come nella tab.7; la colonna di classe dell’Hindi ha le stesse lettere di quelle presenti nella stessa tab.7, ma in ordine mescolato. Se la lettera i-th nella colonna inglese è la stessa lettera i-th nella colonna Hindi, quella viene contata come match. In questa simulazione particolare si sono individuati quattro matches: gli elementi 8, 14, 19 e 22. A typical random English-Hindi pairing (matches in bold) meaning 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 blood bone to die dog ear egg eye fire fish full to give hand horn I know louse moon name new English Class P P T T Ø Ø Ø P P P K Ø Ø Ø N R M N N Hindi Class K Ø M K K Ø Ø Ø M P T Ø S M K K K N N Match? false false false false false false false true false false false false false true false false false false true 88 20 21 22 23 24 25 26 27 28 29 30 31 32 33 one salt stone sun tail this thou tongue tooth two water what wind year W S S S T T J T T T W Ø W J Ø N P S P J T K T T P K Ø S false false true false false false false false false false false false false false (Baxter-Ramer 1999, p. 11, tab.9). Sono state effettuate mille prove di questo genere; i risultati sono ricapitolati nella tab. 10 di seguito: Results of 1000 trials, pairing the English and Hindi lists at random 15 59 124 197 255 187 89 42 trials with trials with trials with trials with trials with trials with trials with trials with 0 1 2 3 4 5 6 7 matches match matches matches matches matches matches matches 21 trials with 8 matches 8 3 trials with trials with 9 10 matches matches 0 0 1000 trials with trials with trials in all 11 12 matches matches Above the line: Trials with scores of less than 9 matches (989 trials of 1000) Below the line: Trials with scores of 9 or more matches (1 trials of 1000) (Baxter-Ramer 1999, p. 12, tab.10). Si ricorda che si sono ottenuti 9 matches quando le parole sono state accoppiate secondo il significato; questo risultato è stato uguagliato o oltrepassato a 11 su 1000 prove (8 trials con 9 matches, 3 trials con 10 matches). E’ quindi possibile usare questo risultato per valutare la probabilità che 9 o 89 più matches si presenterebbero per caso (random) in questa situazione: la probabilità è di circa 11/1000, o .011. Si deve quindi rifiutare l'ipotesi nulla (the null hypothesis), cioè che i matches osservati fra Inglese e Hindi potrebbero essere il risultato di un puro caso. Questi risultati concordano con l'analisi di tali esperimenti dati in Justeson-Stephens (1980). Le probabilità previste sono difficili da calcolare direttamente, ma può essere indicato che si avvicinano molto strettamente alla funzione : P [k] = e -r/n (r/n) k k! Questa funzione è un esempio di Poisson density function, utilizzata nella teoria delle probabilità per predire il risultato di vari processi, compreso il numero degli atomi radioattivi che decadranno all'interno di determinato intervallo di tempo, o il numero delle telefonate che entreranno in scambio in un determinato spazio di tempo184. In questo caso, P [K] è la probabilità che una prova casuale particolare produrrà un risultato di K marche; n è il numero delle parole sulla lista (33 nel nostro caso); r è il numero totale di accoppiamenti possibili che il match-recognition algorithm identificherà come matches (in questo caso, 128); ed e è la base dei logaritmi naturali. La densità di Poisson è descritta in termini di un singolo parametro ‘λ’: P [k] = e - λ λk k! In questo caso, ‘λ’ è il rapporto r/n, o 128/33. Si può pensare a questo rapporto come misura della perdita dell’algoritmo match-recognition: maggiore è il valore di λ, più alta è la probabilità che le parole si abbineranno una volta accoppiate a caso. Il valore di questa funzione, con λ= 128/33, è illustrata nella seguente tabella: Probability of K matches in a single trial (Poisson approximation, λ = 128/33) K 0 1 2 3 4 5 6 7 184 P [k = K] 0.020676 0.080197 0.155534 0.201095 0.195001 0.151273 0.097793 0.054188 P [k ≤ K] 0.020676 0.100873 0.256407 0.457502 0.652503 0.803777 0.901569 0.955758 Hoel-Port-Stone 1971, pp. 56–57. Above the line: outcomes where k < 9: 90 8 9 10 11 12 0.026273 0.982031 0.011323 0.993354 0.004392 0.997746 0.001549 0.999295 0.000501 0.999795 … …. ….. (Baxter-Ramer 1999, p.13, tab.13). P [k < 9] = .982 Below the line: outcomes where k ≥ 9: (1 trials of 1000) P [k ≥ 9] = 1 – .982 = .018 Nel grafico della fig. 1, vengono quindi visualizzati i risultati dalle 1000 prove casuali e confrontati con i risultati predetti dall'approssimazione di Poisson185. Risultati della comparazione Inglese-Hindi: accoppiamento tra significati comparati con 1000 random pairings (Baxter-Ramer 1999, p.14, fig. 1). Il grafico indica di nuovo che si deve rifiutare l'ipotesi nulla: cioè dovremmo concludere che il risultato osservato non è il risultato della Baxter-Ramer 1999, p.14 (fig.1). “The vertical bars indicate the actual frequency of each score in the 1000 random; the black squares (connected by a line) indicate the expected values according to the Poisson approximation. The ‘observed result’ of nine matches is the number of matches obtained when the lists were paired by meaning; a vertical line through the graph separates the outcomes which are as ‘extreme’ as this observed value (the right side of the graph, sometimes called the ‘tail’) from those that are less extreme (the left side)”. 185 91 casualità (we should reject the null hypothesis: that is, we should conclude that the observed score is not the result of chance). Il risultato è importante. Tale simulazione ha coinvolto soltanto 33 elementi di prova da ogni lingua e sono state utilizzate solo informazioni generali sulla consonante iniziale dei singoli items. Non sono state individuate le corrispondenze fonologiche reali fra Inglese e Hindi, ancor meno ricostruito il loro antenato comune (benché alcune corrispondenze valide comincino a emergere anche in questo piccolo campione, compreso inglese [t] ↔ , Hindi [d], [n] ↔ [n], [m.] ↔ [m.]). Tuttavia sulla base di questa prova da sola, sembra che si possa offrire la probabilità che le due lingue sono geneticamente imparentate. Com’è emerso questo risultato? È probabile che siano le poche, relativamente ben conservate, forme imparentate come tooth, new, name, e two del campione utilizzato, che forniscono questo risultato (tale evidenza sembra ricordare il principio fondamentale della geometria euclidea è: “Per un punto passano infinite rette, ma tra due punti qualsiasi è possibile tracciare una e una sola retta!”, cioè “bastano due soli punti per individuare un’unica retta”). Se è vero che i cambiamenti di suono a volte rendono irriconoscibili i veri cognates e il caso può generare similarità ingannevoli, è anche vero che non è sempre così e in questo caso sono emersi elementi sufficienti per fornire un risultato statisticamente espressivo, quando i dati sono trattati con la dovuta attenzione. In conclusione: da questa simulazione di Baxter-Ramer è possibile inferire che, usando attente procedure statistiche per trarre il massimo delle informazioni da pochi dati in nostro possesso, può essere possibile identificare anche remoti rapporti linguistici che finora non sono ampiamente accettati. Anche nei casi in cui i dati possono essere anche imprecisi per dettagliate analisi etimologiche, ciò che si deduce è che, unito ai risultati di altre discipline, il metodo probabilistico può contribuire a rispondere alle domande importanti sulla preistoria linguistica. 92 3.b.2. Corrispondenze fonetiche cambiamento linguistico (Huff). totali automatizzate e Paul Huff186 osserva che l'uso dei metodi statistici da parte della linguistica storica con l’intento di fornire una prospettiva matematica non solo allo studio della parentela genetica ma soprattutto allo studio del cambiamento linguistico, potrebbe essere un utile supporto al modello dei rapporti di lingua già stabiliti con il metodo storico comparativo, come anche l’indoeuropeista Watkins187 aveva suggerito. Mentre i linguisti hanno tentato di distanziare il campo dall'uso di metodi statistici ritenuti ancora “difettosi” o meglio in via di perfezionamento, come la Glottochronology, i biologi e i matematici nel frattempo hanno messo a punto metodi statistici e computazionali che sono abbastanza validi per rispondere alle domande specifiche su come le specie sono collegate l’una con l’altra e su quali siano gli specifici di quei rapporti (compreso il modello di datazione delle separazioni fra le specie e il modello dei loro rapporti dell'albero di famiglia). Questi metodi, e le domande cui rispondono, hanno chiari paralleli nella linguistica e recentemente un certo numero di linguisti ha cominciato a studiarli, generando, come si è già detto, una crescente rinascita dell’interesse per la lessicostatistica e arricchendo la ricerca linguistica già affermata dei nuovi dati che possono aiutare a rivedere la configurazione della storia delle lingue. In particolare, la ricerca lessicostatistica ha dimostrato in modo abbastanza fruttuoso che lo stesso tipo di ricerche si sta sviluppando in modo indipendente ma con risultati simili. Due di questi gruppi, McMahon-McMahon 2005 e il Progetto di Giudizio Automatizzato di Somiglianza (the Automated Similarity Judgment Project, cioè il software ASJP) implementato da Holman-Brown ed altri188, hanno infatti implementato separatamente un metodo quasi identico. Entrambi i progetti essenzialmente usano la stessa metodologia di calcolo per studiare le correlazioni fra le lingue (per capire come cambiano e come sono geneticamente interrelate). In primo luogo, entrambi ottengono, fra un gruppo di lingue, misure di distanza a due a due (pair-wise distance measurements). Avendo generato misure di somiglianza per ogni coppia di lingue nel gruppo in questione, generano una tabella di distanza di tutte le lingue in questione (vedi Tab.1). Huff 2009, pp.1-17. Watkins 1970, p.101. 188 McMahon-McMahon 2005; Holman et alii 2007; Holman-Brown et alii 2008a; HolmanBrown et alii 2008 b; Holman -Brown et alii 2009; Holman-Brown et alii 2010; Holman-Brown et alii 2011; Holman -Wichmann (web) in via di stampa e in pre-pubblicazione su web. 186 187 93 Language 1 Language 2 Language 3 Language 1 x Language 2 5 x Language 3 2 3 x Tab. 1 (Huff 2009, p. 8): Una tabella di distanza (matrix) di esempio, che mostra i giudizi di parentela fra 3 lingue come potrebbero essere usato da McMahon-McMahon 2005 o nel progetto di ASJP. La somiglianza fra la lingua 3 e la lingua 1 è 2. Soltanto la metà della matrice deve essere computata, poiché le due metà sono immagini specchio dell’altra. Questo salva il tempo di calcolo. Dopo che la tabella è stata generata, i vari metodi statistici sono usati per computare gli alberi e le reti basati sulle informazioni nella tabella. La differenza fra i metodi di McMahonMcMahon e di ASJP ed il metodo che Huff propone è nella generazione del numero che rappresenta la somiglianza di due lingue. Entrambi i progetti di ricerca (ASJP e quello intrapreso dai McMahon) usano il software bioinformatico già implementato (off-the-shelf bioinformatic software) per percorrere la precedente tabella di distanza e per generare strutture ad albero189. La differenza chiave fra i due progetti sembra essere nel metodo di determinazione di distanza pair-wise fra le lingue. Per computare la distanza fra due lingue, McMahon-McMahon 2005 usano un database di dati costruito da Dyen, Kruskal e Black che raccoglie l’insieme delle liste di Swadesh che sono state compilate per le lingue indoeuropee190. Per ogni coppia di lingue nel database, un numero di distanza fra le coppie di lingue è generato in base alla percentuale di parole che sono imparentate nelle due liste. Il giudizio di parentela di due unità lessicali è predeterminata a mano in base ai giudizi dei linguisti storici e inseriti nella base di dati191. McMahon-McMahon raffinano ulteriormente gli items in questione usando un insieme di test di verifica, dei criteri per determinare quale unità lessicale è meno probabile che sia stata presa in prestito attraverso il contatto e generano quindi due sottoliste, una delle quali è altamente probabile che sia soggetta a prestito e quindi meno stabile a lungo termine, l'altra è improbabile che sia soggetta a prestito e quindi più stabile a lungo termine. Quindi essi ricalcolano le tabelle di distanza basate soltanto su quelle sottoliste dai database di Dyen, da Kruskal e Black, che sono stabili ed usano le strutture ad albero risultanti per raffinare i loro alberi automaticamente generati192. Il progetto ASJP adotta invece un metodo differente a proposito della generazione della tabella di distanza. Dopo aver raccolto le liste di Swadesh 189 McMahon-McMahon 190 2005 pp.89-118, Holman-Brown et alii 2008a. McMahon e McMahon 2005, p. 96. 191 McMahon e McMahon 2005, pp. 97-98. 192 McMahon e McMahon 2005, pp. 107-109 94 in quasi 2000 lingue di tutto il mondo, ha creato un algoritmo che permette di generare gli alberi per queste lingue usando un processo automatizzato per generare le matrici193 . Per ogni insieme di due lingue nell'intero insieme delle lingue disponibili, i singoli articoli della lista di Swadesh sono comparati usando il seguente processo di valutazione di similarità: due parole con lo stesso significato sono giudicate come simili se due consonanti consecutive sono identiche fra le due parole, anche se ci sono vocali fra loro194. La percentuale di parole che sono simili fra una coppia linguistica è usata come punto di partenza per il calcolo del valore di distanza della coppia linguistica. Il prestito e gli inventari di fonemi casualmente simili allora sono controllati sottraendo la percentuale di parole che non hanno lo stesso significato ma sono giudicati come simili dal programma in base alla percentuale originale195. Il numero finale è sottratto dal 100% e con questa percentuale, il software ASJP ottiene una distanza per ogni coppia di lingue nel loro database196. Una volta che hanno ottenuto le tabelle di distanza per un insieme di lingue, sia McMahon sia il progetto di ASJP usano allora simili tecniche dalla biologia computazionale per generare gli alberi filogenetici. McMahon tenta una varietà di metodi di costruzione dell’albero e del network 197 -compreso il neighbor–joining (prossimità di parentela)-, mentre il progetto ASJP usa solo il principio di neighbor–joining per esaminare gli alberi generati dalle loro tabelle di distanza. La prossimità di parentela funziona selezionando in primo luogo coppie di lingue con la più piccola distanza come root node (nodo di radice) e poi, successivamente, ripetendo l'atto di individuazione della distanza più piccola fra le lingue per aggiungere rami all'albero198. Ci sono parecchi pacchetti di programmi pre-definiti che effettuano la prossimità di parentela sulle matrici di dati agnostici (data-agnostic distance matrices) ed entrambi i gruppi ne fanno ampio uso. McMahon usa il software per costruire strutture di rete (network building Software) - strutture simili a quelle ad albero create dalle tabelle di distanza che prendono in considerazione i punti in cui potrebbe essere meno statisticamente facile sviluppare un ramo di albero dicotomico (to build a dichotomous tree branch) 199. Tuttavia Huff osserva che un punto in cui entrambi modelli trattano piuttosto ingenuamente la distanza linguistica è fra le diverse unità lessicali200. 193 Holman-Brown et alii, 2008b, p. 3. Holman-Brown et alii, 2008b, p. 3. 195 Holman-Brown et alii, 2008b, pp. 3-4 196 Holman-Brown et alii, 2008b, p. 4 197 McMahon-McMahon 2005, pp.89-175 198 Paradis 2006, p. 100 199 McMahon-McMahon 2005, pp.139-175 200 Huff 2009, pp.10. 194 95 Ancora una volta, il metodo McMahon usa un modello binario o zero (a binary one or zero) per “modellare” se due lingue hanno una coppia di formasignificato imparentata per uno slot particolare, quando la decisione di parentela è stata fatta prima a mano dai linguisti storici 201. Il metodo di ASJP usa invece una metrica binaria (a binary metric) basata sul fatto che le prime due consonanti di una coppia di forma-significato siano o meno identiche fra parole di varie lingue. Secondo Huff202, entrambi i metodi dovrebbero perfezionarsi su un punto fondamentale: quello di prendere in considerazione tutto il materiale fonetico disponibile fra due coppie forma-significato e di computare una distanza metrica che è continua e non solo relativa ad un numero binario “sì o no” (binary “yes or no” number). Nel caso del metodo McMahon, questa nuova procedura rimuoverà la necessità di un giudizio umano di parentela, facendo in modo che il numero sia basato su informazioni conosciute (le stringhe fonetiche di ogni lingua), piuttosto che su una decisione potenzialmente soggettiva di parentela. Nel caso del metodo ASJP, l’uso di una distance metric basata su tutto il materiale fonetico in una stringa, piuttosto che solo sulle prime due consonanti, permetterà un modello più ricco basato su più punti di riferimento. Huff, da parte sua, propone quindi un metodo personale che mira ad usare tale distanza metrica automaticamente generata per determinare come le due stringhe fonetiche siano strettamente connesse per ogni slot semantico condiviso tra due lingue (an automatically generated distance metric to determine how closely related two phonetic strings are for any given semantic slot shared between languages) prendendo in considerazione tutto il materiale fonetico disponibile fra due coppie forma-significato 203. La distanza fra le lingue potrà allora essere derivata dalla distanza fonetica fra le singole stringhe nelle lingue in questione. Poiché la distanza metrica fonetica (phonetic distance metrics) è determinante per questo processo, è utile fare una rassegna di alcune metriche di distanza fonetica che sono state usate per simili scopi. Molte metriche di distanza fonetica sono state proposte nella letteratura. Brett Kessler204 dà una buona descrizione di alcune di queste metriche nel contesto della multilateral comparison di Greenberg. La prima metric di Kessler, C1-place, derivata da Kessler-Lehtonen205, punta al luogo della struttura di articolazione per la prima consonante delle due parole da confrontare (looks at the place of articulation feature for the first consonant of the two words being compared) e, basandosi su quanto lontano sono i 201 McMahon-McMahon 202 2005, pp. 96-98 Huff 2009, pp.11. 203 Huff 2009, pp. 10-11 204 Kessler 2007, pp. 5-6. 205 Kessler- Lehtonen 2006 96 punti di articolazione per le due consonanti, assegna un valore alla distanza fonetica delle due parole. La seconda metric che Kessler descrive è P1-Dolg, implementata da Baxter- Ramer206, e basata sul lavoro di Dolgopolsky207. Dolgopolsky ha diviso i fonemi in classi basate su due caratteristiche: luogo e modo di articolazione. La metric di distanza P1-Dolg punta al primo fonema delle due parole a confronto e se provengono dalla stessa classe di fonemi li considera equivalenti, altrimenti li considera non equivalenti208. Una specie di sintesi (cross-mixing) dei due metodi è stata studiata da Kessler in due ulteriori metrics, C1-Dolg e P1-place. Entrambe queste metrics funzionano similmente alle loro controparti precedentemente descritte; tuttavia, C1-Dolg usa le classi di consonanti di Dolgopolsky per determinare la distanza fra la prima consonante di ciascuna delle due parole in questione, anziché solo la caratteristica del luogo di articolazione e P1-place utilizza la caratteristica del luogo di articolazione con il primo fonema di ogni parola in questione, senza riguardo se sia una vocale o una consonante. P1-voice usa solo la caratteristica di voce (the voice feature) del primo fonema per assegnare un risultato di distanza alle due parole di lingue differenti, dando loro una distanza di 0 se la caratteristica di voce dei primi fonemi è la stessa e di 1 se sono differenti.209 La stringa C*-DolgSeq di Kessler tenta di sfruttare più materiale di quanto faccia solo la prima consonante di una parola per generare una distanza fra due parole. Allineando le consonanti delle due parole in questione e aggiungendovi poi il risultato di distanza delle due parole, se le due consonanti allineate non provengono dalla stessa classe di Dolgopolsky, si ottiene una specie di valore composito di distanza. Infine Kessler descrive C*-DolgCross, un tentativo di riparare alcuni dei problemi che sorgono in C*-DolgSeq: poiché dall'allineamento dalle consonanti fra due parole dove una delle parole è più breve dell'altra, si arriva a potenziali problemi di allineamento (per esempio, nel caso dell’epentesi, dove una consonante supplementare è inserita nella parola, o nel caso di albero in italiano e di arbol in spagnolo, che hanno le stesse vocali che sono state riordinate), il risultato di distanza di C*-DolgCross è computato confrontando la classe di Dolgoposky fra tutti gli accoppiamenti possibili di consonanti fra le due parole e facendone la media matematica210. Nessuna di queste distance metrics supera (outperforms) le altre che si trovano nei test dei contesti di multilateral comparison in cui Kessler li ha provati211. Ciò probabilmente non dovrebbe sorprendere, dato che nessuna 206 Baxter- Ramer 1999, pp.11sg. Dolgopolsky 1964, citato in Baxter- Ramer 1999, p.9. 208 Kessler 2007, p. 5. 209 Kessler 2007, p. 5. 210 Kessler 2007, pp. 5-6. 211 Kessler 2007, p. 8. 207 97 delle metrics usa più di due caratteristiche fonetiche, la maggior parte delle quali usa soltanto un fonema e dato che le soluzioni ai problemi che sorgono nelle istanze di allineamento che si presentano nelle multi-phoneme metrics (metrics con più di un fonema) sono relativamente ingenue. Nessuno di questi sembra essere una distance metric competitiva con le due proposte da McMahon e dal progetto ASJP. Grzegorz Kondrak212 fa un'indagine di un diverso insieme di algoritmi per determinare la distanza fonetica fra due parole che tengono in considerazione molti dei problemi incontrati dalle metrics che Kessler descrive. Il primo algoritmo per il calcolo della distanza fra due parole descritto da Kondrak era stata proposta da Covington. L’algoritmo di Covington raggruppa i fonemi in tre classi: consonanti, vocali e glides. Convington allora assegna una distanza a ciascuna delle possibili differenze nelle classi fra due fonemi (vedi Tab.2). Difference Penalty Identical consonants or glides Identical vowels Vowel length difference only Non-identical vowels Non-identical consonants No similarity 0 5 10 30 60 100 Tab. 2: Le penalità assegnate dal calcolo di distanza di Convigton alle classi varianti di differenze (Kondrak 2002, p. 3). Mentre i valori della caratteristica reale non sono presi in considerazione, il metodo fa veramente giudizi ragionevoli su quali differenze fra i fonemi dovrebbero essere viste per essere sbagliate. Covington stesso ha descritto il metodo come preliminare. Inoltre, eliminazioni ed inserzioni di fonemi fra le due parole da confrontare sono anche assegnati risultati di penalità (penalty scores) che si aggiungono alla misura generale di distanza per le due parole213. Kondrak descrive brevemente altre due metrics di distanza. Piuttosto che usare appena una singola caratteristica o una classe di fonema, entrambe queste distance metrics usano vettori binari per rappresentare le parole da confrontare. Una distanza metrica denominata la distanza di Hamming è utilizzata in entrambe queste metrics per penalizzare una sostituzione da un fonema a un altro, mentre gli inserimenti e le omissioni dei fonemi sono penalizzati piuttosto arbitrariamente da entrambi214. Contrariamente a questo tipo di metric, Kondrak propone infine una nuova procedura-algoritmo per la determinazione della somiglianza fra due stringhe Kondrak 2002, pp. 2-3. Kondrak 2002, p.2. 214 Kondrak 2002, p.2. 212 213 98 fonetiche, denominata ALINE. ALINE può operare in varie circostanze215 e funziona su vettori a valori multipli (multivalued feature vectors) che rappresentano le parole in questione; cioè, dove altri metodi usano feature values che sono on o off (inseriti o disinseriti), ALINE di Kondrak ha una frazione variante fra 0 e 1 per i valori multipli di ciascuna delle caratteristiche considerate. Inoltre, ALINE, piuttosto che computare la distanza fra due parole, computa le somiglianze delle parole (computes the words’ similarities), dando risultati più alti per le parole che sono più simili e risultati più bassi per le parole che sono meno simili (giving higher scores for words which are more similar and lower scores for words which are less similar)216. ALINE computa quindi la somiglianza (o similarità) di due parole esaminando tutte le possibili combinazioni di accoppiamento di fonema (phoneme pairings) fra le due parole e dando poi risultati positivi ai fonemi che sono simili e negativi ai fonemi che sono dissimili e risultati ancor più negativi per i casi in cui si è verificato un inserimento o una cancellazione di fonema (then giving larger positive scores to phonemes which are similar, and large negative scores to phonemes which are dissimilar and smaller negative scores to cases where an insert or delete has clearly occurred). Generando una tabella di segmenti similari (matrix of similar segments), un allineamento ottimale può allora essere ottenuto dai segmenti in questione, usando un procedura-algoritmo di programmazione dinamica (using a dynamic programming algorithm217). L’algoritmo di Kondrak è stato implementato per funzionare nell'ambito di vari tipi di lingua (Kondrak’s algorithm has been shown to work well under a variety of language types) e fra tutte le procedure discusse finora è l’unico che prende in considerazione tutto il materiale fonetico incapsulato in una parola usando caratteristiche a valori multipli (and of all the algorithms discussed so far is the only one that takes into consideration all of the phonetic material encapsulated in a word using multi-valued features)218. Poiché l’algoritmo di Kondrak per somiglianza fonetica (algorithm for phonetic similarity) sembra essere chiaramente il più robusto ed il più esatto, sembrerebbe essere un candidato eccellente per un balzo avanti nel determinare la percentuale di parentela condivisa fra due lingue (for slotting in the step of determining the percentage of cognates shared between two languages), cosa che sia McMahon 2005 sia il progetto ASJP stanno cercando di raggiungere come obiettivo precipuo. Nel caso di McMahon, l’uso di ALINE sostituisce il lavoro fatto manualmente dai linguisti, eliminando una certa soggettività nei risultati, e nel caso di ASJP, l’algoritmo è un miglioramento dell’euristica per la parentela 215 Kondrak 216 2002, pp. 60-64 Kondrak 2002, p.3. 217 Kondrak 2002, pp.3-4. 218 Kondrak 2002, pp. 60-64. 99 basata sulle “prime due consonanti” che è attualmente in uso (the algorithm is improvement over the “first two consonants” heuristic for cognancy that is currently in use), poiché il metric di somiglianza tiene in considerazione tutto il materiale fonetico negli accoppiamenti lessico-semantici, anziché di due soli fonemi per ciascuno (since the similarity metric takes into consideration all the phonetic material in the lexical-semantic pairs, instead of just two phonemes from each). Quindi, Huff propone di controllare per somiglianza accidentale fra l'inventario fonologico di due lingue (control for accidental similarity between the phonological inventory of two languages) semplicemente computando la somiglianza fonologica fra tutti gli accoppiamenti lessico-semantici che non si abbinano (by simply computing the phonological similarity between all of the lexicalsemantic pairs which don’t match)219, cioè comparando la somiglianza fonetica fra la parola per cane in una lingua e la parola per latte in un'altra (i.e. compare the phonetic similarity between the word for dog in one language with the word for milk in the other) e dividendo il risultato di somiglianza totale per le coppie di corrispondenza lessico-semantica per il valore di somiglianza accidentale (and dividing the total similarity score for the matching lexical-semantic pairs by the accidental similarity score). Una volta ottenuta una tabella di risultati di somiglianza (a matrix of similarity scores) fra le coppie di lingue, è possibile allora usare i metodi biologici per esaminare la tabella, come fanno McMahon e il progetto ASJP, e costruire alberi genetici per classificare le lingue come imparentate oppure no. Il grafico ad albero delle classificazioni può essere confrontato con alberi di famiglia conosciuti delle lingue indoeuropee e con gli alberi generati con altri metodi automatici, come quello di ASJP, per vedere se gli alberi generati funzionano come dovrebbero. In conclusione, usando l’algoritmo ALINE in questo modo, è possibile raffinare ulteriormente i modelli matematico-statistici del lessico automatizzati (the automated lexical statistical) del passato per aggiungere eventualmente nuove informazioni utili alla comprensione del rapporto fra le lingue, che, come anche l’indoeuropeista Calvert Watkins220 aveva auspicato, dovrebbero aiutarci a “scrivere meglio la storia linguistica delle lingue conosciute” e a fornire nuovi dati per contribuire a raffinare i modelli del passato. 219 220 Huff 2009, pp. 15-16. Watkins 1973, p. 101. 100 3.d. Esplorazioni nella Automated Lexicostatistics: The automated similarity judgment program (Holman-Brown) Un approccio combinato di tipologia, multilateral comparison e Automated Lexicostatistics, è quello implementato da un gruppo di studiosi informatici e linguisti guidati da Holman-Brown221, con l’appoggio del progetto AJSP (Automated Similarity Judgment Program), i quali stanno pubblicando sul web i graduali progressi raggiunti da parte della Linguistica Computazionale222. In particolare, a febbraio 2011, Holman-Brown223 hanno pubblicato in Internet i risultati di un programma automatizzato di giudizio di somiglianza (The automated similarity judgment program), con l’obiettivo precipuo di dare risposte a questioni sul mutamento linguistco e sulla parentela tra le lingue del mondo, e sul nesso tra linguistica sincronica e diacronica. Si tratta di un nuovo software di riconoscimento automatizzato delle corrispondenze di suono ed è applicato ad un set di dati consistente di liste di parole standardizzate per più della metà delle lingue del mondo (il database ASJP di Holman-Brown-Wichmann 2010). Appendici online presentano i risultati224, ovvero un compendio di 615 corrispondenze ricorrenti di suono, con la frequenza dell'occorrenza di ogni corrispondenza, i genera di lingua a cui appartengono le corrispondenze e le parole da cui sono estratti. La frequenza della corrispondenza è usata per misurare il grado di somiglianza-similarità fra suoni differenti, permettendo nuove classificazioni di consonanti e di vocali che riflettono le influenze universali sul cambiamento fonologico. -Regolari corrispondenze di suono225: Il nuovo software di riconoscimento automatizzato delle corrispondenze di suono presuppone che due Holman et alii 2009, pp. 167-179. Holman et alii 2008: „Automated classification of the world’s languages: A description of the method and preliminary results” (manoscritto in via di revisione. (scaricabile da: http://email.eva.mpg.de/~wichmann/ AutomatedLanguageClassification.pdf . 223 Holmann-Brown et alii 2011(24 febbraio). 224 Holmann-Brown et alii 2011: Appendix A, correspondences ordered by NG: http://wwwstaff.eva.mpg.de/~wichmann/SoundCorresp-Appendix_A.pdf; Appendix B, correspondences ordered by symbol: http://wwwstaff.eva. mpg.de/~wichmann/ SoundCorresp-Appendix_B.pdf; Appendix C, PG matrix for common consonants: http://wwwstaff.eva.mpg.de/~wichmann/ SoundCorresp-Appendix_C.pdf; Appendix D, PG matrix for vowels: http://wwwstaff.eva.mpg.de/ ~wichmann/SoundCorrespAppendix_D.pdf; Appendix E, occurrences of correspondences in Africa: http://wwwstaff.eva. mpg.de /~wichmann /SoundCorresp-Appendix_E.txt; Appendix F, occurrences of correspondences in Eurasia: http://wwwstaff.eva.mpg.de/ ~wichmann/SoundCorresp-Appendix_F.txt; Appendix G, occurrences of correspondences in Austronesian: http://wwwstaff.eva.mpg.de/ ~wichmann/SoundCorresp-Appendix_G.txt; Appendix H, occurrences of correspondences in New Guinea and Australia: http://wwwstaff.eva.mpg.de/ ~wichmann/SoundCorresp-Appendix_H.txt; Appendix I, occurrences of correspondences in the Americas: http://wwwstaff.eva.mpg.de/ ~wichmann/SoundCorresp-Appendix_I.txt. 225 Holman-Brown et alii 2011, p.1. 221 222 101 segmenti fonetici corrispondono quando si presentano nelle parole cognate di lingue geneticamente imparentate. Per esempio, K’iche’ raʃ ‘green’ e Huastec jaʃ ‘green’ sono parole cognate poiché entrambe sono forme discendenti da una parola per il verde nella loro comune lingua ancestrale, Proto-Mayan (Mesoamerica). I suoni corrispondenti in questo esempio sono rispettivamente r, J, a: a e ʃ: ʃ. Le corrispondenze di suono si presentano sempre in almeno due insiemi di lingue genealogicamente imparentate, tipicamente in molto più di due. Per esempio, r J è appare anche in K’iche’ war ‘sleep’/Huastec waj ‘sleep’ (“dormire”) e in K’iche’ ra:h ‘spicy’/Huastec jah- ‘spicy.’ (“piccante”). A causa della ricorrenza, tali abbinamenti sono definiti regolari corrispondenze di suono, tipicamente abbreviate in corrispondenze di suono. Le corrispondenze di suono sono il prodotto dei modi in cui i suoni delle lingue cambiano col passare del tempo. Per esempio, la corrispondenza r: J riconosciuta per K'iche e Huasteoco è il risultato di un segmento fonetico Proto-Maya, *r, che si è sviluppato in modi diversi nelle lingue figlie226 , mantenuta come r in K'iche e mutando (shifting) in J in Huasteco. Come si è già ricordato, il riconoscimento delle corrispondenze di suono è il fondamento del metodo comparativo della linguistica storica. Si dice che un gruppo di lingue è geneticamente imparentato (disceso da un antenato comune) quando le corrispondenze di suono sono trovate per estensione attraverso di loro. Il riconoscimento dell’ereditarietà delle parole da lingue differenti richiede la documentazione delle corrispondenze di suono. In assenza di tale documentazione, la ricostruzione degli inventari fonologici di protolingue non sarebbe possibile, né lo sarebbe la ricostruzione del lessico di una protolingua. In più, il sottoraggruppamento di lingue geneticamente imparentate richiede spesso l'identificazione d’innovazioni fonologiche condivise che sono manifestate attraverso le corrispondenze di suono. Nonostante l'importanza delle corrispondenze di suono nella linguistica storica, nessuno ancora, secondo quanto affermato dagli autori, ha assemblato un compendio completo, o almeno quasi completo, di corrispondenze di suono pertinenti alle lingue del mondo. C’è solo un altro progetto in corso che ha un simile obiettivo, UniDia, presentato in http://www.diadm.ishlyon. cnrs.fr/unidia/index.php. Il metodo di UniDia è di compilare le corrispondenze di suono dagli studi segnalati nella letteratura pubblicata. Attualmente, questa compilazione consiste di corrispondenze trovate per le lingue dei gruppi del Bantu, Chibchan, Daic, Oto-Manguean, Panoan, Sinitico e di Tucanoano. Applicando il programma informatico di riconoscimento di corrispondenze regolari al database ASJP, appunto, Holman-Brown 2011 identificano le corrispondenze di suono attraverso l’automazione. Con 226 Campbell 1999, p.125 102 queste risorse è stato possibile non solo produrre un compendio di corrispondenze di suono del mondo, ma anche fornire i dati di frequenza per ogni corrispondenza osservata. - Il database ASJP e il software di riconoscimento di similarità 227: Il software d Holman-Brown si limita a identificare le corrispondenze senza osservazioni per quanto riguarda le direzioni di cambiamento che li hanno prodotti. Il database ASJP (versione 13) consiste nelle liste di parole di 40 referenti, in più della metà delle lingue del mondo e gruppi genetici di lingue di quasi tutto mondo. La base di dati era ha progettato per facilitare la classificazione automatizzata delle lingue del mondo (Brown ed altri 2008), e all’inizio ha utilizzato la lista di 100-parole elaborata da Swadesh 1955. La ricerca successiva ha indicato che una sua riduzione a solo 40 dei termini più stabili ha prodotto risultati migliori rispetto all’intera lista di 100 parole (Holman ed altri 2008). Di conseguenza, il database è stato limitato alla lista di 40 parole, poiché questa ha aumentato sostanzialmente la capacità di aggiungere i dati ed includere più lingue. Nel database, le lingue (se non isolate) sono classificate in famiglie e in generi come definite da Dryer 2005, per esempio, indoeuropeo (famiglia) e germanico (genus). Il livello tassonomico utilizzato in questo studio è il genere (genus), che Dryer ha definito come il gruppo di lingue più inclusivo disceso da un antenato comune, parlate entro i 3500-4000 anni. In alcuni casi, la distinzione famiglia/genere non è pertinente e la famiglia ed il genere sono dati dallo stesso codice, per esempio, Maya (famiglia) e Maya (genere). Oltre alle lingue dei gruppi genealogici riconosciuti, il database ASJP comprende lingue isolate, i pidgins, i creoli, le lingue miste e le lingue costruite come l’esperanto. In questo studio sono usate soltanto le lingue dei gruppi genealogici riconosciuti. Tuttavia, questi non comprendono alcune lingue estinte per cui gli unici dati registrati siano più antichi del 1700 a.C.. Il database usato qui consiste di 4692 liste di parole pertinenti a 334 genera. Il database ASJP comprende alcune lingue nelle quali vengono espresse meno di tutti e 40 i referenti. Queste lingue sono incluse a condizione che abbiano parole per almeno 28 (o 70%) dei referenti. In più, sono permessi fino a due sinonimi per un referente. La maggior parte dei generi sono gli stessi presenti in WALS228. In alcuni casi sono state usate modifiche o le estensioni non pubblicate della classificazione di WALS, comunicate personalmente agli studiosi da Matthew Dryer. In alcuni altri casi è stato consultato Ethnologue229 per dedurre i genera adatti per le 227 Holman-Brown et alii 2011, p.2. Vd. Anche Holman-Brown et alii 2008 a, pp. 285–308; Holman-Brown et alii 2008 b, pp. 331-354; Holman-Brown et alii 2009, pp. 167-179, HolmanBrown et alii 2010a e 2010b. 228 Haspelmath et alii 2005. 229 Vd. Lewis 2009. 103 lingue non ancora incluse in WALS. Questa procedura è giustificata perché le classificazioni di WALS e di Ethnologue sono molto simili per la maggior parte delle zone del mondo e dove ci sono differenze queste tendono ad essere di natura sistematica. Per ogni lingua nel database, le parole estratte da una fonte pubblicata sono trascritte in un'ortografia standard conosciuta come ASJPcode. ASJPcode è stato sviluppato per facilitare la trascrizione delle parole in un'ortografia standard. Agisce in tal modo impiegando soltanto i simboli che hanno trovato sulle tastiere QWERTY. I 41 simboli utilizzati in ASJPcode e i loro valori corrispondenti nell'alfabeto fonetico internazionale (IPA) sono presentati nelle tabelle 1 e 2: Codici ASJP per simboli consonantici e rispettivi simboli IPA ASJPcode Description IPA symbols voiceless bilabial stop and fricative voiced bilabial stop and fricative voiceless labiodental fricative voiced labiodental fricative bilabial nasal voiced bilabial-velar approximant voiceless and voiced dental fricative dental nasal voiceless alveolar and retroflex stop voiced alveolar and retroflex stop voiceless alveolar fricative voiced alveolar fricative voiceless and voiced alveolar affricate voiceless and voiced alveolar nasal voiced apico-alveolar flap and all other varieties of “r-sounds” voiced alveolar lateral approximate voiceless postalveolar fricative voiced postalveolar fricative voiceless palato-alveolar affricate voiced palato-alveolar affricate voiceless and voiced palatal stop palatal nasal palatal approximant voiceless velar stop p, ɸ b, f v m w Ɵ, d ṋ t, ʈ d, ɖ s z ʦ, ʣ n, ɳ ɾ, r, ʀ, ɽ symbol p b f v m w 8 4 t d s z c n r l S Z C j T 5 y k l ʃ ʒ ʧ ʤ c, Ɉ ɲ j k 104 g x N q G X voiced velar stop voiceless and voiced velar fricative velar nasal voiceless uvular stop voiced uvular stop voiceless and voiced uvular fricative, voiceless and voiced pharyngeal fricative voiceless and voiced glottal fricative voiceless glottal stop all other laterals all varieties of “click-sounds” h 7 L ! g x, ɣ ŋ q ɢ , ʁ, ħ, ʕ h, ɦ Ɂ ʟ, ɭ, ʎ !, ǀ, ǁ, ǂ Tab. 1. (Holman-Brown 2011, p.4) Codici ASJP per simboli vocalici e relativi simboli IPA ASJPcode symbol i e E 3 a u o Description IPA symbols high front vowel, rounded and unrounded mid front vowel, rounded and unrounded low front vowel, rounded and unrounded high and mid central vowel, rounded and unrounded low central vowel, unrounded high back vowel, rounded and unrounded mid and low back vowel, rounded and unrounded i, ɪ, y, ʏ e, o a, ɛ, ɶ, oe ɨ, ɘ, ǝ, ɜ, ʉ, ɵ, ʚ a, ɐ ɯ, u ɤ, ʌ, ɑ, o, ɔ, ɒ Tab. 2. (Holman-Brown 2011, p.5). - Descrizione dei codici ASJP 230: In queste tabelle, ASJPcode non registra i nuclei sillabici complessi, comprese le vocali lunghe; né registra elementi soprasegmentali come il tono o l’accento. Alcuni simboli IPA che corrispondono a suoni rari che non influenzerebbero le osservazioni 230 Holman-Brown 2011, pp.4-7. 105 statistiche in modo apprezzabile, come le fricative retroflesse, non sono elencati nella tab. 1. ASJPcode è in grado di esprimere un complesso di simboli fonetici, anche suoni combinati come ad esempio hkw, cioè è una velare sorda preaspirata, labializzato: una volta seguita dal modificatore $, una sequenza di tre simboli è trattata come un singolo simbolo. ASJPcode usa altri due simboli (“ e *), come modificatori. La combinazione di una consonante con “, come K„, rappresenta una eiettiva (consonante glottalizzata) e i simboli uniti sono trattati nell'automazione come singolo simbolo. Il simbolo * segue immediatamente soltanto le vocali e le identifica come nasalizzate. ASJPcode inoltre usa i simboli complessi, unendo i simboli di base. Per esempio, esso fornisce i mezzi per la trascrizione dell'aspirazione di consonante. Nelle fonti originali, l'aspirazione è rappresentata spesso da una consonante seguita da una h in apice, come th e ph. In ASJPcode, questi sono trascritti rispettivamente th e ph, seguiti dal simbolo ~ per indicare che tali suoni sono equivalenti a singoli simboli. Tipicamente, i simboli complessi coinvolgono la labializzazione (per esempio, kw è trascritto come kw~), la palatalizzazione (per esempio, tj trascritto come ty~) e la nasalizzazione (per esempio, g trascritto come Ng~). Alcuni dei simboli di ASJPcode corrispondono a più di un valore di IPA. Per esempio, p è usata per trascrivere sia la p che ɸ di IPA, dove p è la sorda bilabiale e ɸ è la fricativa bilabiale sorda. Nella maggior parte dei casi, dove un singolo simbolo di ASJP corrisponde ai due o più valori di IPA, uno degli ultimi è sostanzialmente più frequente nelle lingue del mondo dell'altro (per esempio, la p è sostanzialmente più frequente di ɸ 231. Per gli scopi analitici in questo studio, i valori altamente frequenti di IPA dei simboli di ASJP sono considerati basici. Per esempio, ASJP p è trattato come una sorda piuttosto che una fricativa. Tuttavia, per due dei simboli di ASJP che hanno valori multipli di IPA, cioè L e ! , non è chiaro quale realizzazione fonetica sia più comune. Allora, l'interpretazione in questi casi rimane ambigua. Per esempio, i valori di IPA di L sono ʟ, ɭ e ʎ, nessuno dei quali è conosciuto per essere contrassegnato come più frequente rispetto agli altri due valori. Nell'interpretazione dei risultati di questo studio, è necessario tenere in considerazione quest’ambiguità di alcuni simboli di ASJPcode. Per quanto riguarda i simboli di ASJP per le vocali (tab. 2) nel complesso è sostanzialmente più ambiguo di quello delle consonanti. Quattro dei sette simboli di vocale rappresentano rispettivamente i quattro o più valori IPA. Di conseguenza, ogni simbolo di vocale tabulato nelle corrispondenze identificate in tutto il mondo rappresenta una vasta gamma delle realizzazioni fonetiche. ASJPcode originale non è stato progettato per 231 Cfr. Maddieson 1984. 106 uno studio foneticamente sottile sul cambiamento di suono, ma piuttosto come strumento altamente accessibile per la trascrizione delle parole di tutte le lingue del mondo in una singola ortografia sufficientemente differenziata per essere utile per il paragone delle liste di parola per gli scopi quali la produzione delle classificazioni automatizzate delle lingue232 e il calcolo delle date di separazione per i gruppi di lingua genealogici. Di conseguenza, il compendio di corrispondenze dovrebbe essere capito come prima approssimazione per tracciare le corrispondenze in tutto il mondo aprendo spiragli a indagini future sull’implementazione di ortografie sempre più dettagliate. Un tale tracciato, per così dire, segna le strade principali di ricorrenti corrispondenze di suono, ma non tutte le strade secondarie. Tuttavia, questa mancanza di specificazione non inibisce chiaramente l'emergere di robusti modelli analitici da cui possono essere ricavate conclusioni generali sul cambiamento fonologico. - Il programma di riconoscimento di corrispondenze di suono233: Il programma informatico implementato per riconoscere le corrispondenze di suono opera mediante il confronto tra parole che hanno gli stessi referenti nelle lingue pertinenti ad ogni genus trovato nel database ASJP. Data una coppia di lingue nello stesso genere (genus) e dato un singolo concetto (concept) sulla lista di 40 parole, una coppia di simboli, tipo X: Y, qualifica come potenziale corrispondenza se le parole per il concetto nelle due lingue sono identiche salvo che una parola contiene X laddove l'altra parola contiene Y. Per esempio, parole per “uno” in Huasteco e in Uspanteco, due lingue Maya, sono rispettivamente hun e xun (tutte le trascrizioni di lingua sono indicate in ASJPcode). Poiché queste due parole sono identiche, tranne la h e la x, questi suoni sono potenzialmente corrispondenti. Una potenziale corrispondenza si qualifica come corrispondenza reale se occorre in almeno due unità lessicali nella lista nelle stesse due lingue. Per esempio, h e x si presentano anche nelle parole al contrario identiche per “acqua” “water”, “ha7” e “xa7” (in ASJPcode), trovate rispettivamente in Huasteco e in Uspanteco. Poiché h e x corrispondono in almeno due coppie di parole di Huasteco e Uspanteco, sono considerate dal programma come suoni regolarmente corrispondenti. Il requisito di “almeno due items” riduce la probabilità di identificare una somiglianza accidentale (a chance similarity) come corrispondenza, al costo di aumentare la probabilità di perdere una vera corrispondenza. L’algoritmo rileva corrispondenze fra i seguenti simboli: i 41 semplici simboli consonantici e vocalici di ASJP (tabelle 1 e 2), ma anche simboli modificati come descritto sopra. L'opzione “nullo” (the null set), qui indicato Ø, partecipa alle corrispondenze perché ogni volta che un suono si perde in una lingua, il suo 232 Holman-Brown 233 et alii 2008. Holman-Brown et alii 2011, p. 7. 107 suono ereditato in una lingua corrispondente necessariamente corrisponde a nessun suono nella lingua in cui il suono è perso. ASJPcode permette inoltre, come si è già ricordato, due sinonimi per ogni concetto. Se una, o entrambe le lingue, contengono due sinonimi per un concetto, una corrispondenza potenziale può accadere in entrambi i sinonimi. È improbabile che il programma riconosca tutte le corrispondenze pertinenti alle lingue di qualsiasi genus particolare. Ovviamente, le liste di lingue se coinvolgessero più di 40 referenti aumenterebbero la probabilità di individuazione delle corrispondenze. Ci sono altri fattori di complicazione che limitano la capacità del programma di riconoscere le corrispondenze. Per esempio, la parola per ‘fish', “pesce” di Uspanteco “kar”, è imparentata con “Cay”, “fish” nella sua lingua sorella, Tzeltal. Sappiamo che questi termini sono imparentati perché lo studio comparativo dettagliato sulla fonologia Maya ci informa che K e la C rispettivamente sono suoni corrispondenti per le due lingue come lo sono r e y menzionati sopra234. Il programma non può identificare queste corrispondenze di suono perché i suoni corrispondenti reali non si presentano nello stesso contesto nelle parole imparentate, cioè, in Uspanteco, K si presenta nel contesto _ar, mentre in Tzeltal, C si presenta nel contesto _ay. Sono state esplorate parecchie versioni alternative del programma che ha implementato il requisito di un contesto identico dei suoni corrispondenti. Applicato ai vari gruppi di lingua ben esaminati, l’algoritmo alternativo ha identificato alcune corrispondenze più conosciute della procedura attuale, con molte altre corrispondenze non pubblicate da esperti e non plausibili per motivi fonologici. Per la corrispondenza di parole simili (matching similar words), sono necessarie almeno due consonanti consecutive devono normalmente essere identiche; le consonanti devono essere contigue o interrotte da ogni simbolo di vocale (either contiguous or interrupted by any vowel symbol ). Se ci sono soltanto due o tre simboli in una parola comparata, anche le vocali sono prese in considerazione, tali che sequenze identiche CV o VC contano come corrispondenze sufficientemente valide (such that identical CV or VC sequences count as a sufficiently good match). Se uno dei membri di una sequenza di simboli consonantici combinati (per esempio ph) corrisponde ad un singolo simbolo di consonante (per esempio, p o h) nella parola con la parola con la quale è comparata, questo conta come coppia di consonanti congruenti (If one of the members of a sequence of combined consonant symbols, e.g. ph, corresponds to a single consonant symbol, e.g., either p or h, in the word compared with, this counts as a pair of marching consonants). L'identità fra una vocale in una parola ed un membro di un insieme di vocali contigue nell'altra parola è contata come match ( Identity between a vowel 234 Cfr. Campbell 1977. 108 in one word and either member of a set of contiguous vowel symbols in the other word is counted as a match). Esempi di determinazione automatica di similarità, come negli esempi riportati di seguito: buk // bek v3n // vinik yaNkapulan // kpsx ape8kw~ // pLa8k ph~it // it anniow // ni api // rewapga Eku // pakuni ph~oyoq // hoyol e8kw~iwiwa // aki tau // tudik tau // tamas no // noak no // niop ch~ikh~ // acahua Con la percentuale di somiglianza sottratta, si sottrarre la proporzione media di matches fra le parole che hanno significati diversi dalla proporzione media di corrispondenze fra parole che hanno lo stesso significato (Subtract the average proportion of matches between words having different meanings from the average proportion of matches between words having the same meaning). Le vere corrispondenze mancanti sarebbero uno svantaggio serio se lo scopo fosse quello di seguire i dati storici fonologici di un insieme particolare di lingue imparentate. Per tale scopo, via già intrapresa da alcuni altri studiosi come Steiner235, ci sarebbe bisogno chiaramente di più grande insieme di unità lessicali su cui lavorare. Attualmente, tuttavia, HolmanBrown sono interessati alle corrispondenze di suono attraverso le lingue del mondo. In un campione globale, alcune delle corrispondenze che non sono riconosciute per alcun genus particolare di lingua, malgrado la loro occorrenza all'interno del genere, ci si aspetta che occorrano in altri generi di lingua e vengano riconosciute dal programma attuale. Di conseguenza, le corrispondenze di suono segnalate qui probabilmente includono la maggior parte dell'inventario in tutto il mondo di corrispondenze comuni accanto a un campione rappresentativo di quelle più rari. Dato il grande numero di corrispondenze già trovate, si può dire sicuramente che la maggior parte delle corrispondenze mancanti sono relativamente rare nelle lingue del mondo. La frequenza di una corrispondenza fra due suoni qui è misurata per NG, Numero dei genera in cui la corrispondenza è trovata. Questo è supportato da un altro parametro, PG, 235 Steiner et alii 2011, ancora in preparazione di stampa. 109 che è intesa come puro parametro della tendenza di due suoni di corrispondere l'un l'altro, indipendentemente da quanto spesso i diversi suoni hanno occorrenza. La derivazione di PG coinvolge il riconoscimento della disponibilità di un genus per una data corrispondenza X: Y. Un genere è disponibile se contiene almeno due lingue tali che X si presenta nelle parole per almeno due items nella lista per una lingua e Y si presenta nelle parole per almeno due items (non necessariamente gli stessi) nella lista per l'altra lingua. Si permette che le coppie di unità lessicali siano differenti in questa definizione perché la disponibilità è supposta riflettere la frequenza dei suoni indipendentemente da ogni rapporto fra loro. Il numero totale dei genera disponibili per la corrispondenza è denotato come AG. PG è definito come NG/AG ed espresso come percentuale; cioè PG è la percentuale dei genera disponibili che in realtà mostrano la corrispondenza. Due proprietà di PG dovrebbero essere notate. In primo luogo, l'esattezza di PG come stima di come AG aumenta, poiché AG è la misura del campione su cui PG è basato. In secondo luogo, alcune corrispondenze possibili non sono trovate malgrado i valori notevoli di AG; queste corrispondenze possibili hanno un valore di PG uguale a 0. - Analisi di sound similarities basato sulle corrispondenze236: Questo studio di Holman-Brown 2011 è il primo indirizzato sistematicamente alle frequenze delle corrispondenze di suono attraverso le lingue del mondo. L’ambizioso obiettivo di questa ricerca in termini di numero delle lingue prese in considerazione è stato reso possibile attraverso trascrizioni semplificate, dove alcuni suoni relativamente rari sono fusi insieme in classi rappresentati da un singolo simbolo. Di conseguenza le conclusioni riguardano soltanto i suoni più frequenti. Tuttavia, sono emersi alcuni robusti modelli: 1. Le somiglianze di consonanti, come definite per co-occorrenza nelle corrispondenze di suono possono essere descritte al livello tassonomico più elevato come una gerarchia dove la nasale ha il più alto grado di occorrenza, seguito da tre caratteristiche del posto: labiale, anteriore (non-velare) e posteriore (velare). La caratteristica di sonorità (voicedness) è importante soltanto ad un basso livello tassonomico237. 2. I segmenti di vocale prodotti nelle parti congiuntive della zona linguale della cavità orale tendono fortemente ad essere accoppiati nelle corrispondenze. Per esempio, le vocali basse della parte anteriore tendono ad accoppiarsi con le vocali basse centrali, le vocali alte centrali tendono ad accoppiarsi con le vocali alte posteriori e le vocali centrali della parte anteriore tendono ad accoppiarsi con le vocali basse anteriori. Le vocali disgiuntive, come “o” (basse posteriori) ed “i “ (alte anteriori), o “e” (basse 236 237 Holman-Brown et alii 2011, p. 9. Holman-Brown et alii 2011, p.9. 110 anteriori) e la u (alte posteriore), tendono ad essere accoppiate con minor probabilità238. 3. In media, le vocali corrispondono l'un l'altra circa dieci volte più spesso di quanto facciano le consonanti e le vocali corrispondono più spesso a zero circa tre volte rispetto alle consonanti. Si può concludere che le consonanti sono globalmente più stabili delle vocali.239 4. Una tabella basata sulla frequenza (PG) delle corrispondenze di consonanti si trova ad essere correlata significativamente con le tabellematrici pubblicate per le stesse consonanti basate su altre misure di similarità. Queste misure comprendono confusioni percettive, confusioni nella memoria a breve termine, errori di discorso, giochi di parole intenzionali, valutazioni e giudizi (These measures include perceptual confusions, confusions in shortterm memory, speech errors, intentional puns, and ratings and judgments). Le correlazioni con la matrice di corrispondenza variano da 0.15 a 0.74, con un valore medio di 0.40, che è quasi esattamente lo stesso della correlazione media fra le stesse tabelle pubblicate. Quindi, la tabella di corrispondenza è una misura ineccepibile di valutazione di similarità di consonanti pur essendo basata su dati completamente differenti. La mancanza di chiare differenze fra le correlazioni con fattori percettivi da un lato e fattori articolatori dall'altro, supporta un modello misto di cambiamento di suono, come quello di Blevins 2004, dove si presuppone che entrambi i fattori svolgano un ruolo. L'importanza di entrambi i fattori inoltre emerge nell'organizzazione dell'albero di UPGMA, che visualizza somiglianze PG, dove le nasali appartengono ad un cluster principale separato e dove altri importanti clusters sono definiti in base al luogo di articolazione. L'albero indica che l'articolazione è importante nel cambiamento di suono, ma il fatto particolare che la NASALE occupa il luogo superiore dell'articolazione è probabilmente meglio spiegato dalla percezione (The tree shows that articulation is important in sound change, but the particular fact that NASAL outranks place of articulation is probably best explained by perception). Le nasali hanno indicazioni di luogo intrinsecamente deboli, che spiegano perché sono spesso confuse, sentite male (misperceived)240. 5. Poiché le componenti sincroniche fonetiche generalmente si correlano meglio con quelle diacroniche piuttosto che con qualsiasi parametro articolatorio o uditivo, è chiaro che i cambiamenti di suono sono una fonte primaria per la spiegazione dei modelli sincronici. (Given that synchronic sound patterns overall correlate better with diachronic ones than with any particular articulatory or auditory parameter, it is clear that sound changes are a primary source for explaining synchronic patterns). 238 Holman-Brown 239 et alii 2011, p.13. Holman-Brown et alii 2011, pp.14-17. 240 Holman-Brown et alii 2011, p.17sg. 111 6. Il compendio di corrispondenze di suono date con le loro frequenze di occorrenza online nelle appendici A e B241 fornisce una risorsa per la valutazione sistematica d’importanza differenziale di varie innovazioni fonologiche comuni usate dai linguisti storici per stabilire i sottogruppi di famiglie linguistiche. L'applicazione del programma di riconoscimento di corrispondenze di suono al database ASJP identifica quindi 615 corrispondenze fra simboli non identici. C’è un totale di 127 simboli differenti coinvolti nelle corrispondenze, compresi simboli semplici, modificati e complessi, con *, “ e Ø contato come simboli semplici. Le 615 corrispondenze sono presentate nelle appendici in linea A e B. Esempio di corrispondenze di suono in Eurasia (ricavate da AJSPcode)242: Eurasia 2 SYNONYMS, 40 WORDS, DATE > 1700, WITHIN RANK 2; LOANWORDS EXCLUDED IE.ARMENIAN d:t EASTERN_ARMENIAN WESTERN_ARMENIAN 53 liver 53 liver ly~ard // ly~art // WESTERN_ARMENIAN EASTERN_ARMENIAN 25 leaf derev // 25 leaf terev // WESTERN_ARMENIAN EASTERN_ARMENIAN 43 tooth 43 tooth WESTERN_ARMENIAN EASTERN_ARMENIAN 57 see desne // 57 see tesne // WESTERN_ARMENIAN EASTERN_ARMENIAN 74 star asd3x // 74 star ast3x // WESTERN_ARMENIAN EASTERN_ARMENIAN 85 path jampa, arahed // 85 path arahet, Ch~anapar // agra, adam // atam // g:k EASTERN_ARMENIAN WESTERN_ARMENIAN 66 come ga // 66 come ka // Vd. supra nota 200, p.127. Holman-Brown et alii 2011: Appendix F, occurrences of correspondences in Eurasia: http://wwwstaff.eva.mpg.de/~wichmann/SoundCorresp-Appendix_F.txt) 241 242 112 EASTERN_ARMENIAN WESTERN_ARMENIAN 92 night 92 night giSer // kiSer // WESTERN_ARMENIAN EASTERN_ARMENIAN 11 one meg // 11 one mek // WESTERN_ARMENIAN EASTERN_ARMENIAN 12 two yergu // 12 two yerku // WESTERN_ARMENIAN EASTERN_ARMENIAN 19 fish cug // 19 fish cuk // WESTERN_ARMENIAN EASTERN_ARMENIAN 28 skin maSg, gaSi // 28 skin maSk // WESTERN_ARMENIAN EASTERN_ARMENIAN 31 bone vosgor // 31 bone voskor // WESTERN_ARMENIAN EASTERN_ARMENIAN 47 knee cung, cuNg // 47 knee cunk // kh:k EASTERN_ARMENIAN WESTERN_ARMENIAN 3 we 3 we EASTERN_ARMENIAN WESTERN_ARMENIAN 40 eye aCkh~ // 40 eye aCk // EASTERN_ARMENIAN WESTERN_ARMENIAN 77 stone 77 stone 2 LISTS, IE.BALTIC g:c menkh~ // menk, meNk // kh~ar // kar, Zar // 3 CORRESPONDENCES LITHUANIAN LATVIAN 54 drink 54 drink ger, girtau // cer // LITHUANIAN LATVIAN 58 hear girde, iSklausy~ti // 58 hear cirde // 0:a LATVIAN LITHUANIAN 11 one viens // 11 one vienas // 113 LATVIAN LITHUANIAN 31 bone kauls // 31 bone kaulas // 2 LISTS, 2 CORRESPONDENCES IE.CELTIC E:i BRETON 1 I mE // GAELIC_SCOTTISH 1 I mi // BRETON WELSH 1 I 1 I mE // mi // BRETON WELSH 2 you 2 you tE // ti // u:i GAELIC_SCOTTISH IRISH_GAELIC 30 blood 30 blood fuL // kro, fiL // IRISH_GAELIC BRETON 21 dog ku, madr3 // 21 dog ki // IRISH_GAELIC MANX 51 breast 51 breast IRISH_GAELIC WELSH 2 you 2 you IRISH_GAELIC WELSH 21 dog ku, madr3 // 21 dog ki // MANX IRISH_GAELIC 11 one un, nen // 11 one in // MANX IRISH_GAELIC 18 person 18 person brol3x, kux // kix // tu, hu // ti // du53 // di53, dini // u:3 BRETON WELSH 12 two dau // 12 two da3, du3 // BRETON WELSH 53 liver 53 liver MANX 11 one un, nen // avu // ia3, av3 // 114 WELSH kh:k 11 one 3n // GAELIC_SCOTTISH IRISH_GAELIC 21 dog kh~u // 21 dog ku, madr3 // GAELIC_SCOTTISH IRISH_GAELIC 39 ear kh~lu3s // 39 ear klu3s // GAELIC_SCOTTISH MANX 77 stone 77 stone kh~lax // klax // Le tabelle riportata in allegato243 sono generate con lo stesso metodo e poi visualizzate manualmente. Le singole tabelle riportano in alto, in orizzontale, le varie lingue raccolte in ceppi e famiglie linguistiche, di lingue sia indoeuropee che non-Indoeuropee (solo come controllo, non per dimostrarne la parentela); nell’asse verticale sono riportate le parole del vocabolario basico secondo la lista di Swadesh di 40 parole. Ne emerge una visualizzazione trasversale della somiglianza tra le parole basiche (immuni da prestito) delle varie lingue del mondo. - Matrici basate su misure di somiglianza di suono psicoacoustiche e psicolinguistiche 244: Le corrispondenze basate su similarità (Correspondence-based similarities) vengono anche confrontate da Holman-Brown con parametri di somiglianza di suono psicoacoustici e psicolinguistici (compared with psychoacoustic and psycholinguistic measurements of sound similarità) 245, misure che coinvolgono fattori quali le confusioni percettive (perceptual confusions), grado di giudizio di similarità uditiva (ratings and judgments of auditory similarity), gli errori del parlato (speech errors), giochi di parole (puns), confusioni nella memoria a breve termine (confusions in shortterm memory) ed i modelli di co-occorrenza nelle regole fonologiche sincroniche (co-occurrence patterns in synchronic phonological rules)246. Un tentativo di conclusione per questo tipo di confronto operato dal software di riconoscimento di similarità è che proprietà percettive e articolatorie influenzano il cambiamento di suono circa allo stesso grado (A tentative conclusion is that perceptual and articulatory properties influence sound change to about the same degree). Un'implicazione pratica importante del compendio di corrispondenza è che esso facilita la valutazione obiettiva da parte dei linguisti storici della comunanza o della rarità delle innovazioni fonologiche condivise citate come prova per il sottoraggruppamento delle famiglie linguistiche. 243 vd. 244 oltre “Allegati”. Holman-Brown et alii 2011, pp.17-23. 245 Holman-Brown et alii 2011, p.17. 246 Holman-Brown et alii 2011, pp. 17-23. 115 3.b.4. Prospettive future della Automated Lexicostatistics Il modello della Automated Lexcostatistics di Holman-Brown è in continua implementazione, dal 2008 al 2011, e sottoposto a continue modifiche per un miglioramento costante: il recente software di „riconoscimento di similarità“ appena descritto viene costantemente combinato con i successivi steps lessicostatistci, ampiamente descritti in Holman-Brown 2008a e 2008b, nel tentaivo di tenere in costante correlazione il concetto di mutamento linguistico e di relazione genealogica tra le varie lingue del mondo. Tali steps successivi all’individuazione delle corrispondenze sono: a) Costruizione di una matrice di distanza (distance matrix)247: (Holman-Brown et alii 2008 b: email.eva.mpg.de/.../ExplorationsAutomatedLexicostatisticsTalk.ppt, p.9) b) Costruzione di un albero delle famiglie linguistiche e confronto con gli esperti linguisti: Premesso che l’unione di vicinanza (NeighbourJoining) è solo fonetica (senza tener conto di parametri di spazio e tempo), non si stabiliscono presupposti circa le condizioni di carattere genetico ancestrale (Is phonetic in nature, making no assumptions about ancestral character states), si uniscono gli accoppiamenti più vicini dei taxa (gruppi linguistici) nell'ambito di un nodo (Begins by joining the closest pair of taxa under one node); quindi si amalgamano tali gruppi linguistici come nella tabella di distanza e il processo continua automaticamente (Amalgates those taxa as one in the distance matrix and continues the process). Vd. Anche Holman-Brown et alii 2008 a, pp. 285–308; Holman-Brown et alii 2008 b, pp. 331-354; Holman-Brown et alii 2009, pp. 167-179, Holman-Brown et alii 2010a e 2010b. 247 116 ASJP tree (Holman-Brown et alii 2008 b: email.eva.mpg.de/.../ExplorationsAutomatedLexicostatisticsTalk.ppt, pp.12) (Holman-Brown et alii 2008 b: email.eva.mpg.de/.../ExplorationsAutomatedLexicostatisticsTalk.ppt, pp.12) 117 (Holman-Brown et alii 2008 b: email.eva.mpg.de/.../ExplorationsAutomatedLexicostatisticsTalk.ppt, pp.13) Finora, buoni risultati di classificazione si stati ottenuti per le seguenti famiglie: Maya; Mixe-Zoquean; Otomanguean; Huitoto-Ocaina; Tacanan; Chocoan; Muskogean; Indoeuropeo; Austro-Asiatico. Una sola famiglia si è dimostrata recalcitrante alla lessicostatistica: l’Austronesiano (specialmente l’Oceanico occidentale). Si sta cercando di migliorare l’algoritmo attraverso successive valutazioni della performance per mezzo di ulteriori modifiche della lista di Swadesh, sempre più breve, attraverso un algoritmo in grado di: - misurare le stabilità degli items della lista di Swadesh; - trovare la lista più breve fra gli items più stabili che dia risultati adeguati. Per la misurazione della stabilità di misurazione (Measuring stabilities) vengono computate le proporzioni di matches per gli accoppiamenti delle parole con significati simili fra lingue all'interno dei generi, apportando correzioni per accordo di probabilità (corrections for chance agreement) ed elementi ponderati (weighted means): 118 (Holman-Brown et alii 2008 b:: email.eva.mpg.de/.../ExplorationsAutomatedLexicostatisticsTalk.ppt, p.22) 119 (Holman-Brown et alii 2008 b: email.eva.mpg.de/.../ExplorationsAutomatedLexicostatisticsTalk.ppt, p.23) All'interno della lista dei 100 items si andrà a vedere quindi il grado di stabilità e prestabilità (stability and borrowbility): Borrowing rate 0.3 0.25 0.2 0.15 0.1 0.05 0 0 20 40 60 80 100 Stability rank (Holman-Brown et alii 2008 b: email.eva.mpg.de/.../ExplorationsAutomatedLexicostatisticsTalk.ppt, p.24) La prestabilità (borrowing) può essere più variabile, per unità lessicali date attraverso le zone rispetto alla stabilità e non essere una proprietà inerente 120 delle unità lessicali (simili alle caratteristiche tipologiche) (Borrowability may be more variable for given lexical items across areas than stability and not be an inherent property of lexical items (similar to typological features). La prestabilità non è comunque un rilevante elemento che contribuisce alla stabilità, almeno come il segmento costituito dalla lista dei 100 elementi di Swadesh. (Borrowability is not a significant contributor to stability, at least as the segment constituted by the Swadesh 100-item list is concerned). Il nuovo obiettivo è quello di selezionare una lista ancor più breve (Selecting a shorter list) di soli 40 items, per ottenere maggiori garanzie di stabilità: le parole scelte sono: rain, kill, bark esclusi a causa della sovrapposizione con water, die, skin , sostituiti dagli articoli allineati 41-43: new, dog, sun). La correlazione fra le distanze nel metodo automatizzato ed altre classificazioni è in funzione delle lunghezze della lista (Correlation between distances in the automated approach and other classifications as a function of list lengths). 1 0.9 0.8 Correlation 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 10 20 30 40 50 60 70 80 90 100 Number of words (Holman-Brown et alii 2008 b: email.eva.mpg.de/.../ExplorationsAutomatedLexicostatisticsTalk.ppt, p.25) In conclusione, gli studi nel campo della Automated Lexicostatistics sono ancora forieri di interessanti sviluppi: attraverso un approccio multidisciplinare che coinvolge fonologia, tipologia, multilateral comparison, vocabolario basico (Liste di Swadesh) e statistica, cerca di dare risposte al cambiamento linguistico supportando e superando la linguistica comparativa classica. 121 4. Semantic primes di Wirzbicka e Goddard 4.a. Fondamenti di Semantica L’interesse per gli studi in prospettiva “multilaterale” incentrati sul lessico basico, enfatizzati da Swadesh, Greenberg e da parte della Automated Lexicostatistics, come analizzato nei capitoli precedenti, ha interessato di recente anche l’ambito della semantica. Com’è noto, la Semantica è quella parte della linguistica che studia il significato delle parole (Semantica lessicale), degli insiemi di parole e delle frasi (Semantica frasale) e dei testi (Semantica testuale). E’ una scienza in stretto rapporto con altre discipline, come la semiologia, la logica, la psicologia, la teoria della comunicazione, la stilistica e la filosofia del linguaggio. La posizione della semantica, studiata nell'ambito di una teoria generale dei segni, diventa più chiara se messa a confronto con la pragmatica e la sintassi. Si può, infatti, affermare che se la pragmatica studia il linguaggio in rapporto all'uso che ne fa il parlante, la semantica considera il rapporto tra l'espressione e la realtà extralinguistica. Nel campo degli studi della semantica una prima distinzione avviene tra semantica diacronica e semantica sincronica. Alla fine dell' Ottocento gli studi di semantica iniziano a focalizzarsi soprattutto sul cambiamento di significato letto in chiave storica. Sono state stabilite delle leggi semantiche per delineare il cambiamento avvenuto; inoltre si cerca di dare una rigorosa classificazione ai vari tipi di cambiamento. Si cerca, quindi, di esaminare la frase secondo la prospettiva del passato, analizzando l'origine e la storia di ciascuna parola, confrontando gli aspetti sintattici e morfologici della frase con gli aspetti morfologici e sintattici di una frase simile pronunciata nei secoli addietro. Quest’analisi diacronica viene svolta dagli studiosi sin dagli anni ‘50. In seguito si sviluppa un tipo di studi diverso che analizza i significati, dopo averli scomposti, con metodi formali che si ispirano allo strutturalismo e ad altre correnti di linguistica moderna. Si esamina pertanto la frase secondo la prospettiva del presente, analizzando le parole e gli insiemi di parole, i loro significati e gli usi attuali, le possibili sostituzioni con altre parole di significato simile o diverso e i rapporti che intercorrono fra le parole contenute nella frase in questione compiendo così un'analisi sincronica. Nella Linguistica moderna viene focalizzato lo studio del significato in sé, utilizzando metodi formali molto rigorosi senza però tener conto del rapporto tra i significati stessi e il mondo dei parlanti, e coloro che studiano il significato in rapporto alla situazione e al contesto. Quello che interessa in questa sede è cercare di capire se vi sono punti di contatto tra semantica e comparazione linguistica, o fra semantica e universali linguistici, e quale possa essere il contributo della Linguistica 122 cognitiva alla comparazione linguistica, se può aiutare cioè a spiegare slittamenti semantici inaspettati dell’unità lessicale. Ad esempio, come si può spiegare il mutamento semantico di gr. t…qhmi (porre), lat. fecit (fare), ing. to do (fare e ausiliare interrogativo), sema regolare nelle corrispondenze fonologiche, ma non nel significato, appunto? O ancora come spiegare gr. m»thr, lat. mater, ing. mother, ted. Mutter, tutti semi lessicali con il significato di ‘madre’, ma alb. motrë ‘sorella’? Risale a Ferdinand de Saussure, autore del celebre Corso di linguistica generale (1913), non solo il concetto di totale arbitrarietà del segno, ma anche la definizione secondo cui il significato non è da intendersi come qualcosa di oggettivo e di esterno alla lingua e neppure come qualcosa che sta dentro la mente dell'uomo. De Saussure, nell'affermare che il significato si trova nella lingua e si può definire all'interno di essa, si basa su due principi: il carattere arbitrario del significato, appunto, e il fatto che ciascun significato viene definito solo in rapporto ad altri significati e pertanto nell'ambito di un sistema. Il campo semantico è un insieme di termini che hanno in comune un fattore semantico. In una lingua si formano degli insiemi di parole e di espressioni collegati fra loro sia per i significati sia per le forme e che è proprio in una stessa sfera concettuale che è possibile vedere quali siano i vari rapporti associativi che collegano i vari segni linguistici. Così i vocaboli e le espressioni che indicano le parti del corpo umano costituiscono un campo associativo. Ogni comunità linguistica possiede sfere concettuali stabili con denominazioni stabili ma, a causa del progresso e dell'evolversi delle idee, vi sono anche sfere concettuali che si modificano, mutando così anche le rispettive denominazioni. Ad ogni modo, se la tecnica e l'oggetto mutano, il nome originario continua a vivere come, ad esempio, per la penna d'oca che è stata sostituita prima dal pennino di acciaio, poi dalla stilografica e in seguito dalla penna a sfera e dal pennarello. In questo modo, adattando cioè il vecchio nome a nuovi usi e pertanto conferendogli altri significati, la lingua attua il principio di economia che risulta chiaro anche nella formazione di nuovi linguaggi settoriali. - Triangolo e campo linguistico: Nel cosiddetto "triangolo di Ogden e Richards", il concetto è che il rapporto tra il significante (sedia ad esempio) e il referente, cioè l'elemento non linguistico (l'oggetto "sedia") non è diretto ma è mediato dal significato (la nozione di sedia). I significati nei loro rapporti reciproci sono stati studiati da altri linguisti che hanno sviluppato altre teorie, come la teoria della concezione del campo linguistico sostenuta dal tedesco Jos Trier248 , autore del saggio Il lessico 248 Trier 1931. Vd. anche http://it.wikipedia.org/wiki/Semantica. 123 tedesco dell'ambito dell'intelletto. Secondo Trier tutti quei vocaboli che nel tedesco antico si riferiscono al mondo del pensiero, formano un insieme unitario, cioè un campo, nel cui interno il significato di ciascun vocabolo dipende dai significati dei vocaboli presenti nel campo. Se in un punto del campo avviene una perdita o l'acquisto di un vocabolo, tutto il campo ne risente perché esso risente di una gerarchia di valori ben definiti. Pertanto, nel corso della storia, il significato e l'uso dei vocaboli riguardanti le qualità intellettive dell'uomo cambiano in rapporto all'evolversi dell'ideologia e della cultura. Analisi semica: Un importante indirizzo degli studi moderni di semantica lessicale è l'analisi semica o componenziale. Questa analisi, utilizzando un metodo simile a quello usato nella fonologia, scompone il significato di una parola in elementi minimi. Se i fonemi si possono analizzare in tratti distintivi249: [consonante] [orale] [labiale] [sorda] /p/ [consonante] [orale] [labiale] [sonora] /b/ [consonante] [nasale] [labiale] [sonora] /m/ [consonante] [orale] [dentale] [sorda] /f/ [consonante] [orale] [dentale] [sonora] /d/ così una parola può esser analizzata nei suoi tratti semantici o sèmi: [animale] [ovino] [maschio] /montone/ [animale] [ovino] [femmina] /pecora/ [animale] [equino] [maschio] /stallone/ [animale] [equino] [femmina] /giumenta/ [umano] [adulto] [maschio] /uomo/ [umano] [adulto] [femmina] /donna/ [umano] [infantile] [maschio] /bambino/ [umano] [infantile] [femmina] /bambina/ Tale scomposizione può dare un contributo alla comprensione degli slittamenti semantici, soprattutto attraverso le figure retoriche (metafora, metonimia, sineddoche): 1) si ha una metafora quando avviene un mutamento semantico per la similarità dei significati: la gamba del tavolo e il braccio del lampadario derivano dalla gamba e dal braccio dell'uomo; 2) si ha invece una metonimia quando avviene un mutamento per contiguità dei significati come nel caso di coxa "anca" all'italiano coscia, per il fatto che anca e coscia sono due parti del corpo vicine tra di loro; 3) la sineddoche, cioè "la parte per il tutto" fa sì che certe parole vengano usate al posto di altre, come nel caso di focolare al posto di casa, poiché un tempo il focolare era una parte molto importante della casa. 249 http://it.wikipedia.org/wiki/Semantica 124 Considerando i cambiamenti diacronici del significato, invece, sono più imprevedibili e possono avvenire per restringimento o allargamento, per cause linguistiche, cause storiche o sociali, cause psicologiche, influsso straniero. Ad esempio, è tutto da spiegare lo slittamento dell’albanese motrë “sorella”, così come è emblematico lo slittamento del celtico cimbrico craid da “cuore” a “centro” (mentre calon è “cuore”). 4. b. Natural Semantic Metalanguage e i primitivi semantici Anna Wierzbicka, dell'università di Varsavia e Cliff Goddard dell’Università australiana della Nuova Inghilterra250, hanno teorizzato il metalinguaggio semantico naturale (NSM), una teoria linguistica e un metodo pratico, empirico e basato sull’analisi del significato. I linguisti della scuola di NSM definiscono primitivi semantici o semantic primes quei concetti semplici, indefinibili e universalmente lessicalizzati e li pongono alla base dell’analisi linguistica, insieme alla parafrasi riduttrice o reductive paraphrase (cioè la scomposizione di concetti complessi in concetti più semplici). La ricerca nel metodo NSM si occupa in maniera estesa sia del rapporto lingua/aspetti cognitivi, sia del rapporto lingua/cultura. I campi di ricerca chiave comprendono la semantica lessicale, la semantica grammaticale, la fraseologia e la pragmatica, e soprattutto la comunicazione trans-culturale (a crosscultural communication). Le lingue studiate nella struttura NSM includono inglese, russo, polacco, francese, spagnolo, il malay, il giapponese, il cinese, il coreano, l’ewe ed il cree orientale251, così come lo svedese252. Per quanto riguarda l’approccio della NSM, la ricerca dei primitivi semantici è al centro della ricerca nella semantica, il cui oggetto è stabilire se tali primitivi sono supposti essere rappresentati come parole nel linguaggio naturale253 o come simboli artificiali 254. Fino ad oggi, tentativi sistematici di determinare i primitivi semantici255 hanno focalizzato tre principi generali, che possono essere pensati come principi costitutivi operativi connessi con lo sviluppo di una forte teoria dei primitivi semantici256: Wierzbicka-Goddard 1994 e 2002. 2009. Pedersen 2010; vd. Anche il cap. Natural Semantic Metalanguage: The state of the art, in Goddard 2008, p.33sg. 253 Vd. Wierzbicka 1972, 1980, 1992, 1996; Weinreich 1980; Allan 1986; Goddard 1998 254 Vd. Katz e Fodor 1963; Kempson 1977 255 Wierzbicka-Goddard 1994a; Myhill 1996 256 Vd. Wierzbicka-Goddard 1994b e Wierzbicka 1994a e 1994b per la vasta discussione e l'applicazione su questi principi ad un'ampia varietà di primitivi proposti. 250 251 Heine-Narrog 252 125 a. I significati (meanings) possono essere definiti in termini di “insieme dei primitivi semantici”257. Poiché i primitivi semantici possono essere usati per definire il significato di ogni parola in qualunque lingua, questo significa che se una parola data in una lingua data non può essere definita usando l'insieme stabilito dei primitivi semantici, questa è la prova che un'altra parola, o altre parole, devono essere aggiunte a questo insieme. b. “Principio dei primitivi semantici” è che i primitivi semantici devono essi stessi essere indefinibili, cioè "non-scomponibili” (undefinable, undecomposable)258; se risulta che una determinata parola che è considerata un primitivo semantico può essere definita in sé usando le altre parole considerate essere primitivi semantici, allora questa parola dovrebbe essere rimossa dalla lista dei primitivi semantici. c. I primitivi semantici dovrebbero in teoria essere universali, e ciascuno dovrebbe essere rappresentato in ogni lingua ("ipotesi di forte lessicalizzazione”)259. C’è un altro principio che prosegue logicamente dalla struttura concettuale generale delle teorie dei primitivi semantici: se un'alternanza (alternation: alternanza o scambio) è condizionata da un significato lessicale definibile, questa è la prova che una o entrambe le parole alternate non riflettono i primitivi semantici (poiché il significato primitivo non può essere definito). D’altra parte, se c’è un'alternanza fra due o più parole che è condizionata dai fattori indipendenti dal significato lessicale, cioè, se è possibile scrivere una regola che rappresenta automaticamente l’alternanza senza riferimento ai significati delle parole stesse (facendo riferimento piuttosto, per esempio, a tempo, numero, presenza di complemento, tipo di complemento, cortesia, ecc.), allora questa è prova che questi due o più parole sono allolessemi (allolexes), riflettendo un singolo lessema ed è almeno possibile che questo singolo lessema corrisponda a un primitivo semantico. Questo è vero indipendentemente dallanatura dei fattori non-lessicali che governano l'alternanza, che possono essere collegati con il tempo e il numero, e che possono essere formali vs. informali. E ciò è anche vero senza riguardo della natura morfologica dell'alternanza, per cui le parole possono essere collegate da flessione, derivazione, o suppletivismo. Fin qui, i linguisti hanno focalizzato tipi relativamente semplici di alternanza allolessicale, riferendosi tipicamente a categorie familiari (familiar categories) quali la posizione, rapporti combinatori o di portmanteau, caso, tempo...260. Vd. Goddard 1994, p. 8, “Principi di analisi". Goddard 1994, p. 8. 259 Goddard 1994, p.13. 260 Vedi Wierzbicka 1998, Goddard 1999. 257 258 126 C’è inoltre una tendenza a riconoscere più rapidamente l’allolessia se coinvolge un rapporto morfologico trasparente. Tuttavia, le alternanze allolessicali possono essere più "nascoste" essendo governate da modelli automatici di una natura non familiare (automatic patterns of an unfamiliar nature) ed essendo rappresentate da suppletivismo, cioè la completa sostituzione della forma fonologica della radice (the complete replacement of the phonological form of the root). I dati di traduzione (translation data), permettono, e nei fatti obbligano, il linguista ad applicare sistematicamente questi principi. In tal modo una più dettagliata descrizione della natura dei primitivi semantici diventa possibile, in modo che si sappia prestare attenzione alle differenze fra le lingue piuttosto che alla loro “glossatura ” (glossing over) e mostra esattamente quali significati un primitivo può comprendere e quale può escludere, e quali parole in una data lingua e in quali circostanze servono come esponenti di un primitivo. I Primitivi semantici secondo Wierzbicka e Goddard (English exponents of semantic primitives)261: substantives I, YOU, SOMEONE, PEOPLE, SOMETHING/THING, BODY relational substantives KIND, PART determiners THIS, THE SAME, OTHER/ELSE quantifiers ONE, TWO, MUCH/MANY, SOME, ALL evaluators GOOD, BAD descriptors BIG, SMALL mental predicates THINK, KNOW, WANT, FEEL, SEE, HEAR speech SAY, WORDS, TRUE actions, events, movement, contact DO, HAPPEN, MOVE, TOUCH location, existence, possession, specification BE (SOMEWHERE), THERE IS, HAVE, BE (SOMEONE/SOMETHING) 261 Goddard 2008, p.33 127 life and death LIVE, DIE time WHEN/TIME, NOW, BEFORE, AFTER, A LONG TIME, A SHORT TIME, FOR SOME TIME, MOMENT space WHERE/PLACE, HERE, ABOVE, BELOW, FAR, NEAR, SIDE, INSIDE logical concepts NOT, MAYBE, CAN, BECAUSE, IF intensifier, augmentor VERY, MORE similarity LIKE/WAY (Goddard 2002, p.33) 128 Quando la Wierzbicka dichiara che DO, BECAUSE e GOOD, ad esempio, sono semantic primes, significa che il significato (the meanings) di queste parole è essenziale per spiegare i significati di numerose altre parole e costruzioni grammaticali, e che non possono da sole essere spiegate in modo circolare (they cannot themselves be explicated in a non-circular fashion). Lo stesso accade per altri esempi di semantic primes come: I, YOU, SOMEONE, SOMETHING, THIS, HAPPEN, MOVE, KNOW, THINK, WANT, SAY, WHERE, WHEN, NOT, MAYBE, LIKE, KIND OF, PART OF. Tutti questi termini identificano significati semplici ed intuitivamente intellegibili che si trovano nell’esperienza linguistica ordinaria, quotidiana262. Wierzbicka e Goddard, presentando tale teoria, delineano un insieme completo di concetti universali, così come sono emersi dalle indagini su grande scala attraverso una vasta gamma di lingue (from large-scale investigations across a wide range of languages) prese in esame. In base agli studi empirici trans-linguistici (empirical cross-linguistic studies), tali studi rivendicano la vecchia nozione di "unità psichica del genere umano" (the old notion of the "psychic unity of mankind"), mentre allo stesso tempo offrono una struttura per la descrizione rigorosa delle diverse lingue e culture. 263 In particolare gli autori, attraverso la teoria della semantica naturale del metalinguaggio264 hanno cercato di spiegare ad esempio come il verbo “dire” (to say) possa essere un primitivo semantico senza specificare esattamente quale dominio semantico esso riguardi. La ricerca empirica dimostra, tuttavia, che le parole che potrebbero essere prese intuitivamente come esponenti di to SAY in inglese (say), ebraico ('amar), giapponese (iu) e spagnolo (decir) molto frequentemente non si traducono tra loro, cosicché non è possibile semplicemente affermare “SAY-dire = 'amar =iu = decir”. Per riconciliare i dati di traduzione con una teoria del significato universale primitivo, è necessario presupporre un certo numero di casi di suppletivismi e di polisemia, i primi per rappresentare le alternanze automatiche, non basate sul significato (automatic, non-meaning-based alternations between allolexes) fra gli allolessemi che riflettono un singolo primitivo semantico, il secondo per rappresentare le alternanze basate sul significato tra lessemi differenti. L'analisi risultante è relativamente diretta e plausibile, benché alcuni aspetti di essa possano sembrare inizialmente sorprendenti, per esempio il fatto che “to tell” abbia due significati distinti (He tells a story vs. tell me what you want, ”raccontami una storia” vs “dimmi cosa vuoi”): “tell” nel secondo significato si alterna come “allolessema” con “say”, mentre “ask” può essere usato come esponente di SAY quando la frase che introduce è formalmente una domanda, un comando, ma pragmaticamente non funziona come una domanda. 262 Goddard, 263 2002, pp.33sg. Wierzbicka-Goddard 1994. 264 Wierzbicka 1972, 1980, 1994a e Wierzbicka-Goddard 1994, Goddard 1998. 129 4. c. Cross-linguistic semantics Goddard, nell’opera “Cross-linguistic semantics”265, indagando come le lingue archiviano ed esprimono i significati diversamente tra loro (how languages package and express meanings differently), si concentra su una ricerca linguistica che intende capire la natura del linguaggio umano. Questo insieme di studi esplora, dimostra e illustra la cross-linguistic semantics così come è praticata nella struttura semantica naturale di metalinguaggio (NSM), elaborata da Wierzbicka. I capitoli di apertura fanno una descrizione avanzata del modello di NSM e del suo stato dell’arte, propongono molte innovazioni teoriche ed avanzano un certo numero di analisi originali in relazione ai nomi e all’assegnazione dei nomi, frasi specifiche e discorsi anaforici (with names and naming, clefts, and other specificational sentences, and discourse anaphora). I capitoli successivi descrivono ed analizzano vari fenomeni in dieci lingue da famiglie, posizioni geografiche e impostazioni culturali multiple, in tutto il mondo (diverse phenomena in ten languages from multiple families, geographical locations, and cultural settings around the globe). Tre studi sostanziali documentano, attraverso l’osservazione empirica, come il metalinguaggio dei primitivi semantici del NSM possa essere realizzato in lingue di tipi ampiamente differenti: Amharico (Etiopia), Coreano e Cree orientale. Ciascuno costituisce un ritratto lessico-grammaticale in miniatura (lexicogrammatical portrait in miniature) della lingua considerata. Altri capitoli analizzano temi specifici quale “il possesso inalienabile” in Koromu (Papuasia Nuova Guinea), verbi epistemici nello svedese, iperpolisemia nel Bunuba (Australia), l'espressione della momentaneità (expression of "momentariness") nel Berbero, l’etnogeometria nel Makasai (Timor Est), concetti di “valore” in Russo e “emozioni” in giapponese. Malay Spanish Yankunytjatjara DO THINK buat fikir hacer pensar palyani kulini Ewe wò WANT GOOD mahu baik querer bueno mukuringanyi palya súsú bu dí nyó BECAUSE IF sebab kalau porque si: nguru tjinguru ta úti né Japanese suru omou hosii -tai ii kara moshi+ -ba Tab. 2: Exponents of a selection of semantic primes in five unrelated languages (in WierzbickaGoddard 2006, p.4). 265 Goddard 2008. 130 Anche Goddard con semantic primes intende quindi “concetti universalmente significativi (universally meaningful concepts), ma per essere messaggi o affermazioni significative, tali concetti si devono combinare in un senso che essi stessi esprimano un significato. Tali combinazioni significative, nella loro forma più semplice come nelle frasi, costituiscono la sintassi della lingua. La Wierzbicka fornisce infatti la prova che solo per il fatto che tutte le lingue usano lo stesso insieme di primitivi semantici, essi usano anche la stessa, o molto simile, sintassi. La linguista dichiara inoltre266: "Sto presupponendo determinate regole innate ed universali di sintassi, non nel senso di una certa sintassi convenzionale intuitiva non verificabile “alla Chomsky”, ma nel senso di modelli intuitivi verificabili che determinano combinazioni possibili di concetti primitivi”. Ad esempio, confrontando la frase inglese "I want to do this" "Voglio fare questo", con il relativo equivalente in Russo: anche se nota determinate differenze formali fra le due strutture di frase, la loro equivalenza semantica emerge dall’ "equivalenza degli stessi primitivi e dalle regole per la loro combinazione." ("....equivalence of the primitives themselves and of the rules for their combination.") Questo lavoro sui cross-linguistic studies ha condotto a un insieme di proposte altamente concrete circa il supposto centro irriducibile (universal core) di tutte le lingue umane. Questo centro universale è ritenuto avere un carattere completamente linguistico (a fully ‘language-like’ character) `nel senso che consiste di un lessico di primitivi semantici insieme a una sintassi che governa come i primitivi possano essere uniti (it consists of a lexicon of semantic primitives together with a syntax governing how the primitives can be combined)267. Potrebbe sembrare non particolarmente sorprendente il fatto che tutti gli esseri umani oggi possiedano un comune centro linguistico di primitivi semantici ed una più o meno universale sintassi (not particularly surprising that all humans today possess a common language core of semantic primes and a more or less universal syntax): è difficile dare una risposta assoluta in proposito, ma certamente la prospettiva cross-linguistic sta destando grande interesse e pone interrogativi importanti sull’origine del linguaggio e delle lingue storiconaturali. Questo studio ha l’obiettivo di essere di supporto ai linguisti che lavorano sulla descrizione del linguaggio, ma anche sulla semantica del lessico (lexical semantics), o sulla semantica della grammatica (or the semantics of grammar), per gli studenti avanzati di linguistica e per altri interessati agli universali linguistici e alla diversità del linguaggio (in language universals and language diversity). 266 Wierzbicka 1996: "I am also positing certain innate and universal rules of syntax-not in the sense of some intuitively unverifiable formal syntax a la Chomsky, but in the sense of intuitively verifiable patterns determining possibl e combinations of primitive concepts)”. 267 Goddard 1998. 131 Goddard stesso afferma che questo metodo può avere applicazioni nella comunicazione interculturale, nella lessicografia (creazione di dizionari), nella didattica delle lingue, nello studio e nell’acquisizione del linguaggio del bambino, nella semantica legale e così via (The method has applications in intercultural communication, lexicography (dictionary making), language teaching, the study of child language acquisition, legal semantics, and other areas). Si segnala inoltre che è in via di pubblicazione un ulteriore nuovoo studio di Goddard “Towards a systematic table of semantic elements”, che sicuramente rivelerà un nuovo approccio combinato tra tipologia, comparazione linguistica e semantica. 4. d. Semantica computazionale La semantica computazionale268 si propone l’obiettivo di automatizzare il processo di costruzione e ragionamento con l'ausilio di rappresentazioni del “significato di espressioni” in linguaggio naturale. Essa gioca un ruolo importante nell'elaborazione nella linguistica computazionale. Alcuni argomenti tradizionali d’interesse sono: la costruzione di rappresentazioni di significato, l'anafora, la risoluzione di quantificatori. L'elaborazione del linguaggio naturale, detta anche NLP (Natural Language Processing), è il processo di trattamento automatico mediante un calcolatore elettronico delle informazioni scritte o parlate nel linguaggio umano o naturale. Questo processo è reso particolarmente difficile e complesso a causa delle caratteristiche intrinseche di ambiguità del linguaggio umano. Per questo motivo il processo di elaborazione viene suddiviso in fasi diverse, tuttavia simili a quelle che si possono incontrare nel processo di elaborazione di un linguaggio di programmazione: -analisi lessicale: scomposizione di un'espressione linguistica in token (in questo caso le parole; - analisi grammaticale: associazione delle parti del discorso a ciascuna parola nel testo; - analisi sintattica: arrangiamento dei token in una struttura sintattica (ad albero: parse tree); - analisi semantica: assegnazione di un significato alla struttura sintattica e, di conseguenza, all'espressione linguistica. In teoria, l'elaborazione del linguaggio naturale è un metodo d’interazione uomo-macchina. I primi sistemi sviluppati, quali SHRDLU, che lavoravano in "mondi a blocchi" con vocabolari ristretti, ottenevano ottimi risultati. Ciò portò i ricercatori a un eccessivo ottimismo, che presto venne meno non appena i sistemi furono estesi a situazioni più realistiche con problemi reali di ambiguità e complessità, di diversità di significato dovuti al contesto. La comprensione del linguaggio naturale è spesso considerata un 268 Chiari 2007. 132 problema di Intelligenza Artificiale, poiché si pensa che il riconoscimento del linguaggio richieda una conoscenza estesa del mondo e una grande capacità di manipolarlo. Per questa ragione, la definizione di "comprensione" è uno dei maggiori problemi dell'elaborazione del linguaggio naturale. L'analisi semantica è l'attività di assegnazione di un significato, di un senso, alla struttura sintattica corretta e, di conseguenza, all'espressione linguistica. I significati, ovvero i sensi, spesso sono rappresentati tramite synset, cioè set di sinonimi, collezioni di sinonimi, un insieme di sinonimi che possono essere descritti da un'unica definizione, perché esprimono uno stesso senso. La stessa parola si può trovare quindi in diversi synset se ha diversi sensi (significati). Aggregando i sinonimi attorno al loro significato, non si ha la ridondanza che si avrebbe associando a ogni parola tutti i suoi sinonimi. A volte le diverse varianti sinonimiche possono dipendere da diversi fattori diafasici, diastratici o diatopici. Un synset definisce un concetto noto all'uomo e classificato in una gerarchia di concetti. Un concetto può essere espresso tramite una o più parole, note come lessicalizzazioni. Un esempio di Synset dipendente da fattori diatopici diversi è il seguente: - tapparella (Nord Italia), avvolgibile (Sud Italia), persiana (Centro Italia) - Rolling shutter (Inglese) Definizione: Sistema di chiusura per finestre composto di asticelle orizzontali (profili) che scorrono lungo guide verticali. Attribuendo ai vari synset i codici univoci, si possono classificare i concetti in una struttura reticolare con le relazioni, detta ontologia, ed arrivare a traduzione automatica che permette di passare da una lessicalizzazione ad un'altra. Ad esempio: - CANE (animale domestico, animale a 4 zampe, canide, mammifero) - Hund (tedesco) - dog (inglese) Le relazioni principali usate in un'ontologia per caratterizzare i concetti rappresentati sono IS-A (iperonimia), e PART-OF (meronimia). Possono tuttavia essere usati molti altri tipi di relazioni: - zampa PART-OF cane - cane IS-A mammifero - cane IS-A animale domestico Il synset giustifica l’accostamento di due lessemi aventi significante diverso ma uguale significato, anche tra lingue diverse. 133 Classificazione semantica: Le relazioni semantiche variano in funzione del tipo di parola. Nel caso dei sostantivi si ha: - iperonimia (hyperonyms): Y è un iperonimo di X se ogni X è "una specie di" Y; - iponimia (hyponyms): Y è un iponimo di X se ogni Y è (una specie di) X; - coordinazione: Y è un termine coordinato di X se X e Y hanno un iperonimo in comune; - olonimia (holonym): Y è un olonimo di X se X è parte di Y; - meronimia (meronym): X è un meronimo di Y se X è parte di Y. Nel caso dei verbi si verifica: - iperonimia (hypernyms): il verbo Y è un iperonimo del verbo X se l'attività X è (una specie di) Y (come viaggio rispetto a movimento); - troponimia (troponyms): il verbo Y è un troponimo del verbo X se nel fare l'attività Y si fa anche la X (come mormorare rispetto a parlare); - implicazione (entailment): il verbo Y è un'implicazione del verbo X se nel fare X uno deve per forza fare Y (come russare rispetto a dormire); - coordinazione: Y è un termine coordinato di X se X e Y hanno un iperonimo in comune. Riguardo agli aggettivi, essi sono classificati come: nomi relativi, “simile a”, participi dei verbi, mentre gli avverbi seguono la classificazione dell'aggettivo da cui derivano. In semantica si ha ambiguità fonetica quando significati diversi coincidono nel medesimo significante. Sono segni linguistici diversi fra loro ma che casualmente si trovano ad avere lo stesso significante: se hanno in comune la grafia, si chiamano omografi, se hanno in comune la realizzazione fonematica (il suono) si dicono omofoni. Il funzionamento del codice linguistico è garantito dalla diversità dei significanti, in rapporto tra loro in base al principio di interrelazione oppositiva. Un esempio di omonimia/omofonia è sole che è sia il sostantivo maschile che indica l'astro, sia l'aggettivo femminile plurale che indica due persone senza compagnia (es: due donne sole), oppure, in lingua inglese, two lips (due labbra) e tulips (tulipani), che hanno approssimativamente lo stesso suono. L'ambiguità lessicale riguarda il contenuto concettuale del singolo lessema: ad esempio la parola acuto indica in italiano sia una persona intelligente che un suono di timbro superiore alla norma. Tipi di ambiguità lessicale semantica sono la cosiddetta ambiguità complementare (o polisemia) e l'ambiguità contrastiva (o omonimia). Nel primo caso, i diversi significati del lessema sono comunque legati, o fanno parte di domini affini, nel caso dell'omonimia invece si tratta di due lessemi differenti che per diverse controversie etimologiche sono venuti a coincidere nella loro forma 134 grafica/fonetica. La risoluzione automatica dell'ambiguità delle parole prende il nome di disambiguazione269. Si ha ambiguità sintattica o strutturale quando una frase può avere interpretazioni sintattiche, da cui derivano significati diversi. Ad esempio: “Chiara ha visto Luca in giardino con il cannocchiale” (chi aveva il cannocchiale? Luca o Chiara?); oppure: “Una vecchia legge la regola” (chi è il soggetto? qual è il verbo? si tratta di un'anziana signora che legge una norma oppure di una 'situazione', qui sottintesa, regolamentata da un'antica legge?). L’ambiguità pragmatica si verifica quando l'intenzione comunicativa viene recepita dal destinatario secondo una funzione dominante diversa, per cui si ha un fraintendimento relativo alla struttura dominante di un messaggio. Ad esempio la frase "Se Totti non gioca, l’Italia perderà il Mondiale" può essere vista sia come emotiva, ovvero la presenza del giocatore è fondamentale psicologicamente per i tifosi, sia come referenziale. CONCLUSIONI: Tutti questi studi volti ad automatizzare il linguaggio umano trasformandolo in linguaggio macchina, permettono di comprendere meglio il suo funzionamento, così come la creazione dell’Intelligenza Artificiale ha permesso di comprendere meglio il funzionamento del cervello umano. I cross-linguistic studies che stanno prendendo piede in questi ultimi anni, supportando l’Indoeuropeistica e la Linguistica comparativa tradizionale, correlando lo studio del cambiamento linguistico (diacronico e sincronico) con la relazione genetica tra lingue e coinvolgendo fonetica, morfologia, semantica e lessico, sono di fondamentale interesse per superare i limiti dei modelli teorici attuali e per aprire nuove prospettive e sviluppi futuri per la comprensione del linguaggio umano, la sua origine e il suo funzionamento. 269 Navigli 2009. Vd. anche http://it.wikipedia.org/wiki/Ambiguit%C3%A0. 135 RIFERIMENTI BIBLIOGRAFICI Agostiniani 1995 L. Agostiniani, Sui numerali etruschi e sulla loro rappresentazione grafica, Firenze, 1995 Agostiniani 1998 L. Agostiniani, Sull’origine del nome del vino in Etrusco e in altre lingue dell’Italia antica, Firenze, 1998 AikhenvaldDixon 2001 A. Y. Aikhenvald, R. M. W. Dixon, "Introduction", in R. M. W. Dixon, A.Y. Aikhenvald, Areal Diffusion and Genetic Inheritance: Problems in Comparative Linguistics, Oxford Linguistics, Oxford: Oxford University Press, pp. 1–22, 2001 Albatineh et alii 2006 A.N. Albatineh, M. Niewiadomska-Bugaj, D. Mihalko, “On similarity indices and correction for chance agreement”, Journal of Classification 23, pp. 301-313, 2006 Alinei 1996-2000 M.Alinei, Origine delle lingue d’Europa, I-II 1996-2000 Anttila 1989 R. Anttila, Historical and Comparative Linguistics, Amsterdam, 1989 Atkinson 2005 Q. Atkinson, G. Nichols, D. Welch, R. Gray, “From words to dates: water into wine, mathemagic, or phylogenetic inference?”, Transactions of the Philological Society 103, pp. 193219, 2005 Baxter- Ramer 1999 W.H. Baxter, A. M. Ramer, "Beyond lumping and splitting: Probabilistic issues in historical linguistics.", 1999 [http://www.nostratic.ru/books/(270)beyond-lumping-andsplitting.pdf] Bakker 2008 D. Bakker, “LINFER: inferring implications from the WALS database”, STUF 61-3, pp. 186-198, 2008 Balaresque et alii 2010 P. Balaresque, G. Bowden, S. Adams, H-Y Leung, T. King, et alii, A Predominantly Neolithic Origin for European Paternal Lineages. PLoS Biol 8(1): e1000285.doi:10.1371/ journal.pbio.1000285, 2010 136 Beekes 1995 R.P. Beekes, Comparative Indo-European Linguistics. Amsterdam: John Benjamins, 1995 Bengston 1986 J.D. Bengston, “Toward Global Sound Correspondences,” ms. 1987, “Notes on Indo-European ‘10,’ ‘100,’ and ‘1,000,’ ” Diachronica, 4, pp. 257–62, 1986 Bengston 1991a J.D. Bengston, “Notes on Sino-Caucasian,” in Vitaly Shevoroshkin, ed., Dene-Sino-Caucasian Languages, Bochum, Germany, pp. 67–129, 1991 Bengston 1991b J.D. Bengston, “Some Macro-Caucasian Etymologies,” in Vitaly Shevoroshkin, Dene-Sino-Caucasian Languages. Bochum, Germany, pp. 130–41, 1991 Bengston- Ruhlen 1994 J.D. Bengston, M. Ruhlen, Global Etymologies. In M. Ruhlen, On the Origin of Languages: Studies in Linguistic Taxonomy. Stanford, CA: Stanford University Press, 1994 Benveniste 1962 E. Benveniste, Origine de la formation des noms en indo-europèen, Paris, 1962 Bergsland-Voigt 1962 K. Bergsland, H. Vogt, “On the validity of glottochronology”, Current Anthropology, 3, pp. 115–153, 1962 Benveniste 1969 E. Benveniste, Le vocabulaire des institutions indo-européennes. 1. economie, parenté, societé; 2. pouvoir, droit, religion, Paris, 1969 Blevins 2004 J. Blevins, Evolutionary Phonology: The Emergence of Sound Patterns, Cambridge: Cambridge University Press, 2004 Blust 2000 R. Blust, “Why lexicostatics doesn’t work: the ‘universal constant’ hypothesis and the Austronesian languages”. In Time depth in historical linguistics, 2000 Bomhard 2008 A. R. Bomhard, Reconstructing Proto-Nostratic: Comparative Phonology, Morphology, and Vocabulary, 2 volumes. Leiden: Brill, 2008 137 Bopp 1816 F. Bopp, Über das Conjugationssystem der Sanskritsprache in Vergleichung mit jenem der griechischen, lateinischen, persischen und germanischen Sprache. Frankfurt-am-Main: Andreäischen Buchhandlung, 1816 Brugmann 1878 K. Brugmann, Preface to the first issue of Morphologische Untersuchungen auf dem Gebiete der indogermanischen Sprachen. Leipzig: S. Hirzel. (Prefazione firmata H. Osthoff e K. Brugmann ma scritta dal solo Brugmann), 1878 Brugmann 1884 K. Brugmann, “Zur Frage nach den Verwandtschaftsverhältnissen der indogermanischen Sprachen”, Internationale Zeitschrift fur allgemeine Sprachwissenschaft 1, pp. 226-256, 1884 BrugmannDelbrück 18861893 K. Brugmann, B. Delbrück, Grundriß der vergleichenden Grammatik der indogermanischen Sprachen, (8 voll.) Strassburg: Trübner, 1886-1893 Bynon 1977 T. Bynon, Historical Linguistics, Cambridge, 1977 Caldwell 1856 R. Caldwell, A Comparative Grammar of the Dravidian or SouthIndian Family of Languages. London: Harrison, 1856 Campanile 1990 E. Campanile, La ricostruzione della cultura Indoeuropea, Pisa, 1990 Campanile et alii 2005 E. Campanile, C. Bernard, W. Calvert, Introduzione alla lingua e alla cultura degli Indoeuropei, Il Mulino, 2005 Campbell 1986 L. Campbell, “Cautions about Loan Words and Sound Correspondences,” in D. Kastovsky e A. Szwedek, Linguistics across Historical and Geographical Boundaries, Berlin, pp.221–24, 1986 Campbell 1988 L. Campbell, Review of Language in the Americas, by Joseph H. Greenberg, Language 64, pp. 591–615, 1988 Campbell 2001 L. Campbell, "Beyond the Comparative Method" in B.J. Blake, K. Burridge, J.Taylor, Historical Linguistics, 2001 (15th International Conference on Historical Linguistics), Melbourne, 13–17 August 2001 138 Campbell 2004 L. Campbell, Historical Linguistics: An Introduction, Cambridge, Massachusetts, 20042 (19991) Campbell-Harris 1995 L. Campbell, A.C. Harris, Historical syntax in cross-linguistic perspective. Cambridge: Cambridge University Press. [Winner of the Leonard Bloomfield Book Award, 1998] Campbell –Poser 2008 L. Campbell, J. W. Poser, Language Classification: History and Method, Cambridge: Cambridge University Press, 2008 Castellani 2001 A. Castellani, Grammatica storica della lingua italiana, Bologna, 2001 Chiari 2007 I. Chiari, Introduzione alla linguistica computazionale, Bari, 2007 Chierchia 1997 G. Chierchia, Semantica, Bologna, 1997 ChierchiaMcConnel-Ginet 1991 G. Chierchia, S. McConnel-Ginet, Meaning and Grammar, Cambridge, 1991; trad. it. Significato e grammatica, Padova, 1993 Chretien 1962 D. Chretien, “The mathematical models chronology”, Language 38, pp. 11–37, 1962 Ciancaglini 2005 C. A. Ciancaglini, How to prove genetic relationships among languages: the cases of Japanese and Corean", Università La Sapienza, Roma, 2005 Clifton 2002 J. Clifton, LINGUIST List 13.491: Review of Kessler 2001, 2002 Comrie 1989 B. Comrie, Language universals and linguistic typology: Syntax and morphology. Oxford: Blackwell, 19892 Croft-DenningKemmer 1990 W. Croft, K. Denning, S. Kemmer, Studies in typology and diachrony. For J.H. Greenberg, Amsterdam-Philadelphia, 1990 Croft 2002 W. Croft, Typology and universals, Cambridge, 20022 of glotto- 139 Croft-Cruse 2004 W. Croft, D. A. Cruse, Cognitive Linguistics, Cambridge, 2004 Curnow 2001 J. T. Curnow, “What language features can be ‘borrowed’?” In Areal diffusion and genetic inheritance, A. Y. Aikhenvald, R.M.W. Dixon, pp. 412–436. Oxford: Oxford University Press, 2001 Cysouw 2005 M. Cysouw, Quantitative methods in typology. Quantitative linguistics: an international handbook, ed. by Gabriel Altmann, Reinhard Köhler and R. Piotrowski. Berlin: Mouton de Gruyter, 2005 Delbrück 1884 B. Delbrück, Einleitung in das Sprachstudium, Leipzig: Breitkopf und Härtel, 18842 Delbrück 1904 B. Delbrück, Einleitung in das Studium der indogermanischer Sprachen, 4th and renamed edition of Einleitung in das Sprachstudium, 1880, Leipzig: Breitkopf und Härtel, 1904 DerbyshirePullum 1991 D.C. Derbyshire, G.K. Pullum, Handbook of Amazonian Languages, Vol. 3. Berlin, 1991 Dolgopolsky 1964-1986 A. Dolgopolsky, “Gipoteza drevnejˇsego rodstva jazykovyx semei severnoj Eurasii s verojatnostnoj toˇcki zrenija,” Voprosy Jazykoznanija 2, pp. 53–63, 1964 [trad Ing. in V.V. Shevoroshkin e T. L. Markey, Typology, Relationship and Time, 1986, Ann Arbor, Mich., 27–50.] Dryer 1992 M. S. Dryer, “The Greenbergian word order correlations”. Language 68, pp. 81-138, 1992 Dryer 2005 M. S. Dryer, “Genealogical language list”. In: Haspelmath et al. 2008, pp. 584-643, 2005. Dyen 1962 I. Dyen, “The Lexicostatistically Determined Relationship of a Language Group” International Journal of American Linguistics 28/3, 1962 Dyen 1963 I. Dyen, “Lexicostistically Determined Borrowing and Taboo”, Language 39, pp. 60-66, 1963 140 Dyen et alii 1967 I. Dyen, A.T. James, J.W.L. Cole, “Language divergence and estimated word retention rate”, Language 43, pp. 150–171, 1967 Dyen 1973a I. Dyen, “Lexicostatistics in Genetic Linguistics”, The HagueMouton, 1973 Dyen 1973b I. Dyen, Lexicostatistics in genetic linguistics: Proceedings of the Yale conference, April 3–4, 1971, La Haye- Mouton, 1973 Dyen et alii 1992 I. Dyen, J. Kruskal, e P. Black, “An Indoeuropean Classification, a Lexicostatistical Experiment”, Transactions of the American Philosophical Society 82/5, 1992 Eco 1993 U. Eco, The search for the perfect language, 1993 Embleton 1986 S. Embleton, Statistics in Historical Linguistics, Bochum, 1986 Embleton 1992 S. Embleton, “Historical Linguistics: Mathematical concepts”. In W. Bright (Ed.), International Encyclopedia of Linguistics, p. 131, 1992 Embleton 1995 S. Embleton, Review of ‘An Indo-European classification: A lexicostatistical experiment’ by I. Dyen; J.B. Kruskal & P.Black. TAPS Monograph 82-5, Philadelphia. In Diachronica 122/1992, pp. 263–68, 1995 Esterhill 2000 F. Esterhill, Interlingua Institute: A History, New York, 2000 Fanciullo 2007 F. Fanciullo, Introduzione alla Linguistica Storica, Bologna, 2007 Ferrari 2005 G. Ferrari, “La ricerca in Linguistica Computazionale tra modelli formali ed analisi empirica”, in G. Marotta (ed.), Atti del Convegno di Studi in memoria di Tristano Bolelli, in Studi e Saggi Linguistici, XL-XLI (2002-2003), Pisa, pp. 101-119, 2005 141 Fleming 20002001 H.C. Fleming, "Joseph H. Greenberg: A tribute and an appraisal" Mother Tongue: The Journal 6, pp. 9-28, 2000-2001 Fromkin 1973 V.A. Fromkin, Speech Errors as Linguistic Evidence, The HagueMouton, 1973 Georg - Vovin 2003 S. Georg; A. Vovin,. "From Mass Comparison to Mess Comparison: Greenberg's "Eurasiatic" Theory". Diachronica (20:2), pp. 331–362, 2003 Goddard 1979 I. Goddard, “The Languages of South Texas and the Lower Rio Grande,” in Lyle Campbell and Marianne Mithun, eds., The Languages of Native America: Historical and Comparative Assessment, Austin, pp. 355–89, 1979 Goddard 1998 C. Goddard, Semantic Analysis: A practical introduction. Oxford. Oxford University Press, 1998 Goddard 2002 C. Goddard, “The search for the shared semantic core of all languages”. In C. Goddard e A. Wierzbicka, Meaning and Universal Grammar - Theory and Empirical Findings. Volume I, pp. 5–40, Amsterdam: John Benjamins. 2002 [http://www.une.edu.au/lcl/nsm/pdf/Goddard_Ch1_2002.pdf] Goddard 2006 C. Goddard, Ethnopragmatics-Understanding discourse in cultural context, Berlin-Mouton de Gruyter, 2006 Goddard 2008 C. Goddard, Cross-Linguistic University, 2008 Golla 1984 V. Golla, The Sapir-Kroeber Correspondence, Berkeley, Calif, 1984 Goldstein 1980 L. Goldstein, Categorical features in speech perception and production. Journal of the Acoustical Society of America 67, pp.1336-1348, 1980 Gordon 2005 R. G. Gordon Jr., Ethnologue, 15° ed., SIL International, 2005 [www.ethnologue.com] Semantics, New England 142 Gordon 2009 M. Gordon, "Week 3: Comparative method and linguistic reconstruction" (pdf). Department of Linguistics, University of California, Santa Barbara. Retrieved 22 December 2009 Graffi-Scalise 2002 G. Graffi, S. Scalise, Le lingue e il linguaggio. Introduzione alla linguistica, Bologna, 2002 Grandi 2010 N. Grandi, Fondamenti di tipologia linguistica, Roma, 2003, rist. 2010 Gray-Atkinson 2003 R.D. Gray, Q.D. Atkinson, “Language-tree divergence times support the Anatolian theory of Indo-European origin”, Nature, 426, 2003 Greenberg 1955 J. H. Greenberg, Studies in African Linguistic Classification. New Haven: Compass Publishing Company. (Photo-offset reprint of eight articles published in the Southwestern Journal of Anthropology from 1949 to 1954, with minor corrections.), 1955 Greenberg 1957 J. H. Greenberg, Essays in Linguistics, Chicago: University of Chicago Press, 1957 Greenberg 1960 J. H. Greenberg, "The general classification of Central and South American languages." In Selected Papers of the Fifth International Congress of Anthropological and Ethnological Sciences, 1956, edited by Anthony F.C. Wallace, 791-94. Philadelphia publisher=University of Pennsylvania Press. (Rist. in Greenberg 2005, pp. 59-64), 1960 Greenberg 1963 J. H. Greenberg, The Languages of Africa. Bloomington: Indiana University Press. The Hague by Mouton & Co., 1963 (1966; 1970). Greenberg 1971 J. H. Greenberg, "The Indo-Pacific hypothesis." Current Trends in Linguistics, Volume 8: Linguistics in Oceania, edited by Thomas F. Sebeok, 807-871. The Hague-Mouton, 1971 (Reprinted in Greenberg 2005) 143 Greenberg 1978 J. H. Greenberg, “Diachrony, synchrony and language universals”, in: J. H. Greenberg, C. A. Ferguson, E. A. Moravcsik, Universals of Human Language, Vol. III: Word Structure. Stanford University Press, pp. 47-82, 1978 Greenberg 1987 J. H. Greenberg, Language in the Americas, Stanford: Stanford University Press, 1987 Greenberg 1990 J.H. Greenberg, "The American Indian language controversy", Review of Archaeology 11, pp. 5-14, 1990 Greenberg 1993 J. H. Greenberg. "Observations concerning Ringe's 'Calculating the factor of chance in language comparison". Proceedings.vol. 137. No 1 (mar., 1993) American Philosophical Society. pp. 79–90 [http://www.jstor.org/pss/986946] Greenberg 2000 J. H. Greenberg, Indo-european and its closest relatives, 1. Grammar; Stanford: Stanford University Press, 2000 Greenberg 2002 J. H. Greenberg, Indo-European and Its Closest Relatives: The Eurasiatic Language Family, Volume 2: Lexicon. Stanford: Stanford University Press, 2002 Greenberg 2005 J. H. Greenberg, Genetic Linguistics: Essays on Theory and Method, edited by William Croft. Oxford. Oxford University Press, 2005 Gudschinsky 1956 S. Gudschinsky, “The ABC's of lexicostatistics (glottochronology)”, in Word, 12, pp. 175–210, 1956 Haak et alii 2005 Wo. Haak, O. Balanovsky, J.J. Sanchez, S. Koshel, V. Zaporozhchenko, C.J. Adler, C. S. I. Der Sarkissian, G.Brandt, C.Schwarz, N.Nicklisch, V.Dresely, B.Fritsch, E. Balanovska, R. Villems, H. Meller, K.W. Alt, Alan Cooper, Ancient DNA from European Early Neolithic Farmers Reveals Their Near Eastern Affinities [http://www.plosbiology.org/article/info%3Adoi%2F10.1371%2Fj ournal.pbio.1000536] 144 Haspelmath 2004 M. Haspelmath, “On directionality in language change with particular reference to grammaticalization. In Up and down the cline: The nature of grammaticalization”, Loanword typology 19, 2004 [http://en.wikipedia.org/wiki/Loanword] Haspelmath et alii 2005 M. Haspelmath, "Indefinite Pronouns" In: M. Haspelmath, M. S. Dryer, D. Gil, B. Comrie, The World Atlas of Language Structures. Oxford: Oxford University Press, pp. 190-193, 2005 [http://wals.info/chapter/46] HaspelmathSiegmund 2006 M. Haspelmath, S. Siegmund, "Simulating the replication of some of Greenberg’s word order generalizations", Linguistic Typology 10.1, pp. 74-82, 2006 [http://wwwstaff.eva.mpg.de/~haspelmt/Replication.pdf] Haspelmath 2008 M. Haspelmath, "Loanword typology: Steps toward a systematic cross-linguistic study of lexical borrowability". In: Thomas Stolz, Dik Bakker & Rosa Salas Palomo (eds.) 2008. Aspects of language contact: New theoretical, methodological and empirical findings with special focus on Romancisation processes. Berlin: Mouton de Gruyter, pp. 43-62, 2008 [http://wwwstaff.eva.mpg.de/~haspelmt/LWT.pdf] Haspelmath et alii 2008 M. Haspelmath, M.S. Dryer, D. Gil and B. Comrie, The World Atlas of Language Structures Online. Munich: Max Planck Digital Library, 2008. http://wals.info/( e Oxford University Press, 2005?) Haspelmath (in pubbl.) M. Haspelmath "The typological database of the World Atlas of Language Structures." To appear in: M. Everaert, S. Musgrave, The use of databases in cross-linguistic studies (Empirical Approaches to Language Typology, 41), Berlin: Mouton de Gruyter [http://wwwstaff.eva.mpg.de/~haspelmt/WALSdatabase.pdf] Haugen 1950 E. Haugen, “The analysis of linguistic borrowing”, Language 26, pp. 210–231, 1950 Heine- Kuteva 2002 B. Heine, T. Kuteva, World lexicon of grammaticalization, Cambridge: Cambridge University Press, 2002 145 Heine- Narrog 2009 B. Heine, H. Narrog, The natural semantic metalanguage approach, The Oxford Handbook of Linguistic Analysis, Oxford: Oxford University Press, 2009 Hock 1991 H.H. Hock,. Principles of Historical Linguistics, Berlin, 1991 (19861) Hock- Brian 1996 H. H. Hock, D. J. Brian, Language History, Language Change, and Language Relationship: An Introduction to Historical and Comparative Linguistics. Berlin: Mouton de Gruyter. 1996 Hock-Joseph 1996 H.H. Hock, B.D. Joseph, Language History, Language Change, and Language Relationship: an Introduction to Historical and Comparative Linguistics, Berlin: Mouton de Gruyter, 1996 Hoel-Port-Stone 1971 P.G. Hoel, S.C. Port, C.J. Stone, Introduction to Probability Theory. Boston (MA): Houghton Mifflin, pp. 56-57 Hoenigswald 1965 H. Hoenigswald, Language change and linguistic reconstruction, Chicago: University of Chicago Press, 1965 Hoijer 1956 H. Hoijer, “Lexicostatistics: A critique”, Language, 32, pp. 49– 60, 1956 Holm 2007 H.J. Holm, “The new Arboretum of Indo-European "Trees". Can New Algorithms Reveal the Phylogeny and Even Prehistory of Indo-European?” Journal of Quantitative Linguistics, vol. 14, pp. 167–214, 2007 Holm 2008 H.J. Holm, The Distribution of Data in Word Lists and its Impact on the Subgrouping of Languages. In: C. Preisach, H. Burkhardt, L.Schmidt-Thieme, R. Decker (eds.): Data Analysis, Machine Learning, and Applications. Proc. of the 31st Annual Conference of the German Classification Society (GfKl), University of Freiburg, March 7-9, 2007. Springer-Verlag, Heidelberg-Berlin, 2008 Holman et alii 2007 E. W. Holman, S. Wichmann, C. Schulze, D. Stauffer, “On the relation between structural diversity and geographical distance among languages: Observations and computer simulations”, Linguistic Typology 11(2), pp. 393-422, 2007 146 Holman-Brown et alii 2008 a E. W. Holman, C. H. Brown, S. Wichmann, V. Velupillai, “Automated classification of the world’s languages: A description of the method and preliminary results”. STUF Sprachtypologie und Universalienforschung -Language Typology and Universals, 61(4), pp. 285–308, 2008 Holman-Brown et alii 2008 b E. W. Holman, C. H. Brown, S. Wichmann, V. Velupillai, A. Müller, D. Bakker, Explorations in automated lexicostatistics. Folia Linguistica 42.2, pp. 331-354, 2008 [http://email.eva.mpg.de/~wichmann/AutomatedLanguage Classification.pdf) http://email.eva.mpg.de/.../ExplorationsAutomated LexicostatisticsTalk.ppt] e Holman -Brown et alii 2009 E.W. Holman, C. H. Brown, D. Bakker, A. Müller, V. Velupillai, S. Wichmann, , P. Brown, D. Egorov, R. Mailhammer, A. Grant, “Adding typology to lexicostatistics: a combined approach to language classification”, Linguistic Typology 13, pp. 167-179, 2009 Holman-Brown et alii 2010a E.W. Holman, C. H. Brown, S. Wichmann, , A. Müller, V. Velupillai, P. Brown, S. Sauppe, O. Belyaev, M. Urban, Z. Molochieva, A. Wett, D. Bakker, J.-M. List, D. Egorov, R. Mailhammer, D. Beck, H. Geyer,, ASJP World Language Tree of Lexical Similarity, Version3 (July 2010) [http://email.eva.mpg.de/~wichmann/WorldLanguageTree003.pdf] Holman-Brown et alii 2010b E.W. Holman, C. H. Brown, S. Wichmann, , A. Müller, V. Velupillai, P. Brown, S. Sauppe, O. Belyaev, M. Urban, Z. Molochieva, A. Wett, D. Bakker, J.-M. List, D. Egorov, R. Mailhammer, D. Beck, H. Geyer, The ASJP Database (ver. 13). http://email.eva.mpg.de/~wichmann/languages.htm 2010). Holman-Brown et alii 2011 (August E. W. Holman, C. H. Brown, W. Eric, , S. Wichmann, A. Müller, V. Velupillai, H. Hammarström, H. Jung, D. Bakker, P. Brown, O. Belyaev, M. Urban, R. Mailhammer, JohannMattis List, D. Egorov, “Automated dating of the world’s language families based on lexical similarity”, Current Anthropology (forthc.), 2011 147 Holman Wichmann (in pub.) web E. W. Holman, S. Wichmann, Assessing temporal stability for linguistic typological features. (manoscritto in revisione; versione di pre-pubblicazione: [http://email.eva.mpg.de/~wichmann/WichmannHolmanIniSubmi t.pdf] Howson-Urbach 2005 Huff 2009 C. Howson, P.Urbach, Scientific Reasoning: the Bayesian Approach (3° ed.). Open Court Publishing Company, 2005 P. Huff, 13 Aprile 2009 (web), pp.1-17, 2009 [http://pyaline.sourceforge.net/document.pdf] Huson 1998 D.H. Huson, “SplitsTree: A program for analyzing and visualizing, evolutionary data”, Bioinformatics 14.10, pp.68–73, 1998 Huson 2006 D.H. Huson, D. Bryant, “Application of phylogenetic networks in evolutionary studies”, Molecular Biology and Evolution 23, pp. 254-267, 2006 Hymes 1960 D. Hymes, “Lexicostatistics so far”, Current Anthropology, 1/1, pp. 3-44, 1960 Illich-Svitych 1967 V. M. Illich-Svitych, “Materialy k sravnitel’nomu slovarju nostratiˇceskix jazykov,” Etimologija 1965 (Moscow), pp. 321– 96, 1967 Illich-Svitych 1971-84 V. M. Illich-Svitych, Opyt sravnenija nostratiˇceskix jazykov, 3 vols. Moscow. Johnston, Harry H. 1922. A Comparative Study of the Bantu and Semi-Bantu Languages, 2 vols. Oxford, Eng., 1971– 84 Jaeger 1992 J.H. Jaeger, “Phonetic features in young children’s slips of the tongue”, Language and Speech 35, pp. 189-205, 1992 Jezek 2005 E. Jezek, Lessico. Classi di parole, strutture, combinazioni, Bologna, 2005 JustesonStephens J.S. Justeson, L.D. Stephens, “Chance cognation: a probabilistic model and decision procedure for historical inference”, in Papers from the 4th International Conference on 148 Historical Linguistics, eds. E.C. Traugott, R. Labrum & S. Shepherd. (Current issues in Linguistic Theory, 14). Amsterdam: Benjamins, pp. 37–46, 1980 Kaufman 1990 T. Kaufman, “Language History in South America: What We Know and How to Know More,” in D. L. Payne, Amazonian Linguistics: Studies in Lowland South American Languages. Austin, Tex., pp. 13–73, 1990 Kessler 2001 B. Kessler, The Significance of Word Lists: Statistical Tests for Investigating Historical Connections Between Languages, Stanford, California: CSLI Publications, 2001 B. Kessler, Review of Time Depth in Historical Linguistics. Diachronica 20, pp. 373-377, 2003 Kessler 2003 [http://brettkessler.com/~bkessler/TimeDepth_review/] KesslerLehtonen 2006 B. Kessler, A. Lehtonen, "Multilateral comparison and significance testing of the Indo-Uralic question." In Phylogenetic Methods and the Prehistory of Languages, edited by Peter Foster and Colin Renfrew. McDonald Institute for Archaeological Research. [Unofficial prepublication draft: [http://brettkessler.com/McDonald/ (2004), 2006]. Kessler 2007 B. Kessler, “Word similarity metrics and multilateral comparison”, Proceedings of Ninth Meeting of the ACL Special Interest Group in Computational Morphology and Phonology, pp. 6–14, 2007 [http://acl.ldc.upenn.edu/W/W07/W07-1302.pdf] Key 2003 M. Key, “Introduction”, in R. Mitkov, The Oxford Handbook of Computational Linguistics, Oxford: OUP, 2003 Kondrak 2000 G. Kondrak, “A new algorithm for the alignment of phonetic sequences”, Proceedings of the First Meeting of North American Chapter of the Association for Computational Linguistics, pp. 288– 295, 2000 Kondrak 2002 G. Kondrak, Algorithms for Language Reconstruction. PhD thesis, University of Toronto, Toronto, 2002 Kövecses 2002 Z. Kövecses, Metaphor, A practical introduction, Oxford, 2002 149 Krell 1998 K. Krell, "Gimbutas' Kurgans-PIE homeland hypothesis: a linguistic critique". in "Archaeology and Language, II", Blench and Spriggs, cap. 11, 1998 Laakso 2003 J. Laakso, "Linguistic shadow-boxing." , Review of The Uralic Language Family: Facts, Myths and Statistics by Angela Marcantonio. 2003 [http://homepage.univie.ac.at/Johanna.Laakso/am_rev.html] Labov 2007 W. Labov, "Transmission and diffusion." Language 83, pp. 344387, 2007 LaudannaVoghera 2006 A. Laudanna, M.Voghera, Il linguaggio. Strutture Linguistiche e processi cognitivi, Roma-Bari, 2006 Lee 2004 L. Lee, “I’m sorry Dave, I’m afraid I can’t do that”: Linguistics, Statistics and Natural Language Processing circa 2001. In Computer Science: Reflection on the Field, Reflection from the Field (Report of the National Academies’ Study on the Fundamentals of Computer Science), pp 111-118, 2004 Lees 1953 R. Lees, “The basis of glottochronology”, in Language, 29 (2), pp. 113–127, 1953 Lefebvre 1991 C. Lefebvre, Serial verbs: grammatical, comparative and cognitive approaches, Amsterdam-Philadelphia, 1991 Lehmann 1993 W. P. Lehmann, Theoretical Bases of Indo-European Linguistics, London, 1993 Lehmann (web) W. P. Lehmann, A Reader in Nineteenth Century Historical IndoEuropean Linguistics, cap. XIV: "Hermann Osthoff and Karl Brugmann, Preface to Morphological investigations in the Sphere of the Indo-European Languages, I, From Morphologische Untersuchungen auf dem Gebiete der indogermanischen Sprachen I (Leipzig: S. Hirzel, 1878) pp.iiixx. [http://www.utexas.edu/cola/centers/lrc/books/read14.html] Lenci 2008 A. Lenci, “Distributional semantics in linguistic and cognitive research”, in Italian Journal of Linguistics XX/1, pp. 1-33, 2008. 150 [http://wordspace.collocations.de/lib/exe/fetch.php/course:01_len ci.pdf] Levenshtein 1966 Lewis 2009 V. I. Levenshtein, “Binary codes capable of correcting deletions, insertions, and reversals”, Cybernetics and Control Theory, 10(8), pp. 707-710, 1966 P. Lewis, Ethnologue, 16°ed. Dallas: SIL International, 2009 [www.ethnologue.com]. Lohr 2000 M. Lohr, “New approaches to lexicostatistics and glottochronology”, In: C. Renfrew, A McMahon & L. Trask, Time Depth in Historical Linguistics, Vol. 1, cap. 10, pp. 209-223, 2000 Luraghi 2004 S. Luraghi, Introduzione alla Linguistica Cognitiva, Roma, 20031, 20042 Luraghi 2007 S. Luraghi, Introduzione alla Linguistica Storica, Roma, 2006 (Rist. 2007) Luraghi 2010 ed. italiana a cura di S. Luraghi: W. Croft, D.A. Cruse, Linguistica Cognitiva, Roma, 2010 Lyons 1977 J. Lyons, Semantics, 2 voll., Cambridge, 1977, trad.it. Manuale di Semantica, Roma-Bari, 1981 Lyovin 1997 A. V. Lyovin, An Introduction to the Languages of the World, New York: Oxford University Press, Inc. 1997 Maddieson 1984 I. Maddieson, Patterns of Sound, 1984 [http://linguistics.berkeley.edu/~kjohnson/ling110/Lecture_Slides/2_Consonants/stop_universals.pdf] McMahon 1994 A. McMahon, Understanding language change. Cambridge: Cambridge University Press, 1994 McMahonMcMahon 2005 A. McMahon, R. McMahon, Language Classification by Numbers. Oxford: Oxford University Press, 2005 Magini 2007 L. Magini, L'etrusco, lingua dall'Oriente indoeuropeo, 2007 151 Mairal-Gil 2006 R. Mairal, J. Gil, Linguistic Universals, 2006 Marcantonio 2002 A. Marcantonio, “The Uralic language family. Facts, myths and statistics”, Publications of the Philological Society, 35, Oxford Boston: Blackwell, 2002. 335 S. da [http://homepage.univie.ac.at/Johanna.Laakso/am_rev.html ] Matisoff 1990 J. Matisoff, "On megalocomparison", Language 66, pp.109-120, 1990 Mazzone 2005 M. Mazzone, Menti simboliche. Introduzione agli studi sul linguaggio, Roma, 2005 Meier-Brügger 2003 M. Meier-Brügger, Indo-european Linguistics, Berlin-New York, 2003 Mielke 2008 J. Mielke, The Emergence of Distinctive Features, Oxford: Oxford University Press, 2008 Mielke 2009 J. Mielke, “A phonetically-based phonetic similarity metric, Paper presented at NELS 40, MIT., 2009 [http://aix1.uottawa.ca/~jmielke/research/NELS_similarity_Mielk e.pdf] Mitkov 2003 R. Mitkov, The Oxford Handbook of Computational Linguistics, Oxford: OUP, 2003 Molinari 1981 M. V. Molinari, La filologia Germanica, Torino, 1981 Morani 2007 M. Morani, Lineamenti di linguistica indeuropea, Roma, 2007 Morpurgo Davies 1989 A. Morpurgo Davies, Comments on “Models of Change in Language and Archaeology,” by Colin Renfrew, Transactions of the Philological Society 87(2), pp.156–71, 1989 Nakhleh et alii 2005 L. Nakhleh, D. Ringe, T. Warnow, “Perfect phylogenetic networks: A new methodology for reconstructing the evolutionary history of natural Languages”, Language 81, pp. 382-420, 2005 152 Navigli 2009 R. Navigli, “Word Sense Disambiguation: A Survey”, ACM Computing Surveys, 41(2), pp. 1-69, 2009 Nei-Saitou 1987 M. Nei, N. Saitou, “The neighbor-joining method: a new method for reconstructing phylogenetic trees”, Molecular Biology and Evolution 4, pp. 406-425, 1987 Nei-Kumar et alii 2007 M. Nei, S. Kumar, J. Dudley, K. Tamura, “MEGA4: Molecular Evolutionary Genetics Analysis (MEGA) software version 4.0.”, Molecular Biology and Evolution 24, pp. 1596–1599, 2007 [www.megasoftware.net] Nei-Kumar et alii 2008 M. Nei, S.Kumar, J. Dudley, K. Tamura, “MEGA: A biologist-centric software for evolutionary analysis of DNA and protein sequences”, Briefings in Bioinformatics 9, pp. 299-306, 2008 Newman 1995 P. Newman, On Being Right: Greenberg’s African Linguistic Classification and the Methodological Principles Which Underlie It. Bloomington: Institute for the Study of Nigerian Languages and Cultures, African Studies Program, Indiana University, 1995 Newman 1996 J. Newman, GIVE, A Cognitive Linguistic Study, Berlin-New York, 1996 Nichols 1990 J. Nichols, “Linguistic Diversity and the First Settlement of the New World,” Language 66, pp. 475–521, 1990 Nichols 1992 J. Nichols, Linguistic diversity in space and time, Chicago: University of Chicago Press, 1992 Nichols 2007 J. Nichols, What, if anything, is typology? Linguistic Typology. Vol.11, Issue 1, pp. 231–238, ISSN (Online) 1613-415X, ISSN (Print) 1430-0532, DOI: 10.1515/LINGTY.2007.017, July 2007 Niculescu 2007 A. Niculescu, L’altra latinità, Verona, 2007 Oswalt 1970 R.L. Oswalt, “The detection of remote linguistic 153 relationships”, Computer Studies in the Humanities and Verbal Behavior 3, pp. 117-129, 1970 Palmer 2002 L. R. Palmer, The Latin Language, London, 1954. ed. it. a cura di M. Vitta, La lingua latina, ed Torino, 1977 e 2002 Paradis 2006 E. Paradis, Analysis of Phylogenetics and Evolution with R. Springer, New York, 2006 Pedersen 2010 J. Pedersen, 1991"The different Swedish tack: An ethnopragmatic investigation of Swedish thanking and related concepts", Journal of Pragmatics 42, pp.1258-1265, 2010 Peeters 2006 B. Peeters, Semantic Primes and Universal Grammar: Empirical evidence from the Romance languages. Amsterdam, 2006 Pisani 1979 V. Pisani, Le lingue indoeuropee, Paideia, 1979 Pisani 2008 V. Pisani, Grammatica latina, storica e comparativa, Torino, 1948 (19744 riveduta; e 2008 immutata) Poplack 1984 S. Poplack, D. Sankoff, “Borrowing: the synchrony of integration”, Linguistics 22, pp. 99–136, 1984 Poser-Campbell 1992 W.J. Poser, L. Campbell, "Indo-european practice and historical methodology." Proceedings of the Eighteenth Annual Meeting of the Berkeley Linguistics Society, pp. 214-236, 1992 Renfrew 1987 A.C. Renfrew, Archaeology and Language: The Puzzle of IndoEuropean Origins, London: Pimlico, 1987 Renfrew 2000 C. Renfrew, A. McMahon, L. Trask, Time depth in historical linguistics, 2 voll. Cambridge: McDonald Institute for Archaelogical Research, 2000 Renfrew 2003 C. Renfrew, "Time Depth, Convergence Theory, and Innovation in Proto-Indo-European". Languages in Prehistoric Europe, 2003 154 Renzi-Andreose 2006 L. Renzi, A. Andreose, Manuale di linguistica e filologia romanza, Bologna, 20031, 20062 Ringe 1992 D. Ringe, "On calculating the Factor of Chance in Language Comparison." American Philosophical Society, Transactions 82.1, pp.1-110, 1992 Ringe 1993 D.A. Ringe, Jr., "A reply to Professor Greenberg." American Philosophical Society, Proceedings 137, pp. 91-109, 1993 Ringe 1995 D.A. Ringe, Jr., “Nostratic and the factor of chance", Diachronica 12.1, pp. 55-74, 1995 Ringe 1996 D.A. Ringe, Jr., "The mathematics 'Amerind'." Diachronica 13, 135-154, 1996 Ringe 1998 D.A. Ringe, Jr., Probabilistic evidence for Indo-Uralic, in Salmons & Joseph, pp. 153–197, 1998. Rijkhoff-Bakker 1998 J. Rijkhoff, D. Bakker, “Language sampling”, Linguistic Typology 2(3), pp. 263–314, 1998 Rix 1992 H. Rix, Historische Grammatik des Griechischen, Darmstadt, 1992 Ruhlen 1987 M. Ruhlen, A Guide to the World's Languages, Stanford: Stanford University Press, 1987 Ruhlen 1991a M. Ruhlen, Amerind T’ANA ‘Child, Sibling’ , cap.9, 1991 Ruhlen 1994a M. Ruhlen, The Origin of Language: Tracing the Evolution of the Mother Tongue, New York: John Wiley & Sons, 1994 Ruhlen 1994b M. Ruhlen, On the Origin of Languages: Studies in Linguistic Taxonomy. Stanford: Stanford University Press, 1994 Ruhlen- Bengtson 1994c M. Ruhlen, J. Bengtson, "Global Etymologies", On the Origin of Languages: Studies in Linguistic Taxonomy, Stanford: Stanford University Press, pp. 277–336 (p. 291 e n. 3). [http://www.merrittruhlen.com/files/Global.pdf] of 155 Sankoff 1970 D. Sankoff, "On the Rate of Replacement of Word-Meaning Relationships." Language 46, pp. 564–569, 1970 Sapir 1969 E. Sapir, Il Linguaggio, trad.it. Torino Einaudi, 1969 (19211) Schleicher 18611862 A. Schleicher, Compendium der vergleichenden Grammatik der indogermanischen Sprachen. Kurzer Abriss der indogermanischen Ursprache, des Altindischen, Altiranischen, Altgriechischen, Altitalischen, Altkeltischen, Altslawischen, Litauischen und Altdeutschen, 2 voll. Weimar: H. Boehlau, 1861-1862 Schleicher 1874 A. Schleicher, A Compendium of the Comparative Grammar of the Indo-European, Sanskrit, Greek, and Latin Languages, translated from the third German edition. London: Trübner and Co. Bendall, Herbert, Translator (1874, 1877) [1871] Schloesser 2005 R. Schloesser, Le lingue romanze, Bologna, 2005 Serva-Petroni 2008 M. Serva, F. Petroni, “Indo-European languages tree by Levenshtein distance”. EuroPhysics Letters 81, 2008 Simone 2008 R. Simone, Fondamenti di linguistica, Roma-Bari, 1990 (rist. 2008) Snell 1995 J.L. Snell, “Linguists debating deepest roots of language”, CHANCE News 4 (10), 1995 [http://www.dartmouth.edu/~chance/chance_news/recent_news/ chance_news_4.10.html#Linguists, 14 June 1999] Snell et alii 1998 J.L. Snell, B. Paterson, C. Grinstead, Coincidences and linguistics. CHANCE News 7(6), 1998 [http://www.dartmouth.edu/~chance/chance_news/recent_news/ chance_news_7.06.html#Coincidences and linguistics, 14 June 1999]. Song 2011 J.J. Song, The Oxford Handbook of Linguistic Typology, Oxford: Oxford University, 2011 156 Spärck Jones 2007 K. Spärck Jones, Computational Linguistics: What About the Linguistics?, 2007 Starostin 1991 S. Starostin, Altajskaja Problema i Proisxozhdenie Japonskogo Jazyka [The Altaic Problem and the Origin of the Japanese Language]. Moscow: Nauka, 1991 Starostin 2002 S. Starostin, Methodology of Long-Range Comparison, 2002 [http://starling.rinet.ru/Texts/method.pdf] Steiner 2011 et alii (in stampa) L. Steiner, P. F. Stadler, M. Cysouw, “A pipeline for computational historical linguistics”, Language Dynamics and Change (in prep.), 2011 Swadesh 1950 M. Swadesh, “Salish internal relationships”, International Journal of American Linguistics, 16, pp.157–167, 1950 Swadesh 1952 M.Swadesh, “Lexicostatistic dating of prehistoric ethnic contacts”, in Proceedings American Philosophical Society, 96, pp. 452–463, 1952 Swadesh 1955 M. Swadesh, “Towards greater accuracy in lexicostatistic dating”, International Journal of American Linguistics, 21, pp. 121– 137, 1955 Swadesh 1960 M. Swadesh, “On Interhemisphere Linguistic Connections,” in Stanley Diamond, ed., Culture in History. New York, pp. 894–924, 1960 Swadesh 1971 M. Swadesh, The origin and diversification of language. Edited post mortem by Joel Sherzer. Chicago, 1971 Swadesh et alii 1972 M. Swadesh, et alii, “What is glottochronology?” In M. Swadesh, The Origin and Diversification of Language, pp. 271–284, London: Routledge & Kegan Paul, 1972 Szemerényi 1960 O.J.L. Szemerényi, Studies in the Indo-European System of Numerals, Heidelberg- C. Winter, 1960 157 Szemerényi 1966 O.J.L.Szemerényi, Introduction to Indo-European Linguistics (4th ed.). Oxford- Oxford University Press, 1996 Szemerenyi 1974 O. Szemerenyi, “The origins of the Greek lexicon: Ex oriente lux”, Journal of Hellenic Studies 94, pp. 144–157, 1974 Thomason 1997 S.G. Thomason, On the unpredictability of contact effects, Ms., University of Michigan, 1997 Thomason 2001 S.G. Thomason, Language contact. Washington, D.C.: Georgetown University Press, Loanword typology 21, 2001 [http://en.wikipedia.org/wiki/Loanword] ThomasonEverett 2005 S.G.Thomason, D. L.Everett, "Pronoun Borrowing", Proceedings of the annual meeting of the Berkeley Linguistics Society 27, pp.301sg., 2005 [www-personal.umich.edu/~thomason/papers/pronborr.pdf] Trask 1996 R.L. Trask, Historical Linguistics, 1996 Traina-Bernardi Perini 1982 A. Traina, G. Bernardi Perini, Propedeutica al latino universitario, Bologna, 1982 Trier 1931 Jos Trier, Il lessico tedesco dell'ambito dell'intelletto, 1931 Trombetti 1905 A. Trombetti, L’unità d’origine del linguaggio, Bologna, 1905 Uhlenbeck 1935 C.C. Uhlenbeck, Oer-Indogermaansch en Oer-Indogermanen. Mededeelingen der Koninklijke Akademie van Wetenschappen, Afdeeling Letterkunde 77-79, serie A, pp. 125-148, 1935 van HoutMuysken 1994 R. van Hout, P. Muysken, “Modeling lexical borrowability”, Language Variation and Change 6, pp. 39–62, 1994 Varvaro 2001 A. Varvaro, Linguistica romanza, Napoli, 2001 Villar 1997 Francisco Villar, Gli indoeuropei e le origini dell'Europa, Bologna, Il Mulino, 1997 158 Watkins 1973 C. Watkins, “Language and its history”. Daedalus, 102(3), pp. 99–111, 1973 Whaley 1997 L.J. Whaley, Introduction to typology: The unity and diversity of language, Newbury Park, 1997 Whitrow 1988 GJ.Whitrow, Time in History: The evolution of our general awareness of time and temporal perspective. Oxford University Press, p. 11, 1988 Wierzbicka 1972 A. Wierzbicka, Semantic Primitives, Frankfurt, 1972 Wierzbicka 1992 A. Wierzbicka, Semantics, Culture and Cognition: Universal human concepts in culture-specific configurations, 1992 WierzbickaGoddard 1994 A. Wierzbicka, C. Goddard, Semantic and Lexical Universals, Theory and Empirical Findings, Amsterdam: John Benjamins, 1994 Wierzbicka 1996 A. Wierzbicka, Semantics: Primes and Universals, Oxford, 1996 Wierzbicka 1997 A. Wierzbicka, Understanding Cultures Through Their Key Words. Oxford: Oxford University Press, 1997 Wierzbicka 1999 A. Wierzbicka, Emotions Across Languages Cambridge: Cambridge University Press, 1999 WierzbickaHarkins 2001 A. Wierzbicka, J. Harkins, Emotions in Crosslinguistic Perspective, Berlin: Mouton de Gruyter, 2001 WierzbickaGoddard 2002 A. Wierzbicka, C. Goddard, Meaning and Universal Grammar: Theory and Empirical Findings (2 voll.), Amsterdam/ Philadelphia: John Benjamins, 2002 Wierzbicka 2003 A. Wierzbicka, Cross-cultural Pragmatics: The semantics of human interaction. 2nd edition. Berlin: Mouton de Gruyter, 2003 (1991) Wierzbicka 2006 A. Wierzbicka, English: Meaning and culture. New York: Oxford University Press, 2006 and Cultures. 159 WierzbickaGoddard 2006 A. Wierzbicka, C. Goddard, Semantic Primes and Cultural Scripts in Language: Learning and Intercultural Communication, 2006 [http://www.une.edu.au/bcss/linguistics/nsm/pdfs/GoddardWier zbicka.applied.NSM.pdf] Wilkins 1996 D. Wilkins, “Natural tendencies of semantic change and the search for cognates”, In The comparative method reviewed, M. Ross, M. Durrie, pp. 264–304, New York: Oxford University Press, 1996 Wittmann 1969 H. Wittmann, "A lexico-statistic inquiry into the diachrony of Hittite", Indogermanische Forschungen 74, pp.1-10, 1969 Zuckermann 2009 G. Zuckermann, "Hybridity versus Revivability: Multiple Causation, Forms and Patterns", Journal of Language Contact Varia (2), pp. 40–67, 2009 [http://www.zuckermann.org/pdf/Hybridity_versus_Revivability.p df] 160 Lessici e Dizionari Etimologici Lessico Indoeuropeo IEW J. Pokorny, Indogermanisches etymologisches Wörterbuch, BernMünchen, 1959 LIV H. Rix, Lexicon der Indogermanischen verben, Wiesbaden, 2001 Bengtson-Ruhlen 1965 J.D. Bengtson e M. Ruhlen, Global Etymologie, 1965 Lingue indoarie EWA M. Mayrhofer, Etymologisches Wörterbuch des Altindoarischen, 1986-2001 Lingua greca DELG P. Chantraine, Dictionnaire étymologique de la langue grecque, Paris, Klincksieck, 1968-80, 2 voll. GEW H. Frisk, Griechisches Etymologisches Wörterbuch, Heidelberg, 1954-72, 3 voll. J. 13 EWG W. Hofmann, Etymologisches Wörterbuch des Griechischen, Monaco, 1950 Boisacq 1907, 1938 E. Boisacq, Dictionnaire étymologique de la langue grecque, Heidelberg 1907, 1938 JucquoisDevlamminck 1977 G. Jucquois, B. Devlamminck, Compléments aux Dictionnaires étymologiques du grec ancien, I (A-K), Lovanio, 1977 Lingua latina DELL A. Ernout, A. Meillet, - Dictionnaire Étymologique de la Langue Latine, Histoire des mots, Parigi, 1932, rist. 1985 EDL T. G. Tucker, Ethymological Dictionary of Latin, 1931, rist. 1976 161 LEW A. Walde, J. B. Hofmann, Lateinisches Etymologisches Wörterbuch, Heidelberg, Carl Winter Universitätverlag (19301958); rist.1965, 3voll. Alessio 1978 G. Alessio, Lexicon etymologicum. Supplem. ai Dizionari etimologici latini e romanzi. Indici a cura di A. Landi, Napoli, L'Arte Tipogr., 1976, pp. XX-689. Ree.: Pisani «Paideia» 32, 1977, 157-158; André «Latomus» 37, 1978, 981-984, Leroy «RBPh» 56, 1978, 1041 Forssman 1983 B. Forssman, Etymologische Nachschlagewerke zum antiken Latein. Stand und Aufgaben, «Das Etym. Wörterbuch Fragen der Konzeption und Gestaltung» hrsg. von A. Bammesberger, Regensburg, 1983, 49-73) (sui dizionari di Walde-Hofmann, Ernout-Meillet). Lingue romanze EWRS F. C. Diez, Etymologisches Wörterbuch der romanischen Sprachen, rifatto da: Wilhelm REW W. Meyer-Lübke, Romanisches Etymologisches Wörterbuch (Dizionario Etimologico Romanzo), Heidelberg, 1911-1920; 3°ed. 1935 Alessio 1976 G. Alessio, Lexicon etymologicum. Supplem. ai Dizionari etimologici latini e romanzi. Indici a cura di A. Landi, Napoli, L'Arte Tipogr., 1976, pp. XX-689. Ree.: Pisani «Paideia» 32, 1977, 157-158; André «Latomus» 37, 1978, 981-984, Leroy «RBPh» 56, 1978, 1041 Lingua italiana DISC F. Sabatini, V. Coletti, Dizionario italiano, Firenze, 1997 DM T. De Mauro, Il dizionario della lingua italiana, Torino, 2000 DEL C. Battisti - G. Alessio, Dizionario etimologico italiano, Firenze, 1950-57. Battaglia 1961 S. Battaglia, Grande dizionario della lingua italiana, Torino, 1961. 162 Bolelli 1994 T. Bolelli, Dizionario etimologico della lingua italiana, Milano, 1989, ed. rived. 1994 Colonna 1997 B. Colonna, Dizionario etimologico della lingua italiana, Roma, 1997 DELI M. Cortelazzo – P. Zolli, Dizionario etimologico della lingua italiana, 4 volumi, Bologna, 1979 Devoto 1966 Nocentini-.Parenti 2010 G. Devoto, Avviamento alla etimologia italiana, Firenze, 1966 A. Nocentini (e A.Parenti), L'Etimologico - Vocabolario della lingua italiana, Firenze, 2010 Olivieri 1961 D. Olivieri, Dizionario etimologico italiano, Milano, 1961 Pianigiani 1993 O. Pianigiani, Vocabolario Etimologico della lingua italiana (Roma, 1907). 1926 Aggiunte, correzioni e variazioni (Ariani, Firenze). (Sonzogno 1937, Dioscuri 1998, Melita 1990, Polaris 1993) Prati 1989 A. Prati, Vocabolario etimologico italiano, Milano, 1989 Lingua spagnola Campa-LópezMariscal 2008 H. de la Campa, F. R. López, L. R. Mariscal, Diccionario español escolar de familias etimológicas, Granada, 2008 Gómez de Silva 1995 G. Gómez de Silva, Breve diccionario etimológico de la lengua española, México, 1995 Corominas –Pascual 1980-1983 J. Corominas, J. A. Pascual, Diccionario Critico Etimologico Castellano e Ispanico, 1980-1983, Madrid, editorial Gredos, 5 voll. Lingua francese Bloch-Wartburg 1968 O. Bloch, W. von Wartburg, Dictionnaire étymologique de la langue française. V. éd., Paris, 1968 163 Lingua tedesca Duden 1963 S. Duden, Etymologie. Herkunftswörterbuch der deutschen Sprache, bearbeitet von Gunther Drosdowsi, Paul Grebe und weiteren Mitarbeitern der Dudenredaktion, Mannheim, 1963 Keller 1973 H. H. Keller, German root lexicon, Coral Gables, 1973 Kluge 1975 F. Kluge, Etymologisches Wörterbuch der deutschen Sprache . Auflage bearbeitet von Walter de Gruyter (prima ed. 1883, 21ª ed.1975) Lingua inglese Klein 1967 E. A. Klein, A comprehensive Etymological Dictionary of the English language, 2 voll., Amsterdam, 1967 ODEE C. T. Onions, The Oxford Dictionary of English Etymology, with the assistance of G. W. S. Friedrichsen and R. W. Burchfield, Clarendon Press, Oxford, 1966). Skeat 1968 W. Skeat, An Etymological Dictionary of the English Language, Oxford, 4th ed., 1910. Rist. 1968 Weeldey 1921 E. Weeldey, An Etymological Dictionary of Modern English, New York, 1921 Hoad 1986 T.F. Hoad, The Concise Oxford Dictionary of English Etymology. Oxford, 1986 Scardigli – Gervasi 1978 G. Scardigli, T. Gervasi, Avviamento all'etimologia inglese e tedesca, Firenze, 1978. Lingua irlandese Vendryes 1959 J. Vendryes, Lexique étymologique de l'irlandais ancien (I vol. 1959; incompleto), Dublino Institute for Advanced Studies and CNRC Éditions, Parigi Lingua scozzese o gaelico scozzese MacBain 1998 A. MacBain, Etymological Dictionary of Scottish-Gaelic (1896), New York rist. 1998 164 Jamieson 1879-97 J. Jamieson, An Etymological Dictionary of the Scottish Language (1808), revised 1879-97 Lingua danese e norvegese Falk-Torp 1960 H. s. Falk, Alf Torp, Norwegisch-Dänisches etymologisches Woerterbuch, Kristiania, Oslo, 1910. Rist. Heidelberg, 1960. Lingua russa Vasmer 1953-1958 M. Vasmer, Russisches etymologisches Wörterbuch, (valido per tutte le lingue slave); Carl Winter, 3 voll., Heidelberg, 19531958 Lingua polacca Brückner 2000 A. Brückner, Słownik etymologiczny języka polskiego (1° ed., Kraków, Krakowska Spółka Wydawnicza, 1927 (9° ed., Warsaw, Wiedza Powszechna, 2000) Lingua lituana LEW 1962-1965 E.Fränckel, Litauisches Etymologisches Wörterbuch, 2 voll., Heidelberg, Wienter, 1962-1965 Lingue finniche OFW The Origin of Finnish Words, Helsinki, Kotimaisten kielten tutkimuskeskus and Suomalaisen Kirjallisuuden Seura (I vol., A-K 1992; II vol., L-P 1995; III vol., R-Ö 2000) Lingua albanese EWAS G. Mayer, Etymologisches Wörterbuch der albanesischen Sprache (1891), rist. Leipzig, Zentralantiquariat der Deutschen Demokratischen Republik, 1982 Lingue dravidiche (Tamil, Telugu, Kannada, Brahui et al.) DEDR Burrow and Emeneau, A Dravidian etymological dictionary (DED or DEDR, 1984 165 Lingue amerindie Ruhlen – Greenberg 2007 M. Ruhlen e J. H. Greenberg, An Amerind Etymological Dictionary Library of Congress Cataloging-in-Publication Data J. H. Greenberg, M. Ruhlen, An Amerind Etymological Dictionary Bibliography: p. Includes indexes.1. Amerind LanguagesEtymology-Classification, 2007 Lingua turca NişanyanTürkçe'nin 2007 S. Nişanyan Sözlerin Soyağacı, Ç. Türkçe'nin, Etimolojik Sözlüğü, 3° ed. Adam Y. Istanbul 2007 Lingua etrusca Agostiniani Vetlesen Ole 1983 L. Agostiniani – H. Vetlesen Ole, Lessico etrusco cronologico e topografico. Dai materiali del «Thesaurus Linguae Etruscae» e Corpus Inscriptionum Etruscarum, 1983 Sumero CAD The Assyrian Dictionary of the Oriental Institute of the University of Chicago, in corso di pubbl. dal 1963 Lingue semitiche (accadico, ebraico) CAD The Assyrian Dictionary of the Oriental Institute of the University of Chicago, in corso di pubbl. dal 1963 vS W. von Soden, Akkadisches Handwörtebuch…bearbeitet von Wolfram von Soden, Wiesbaden, Harrassowitz, 1965-1981 Cohen 1970-1976 D. Cohen, Dictionaire des racines sémitiques ou attestées dans les langues sémitiques, paris, Mouton, fasc. I, 1970; fasc. II, 1976 Fronzaroli 1964-1965 P. Fronzaroli, Studi sul lessico comune semitico, Firenze, 1964, 1965 Garbini 1984 G. Garbini, Le lingue semitiche, Studi di storia linguistica, 2° ed. Napoli, Ist. Univ. Orientale, 1984 166 Gelb 1957 I. J. Gelb, Glossary of old Akkadian, The University of Chicago press, 1957 Moscati 1969 et alii S. Moscati, A. Spitaler, E. Wollendorf, W. V. Soden, An Introduction to Comparative Grammar of the Semitic Language: Phonology and Morphology, Wiesbaden, Harrassowitz, 1969 Von Soden -Rollig 1967 PettinatoWaltzold 1985 Von Soden- W.Rollig, Das Akkadische Syllabar, Roma, Pont. Inst. Bibl., 1967 G. Pettinato, H. Waltzold, Studi per il vocabolario sumerico. I, 1, Roma, 1985
Documenti analoghi
Abstracts - Universitetet i Bergen
nasce dalla convinzione che i ricercatori in settori di studio vicini e talvolta contigui per l’oggetto e il
contesto storico-culturale affrontato – nel caso specifico, con evidente centralità dell...
XV. Interne Sprachgeschichte Histoire interne des langues
il sistema (interno, dovuto a fattori strutturali) e mutamento condizionato dal contatto
con altro sistema (è ad es. la distinzione operata da Andersen 1973, 778; 1989; fra mutamento evolutivo e mu...