Lingvistinė evoliucija yra panaši į biologinį • Aleksandras Berdichevskis, Aleksandras Markovas • Mokslinės naujienos apie "Elementus" • Lingvistika, biologija, evoliucija

Lingvistinė evoliucija yra panaši į biologinę

Indoeuropiečių kalbų evoliucinis medis iš populiarios santraukos, prie kurio pridedami du aptariami straipsniai žurnale Gamta. Ši nuotrauka yra ypač įdomi juokinga klaida (retas atvejis tokio gerbiamo žurnalo!) – vienoje iš filialų, o ne "slavų" (slavų), klaidingai parašyta "Islamo" (islamo)

Kreipdamiesi į indoeuropiečių kalbos analizę, sukurta metodika, skirta išsiaiškinti rūšių evoliuciją, biologai patvirtino gerai žinomą lingvisčių modelį, kad žodžiai kalbos keičiasi greičiau, tuo rečiau jie naudojami. Panaši tendencija yra ir biologinės evoliucijos atveju: morfologiniai ypatumai ir genomo regionai, kurie yra mažiausiai svarbūs organizmui, dažniausiai yra susiję su greičiausiai vykstančiais evoliuciniais pokyčiais.

Pirmą kartą Charlesas Darwinas atkreipė dėmesį į paralelę tarp biologinių rūšių ir žmogaus kalbos evoliucijos knygoje "Žmogaus kilmė". Šiandien šią nuomonę patvirtina griežti statistiniai metodai.

Žurnale Gamta iš karto du straipsniai skirti kalbos evoliucijos tempui tirti priklausomai nuo žodžio naudojimo dažnumo. Pagrindiniai abiejų straipsnių autoriai yra biologai.

Pirmame straipsnyje, kurį parašė amerikiečių evoliucijos teoretikai ir matematikai, buvo įrodyta, kad "nereguliarių" angliškų veiksmažodžių "transformacija" į reguliarius veiksmažodžius priklauso nuo konkretaus veiksmažodžio dažnumo. Senuoju anglu kalba, naudota apie 800 AD er ("Beowulf" kalba), buvo keletas klasių veiksmažodžių, kurie skiriasi praeities laiko formavimo būdu. Per ateinančius 1200 metų įvyko "sureguliavimo" procesas: visos šios klas ÷ s buvo palaipsniui "išlietos" labiausiai paplitusiomis, kuriose praeities laikais ir praeities partijos formomis pridedant veiksmažodžio priesagą – (e) d.

Šiuolaikiniame anglų kalba visos kitos klasės išsaugomos tik kaip užuominos – vadinamosios "nereguliarios" veiksmažodžiai. Klasikinis veiksmažodis yra vienintelis produktyvusis, tai yra, visi nauji veiksmažodžiai, rodomi anglų kalba, automatiškai patenka į jį ir yra konjuguoti pagal analogiją su kitais reguliariais veiksmažodžiais (vadinasi, "jaunas" veiksmažodis į google su reikšme "naudoti" Google "paieškos variklį, yra praeities laiko ir nedalyvavimo forma googled).

Autoriai ištyrė senojo anglų kalbos 177 veiksmažodžių (ir visi jie buvo nereguliarūs) istorinę likimą ir vis dar saugomi. Viduriniuose anglų kalbomis (Kanterburijos pasakos iš Choserio kalba, kuri buvo naudojama apie 1200), 145 iš šių veiksmažodžių išliko nereguliarios, o šiuolaikinėje 98 dalyje kai kurie iš jų gali būti konjuguoti kaip nuolatiniai veiksmažodžiai ir 79 kaip ir tie, kurie yra tinkami.

Autoriai padalino veiksmažodžius į 6 klases pagal jų atsiradimo dažnumą šiuolaikiniuose anglų tekstuose. Tuo tikslu buvo išnagrinėta didelė CELEX tekstų dalis, iš viso 17,9 mln. Anglų kalbos žodžių. Pirmoje klasėje yra du dažniausiai vartojami veiksmažodžiai (turi būti "turi būti", turi "turėti"); abu lieka iki šios dienos neteisingai. Antroje klasėje buvo 11 veiksmažodžių, ir visi jie taip pat yra nereguliarūs šiandien. Iš 37 klasės trečios klasės veiksmažodžių viskas išliko nereguliarios Vidurio anglų kalba, tačiau 4 tapo teisingos šiuolaikiniame anglų kalba (pagalba "pagalba", pasiekti "pasiekti", vaikščioti "vaikščioti", dirbti "darbą"). Ketvirtoje klasėje 65 veiksmažodžiai buvo nereguliarūs viduriniuose anglose 57, šiuolaikiniame – 37. Atitinkami skaičiai penktojo klasės yra 50, 29, 14; už šeštąjį, 12, 9, 1.

Analizuojant šiuos duomenis, autoriai priėjo prie išvados, kad 3-6 klasių veiksmažodžiai yra gana tiksliai įvykdyti: "tam tikros dažnių klasės veiksmažodžių" pusėjimo trukmė "yra tiesiogiai proporcinga kvadratinei šakniui iš įvykio dažnio. Pavyzdžiui, jei vienas veiksmažodis yra naudojamas 100 kartų dažniau nei kitas, galime tikėtis, kad jis bus neteisingas 10 kartų ilgiau. Dėl 1-2 klasės veiksmažodžių skaičiavimas neįmanomas, nes nė vienas iš jų dar nėra teisingas (pusėjimo trukmė yra per ilga).

Ekspertizuojant jų rezultatus į ateitį, autoriai prognozuoja, kad, jei nustatytos tendencijos tęstųsi, iki 2500 metų dar 15 tikrų žodyne veikiančių veiksmažodžių bus teisingi, o labiausiai tikėtina, kad jie bus "sureguliuoti" (susirasti "Marry"). Griežtai kalbant, tai jau iš dalies sureguliuojama: žodynai leidžia konjuguoti ją ir kaip įprastą veiksmą (kartu su "nereguliaria" praeities laiko formos wed žodynai duoda "teisingą" ištekėjusi).

Anglų nereguliariųjų veiksmažodžių reguliavimo etapų mikrotechnika

Patikrinkime autorių duomenis su savo, labai mažais, tyrimais.Veiksmažodis negali iš karto pakeisti konjugacijos, tai yra laipsniškas procesas. Žmonės pradeda daryti klaidas (šiuo atveju netinkamą veiksmažodį sujungti kaip teisingą veiksmą), yra vis daugiau ir daugiau klaidų, o tam tikru momentu jie nebegali būti laikomi klaidomis ir tampa norma, o senoji norma išnyksta. Viena vertus, mes esame fiksuoto šio proceso taško ir negalime matyti viso to, kita vertus, skirtingų dažnių klasių veiksmažodžiai yra skirtingais etapais: 6-oje klasėje šis procesas jau buvo toli, o antrasis – tik pradžia.

Internetas bus kalbos būsenos "fotografija". Tai vertinga būtent todėl, kad jame nieko neišrenkia tekstai (skirtingai nei daugelis kalbų korpusai), ir yra daug klaidingų žodžių naudojimo. Leiskite mums pasirinkti vieną veiksmą iš 2-6 klasių ir patikrinti, kaip dažnai verbą patiria ir kaip dažnai jis yra konjuguotas netinkamai (kaip "teisingas"). Jei autorių hipotezė yra teisinga, tuo dažniau veiksmažodis yra, tuo mažiau bus klaidų naudojimo skaičiaus santykis su visais naudojimo būdais.

Kaip paieškos sistema, mes naudojame "Google". Norėdami nustatyti bendrojo veiksmo (N) naudojimo skaičių, ieškosime dabartinės įtemptos formos su asmeniu vietove (Aš duodu, tu duodi, jis duoda) – šis apribojimas yra būtinas, norint nutraukti homonimines būdvardžių ir daiktavardžių formas, dėl kurių kai kurie veiksmažodžiai gali iškreipti vaizdą. Norint nustatyti praeities laiko trukmės klaidingų panaudojimų skaičių (P), mes paprasčiausiai nustatome "teisingą" formą (davė, šiuo atveju klaidinga); jokių apribojimų nenustatyta. Paieškos sistemos grąžinami duomenys yra "laikomi savaime suprantamais" ir jokiu būdu neištaisomi (mes manome, kad triukšmo lygis visais atvejais bus toks pat ir nesukels rezultatų).

Iš 2-6 dažnio klasių pasirinktas vienas veiksmažodis. Naudojant "Google", apskaičiuojamas bendras naudojamų daiktų skaičius, klaidingų naudojimo atvejų skaičius ir santykinis klaidų lygis (P / N).

Rezultatai pateikti lentelėje ir grafike. Kaip matote, mūsų mikro tyrimai patvirtina bendrąsias autorių išvadas: dažnių klases sutampa (nors beveik nėra skirtumų tarp penktos ir šeštos klasių), santykinis klaidų lygis (P / N santykis) didėja. Kaip matote, veiksmažodis nulenkti įprastų praeities laiko formų skaičius (šlykštus) žymiai padidėja, ty reguliavimo procesas nuėjo labai toli (iš tikrųjų, žodynuose jau leidžiama kalbėti šlykštus kartu su slunk).

Kad būtų patogiau atstovauti išilgai ašių, pateikiami atitinkamų reikšmių logaritmai. Grafikas patvirtina išvadas: kuo dažniau veiksmažodis, tuo didesnis santykinis klaidų lygis praėjusio laiko atžvilgiu

* * *

Antrojo tyrimo autoriai, skaitytojai iš Didžiosios Britanijos universiteto ir Santa Fė instituto (Naujoji Meksika, JAV) biologai iškelia daug daugiau užduočių, todėl jų tyrimai, viena vertus, yra įdomūs, kita vertus, kelia daugiau kritikos.

Autoriai siekia išsiaiškinti bendrus kalbų evoliucijos, greičio ir įvairių kalbų skirtumų (ir, atitinkamai, giminystės laipsnio) senoves.

Autorių naudojamas metodas iš tikrųjų yra tam tikra glottochronologija (leksikostatinė statistika), kurią 20-ojo amžiaus viduryje sukūrė amerikiečių kalbos mokytojas Morrisas Swadesas.

Swadesh išskyrė pagrindinį žodyną: 100 (v ÷ liau iš 200) universalių koncepcijų, kurios yra svarbios visoms kultūroms, sąrašas, tod ÷ l greičiausiai randamas visomis pasaulio kalbomis. Kalbos žodyną (žodyną) keičia visą laiką, kai kuriuos žodžius pakeičia kiti, tačiau žodžiai, žymintys sąvokas iš Swadesh sąrašo, yra ypač stabilūs. Nepaisant to, jie palaipsniui keičiami.Lyginant Swadesh sąrašus su susijusiomis kalbomis ir skaičiuojant, kiek koncepcijų yra žymimos skirtingais žodžiais, galima nustatyti kalbos giminingumo laipsnį (kuo daugiau rungtynių, tuo arčiau kalbų). Taigi akivaizdu, kad rusų ir lenkų kalbose bus daug daugiau sutapimų nei rusų ir anglų kalbomis, tačiau mažiau nei rusų ir ukrainiečių. Tačiau, jei mes taip pat nustatysime, kaip greičiau pakeisti žodžius iš bazinio sąrašo, tada galima tiksliai nustatyti kalbos neatitikimą.

Praktiškai glottochronologija susiduria su daugeliu rimtų techninių ir metodinių problemų. Pavyzdžiui, ne visada aišku, ar du žodžiai iš susijusių kalbų yra vieno žodžio palikuonys, t. Y. Ar manyti, kad sąvoka yra identiška arba ne. Paveikslėlis iškraipytas, visų pirma žodžiai, pasiskolinti iš vienos kitos kalbos, nebūtinai susiję (paaiškėja, kad sąvoka yra žymima tuo pačiu žodžiu, tačiau priežastis iš tikrųjų yra ne kalbų giminystė, bet jų glaudus ryšys). Ne visada aišku, ką daryti, jei sąvoka gali būti žymima keliais sinonimais. Nepaisant to, glottochronologija aktyviai naudojama šiuolaikinėje kalbotyroje.Rusų kalbos mokytojas Sergejus Anatolijevičius Starostinas smarkiai išplėtojo ir papildė Swadešo idėjas, ypač įkūrė projektą "Babilono bokštas", kurio pagrindu buvo Instituto Santa Fe, kuris buvo skirtas fundamentiniams kalbų giminystės tyrinėjimams. Starostinas ir jo pasekėjai analizavo daugybę pasaulio kalbų ir daugeliu atvejų pateikė įdomių išvadų, tačiau kai kurios iš jų kelia rimtų abejonių tarp kai kurių kalbininkų.

Autoriai išanalizavo sąvokų apibūdinimą iš Swadesh 200 žodžių sąrašo 87 Indoeuropiečių kalbų. Sąvokų (reikšmių) sąrašas apima įvairias kalbos dalis ("viskas", "ir", "gyvūnas", "blogas", "nes", "melas", "jis", "juodas", "supjaustytas", "ugnis" , "Du" ir kt., Išsamų sąrašą žr. Papildomoms straipsnio medžiagoms, PDF, 1,2 MB). Kalbos duomenis paėmė tyrėjai iš tų, kurie aprašyti I. Dyen, J. B. Kruskal, P. Black (1992). Kalbant apie etimologiją (žodžių kilmė), atrodo, kad visose sudėtingose ​​bylose remiamasi indoeuropiečių klasifikacija, leksinės bazės leksikostatinis eksperimentas.

Žodžiai iš skirtingų kalbų, žymintys tą pačią sąvoką ir to paties žodžio palikuonys, buvo sujungti į "susijusias grupes".Pavyzdžiui, žodis, išreiškiantis "dviejų" reikšmę visose indoeuropiečių kalbose, reiškia tą pačią giminės grupę (Eng. du, jis Zwei, isp. dos, fr. Deux, Rusų kalba du ir tt), o, pavyzdžiui, "uodegos" reikšmė pateikiama 87 kalbomis, kurias ištyrė 28 grupės (graikų ουρά, jis Schwanz, fr. eilėAnglų kalba uodega – įvairių grupių žodžių pavyzdžiai). Bendras susijusių grupių skaičius 200 verčių 87 kalbomis pasirodė 4049.

Kiekvienai iš 200 koncepcijų buvo nustatytas buvimo dažnumas. Tuo tikslu autoriai išanalizavo didelę duomenų apie žodinę ir rašytinę kalbą keturias kalbas: anglų, ispanų, rusų ir graikų kalbas (nuo 20 iki 100 milijonų žodžių kiekvienai kalbai). Šios kalbos yra tolimos indoeuropiečių šeimos šakos. Pasirodo, kad skirtingų koncepcijų naudojimas keturiomis kalbomis yra labai panašus, kitaip tariant, dažniausiai vartojamos sąvokos vienoje iš kalbų greičiausiai bus vartojamos kitomis kalbomis ir atvirkščiai.

Kitas žingsnis buvo sukurti 87 indoeuropiečių kalbų evoliucinį medį. Medžio pastatymo pagrindas buvo 87×4049 nulių lentelė, iš kurios matyti, ar kiekvienoje iš 4049 verbalinių grupių yra kiekviena iš 87 kalbų.Tuo pačiu metu buvo naudojami evoliucinių biologų sukurti evoliucinių medžių sudėtingi matematiniai metodai.

Indoeuropiečių kalbų evoliucinis medis. Įvairios spalvos nurodomi indoeuropiečių kalbos šeimos pagrindiniai padaliniai (grupės), rodyklės – 4 kalbos, naudojamos skaičiuoti naudojimo dažnumą. Numeriai atspindi įvairių medžių fragmentų patikimumą (statistinį tikrumą). Pav. iš papildomų medžiagų iki straipsnio Pagel ir kt.

Medis "kalibruojamas" (nustatant absoliučią šakų ilgį per metus) buvo naudojamas indoeuropiečių kalbų vidurkio pradžios vidurkis – prieš 8700 metų (esami skaičiavimai skiriasi nuo 6 iki 10 tūkstančių metų, o skirtumas pasikeis. bet ne jų santykis). Remiantis sukonstruoto medžio, buvo apskaičiuoti vidutiniai žodžių (susijusių grupių) pakeitimo koeficientai kiekvienam iš dviejų šimtų koncepcijų. Šis greitis gali būti išreikštas kaip "pusinės eliminacijos periodas" (pusinės eliminacijos periodas), t. Y. Laikas, kai ši koncepcija su 50% tikimybe bus žymima kitu žodžiu (tiksliau, žodžiu, priklausančiu kitai susijusiai grupei).Paaiškėjo, kad 200 koncepcijų, kurios buvo tiriamos šiuo metu, svyruoja nuo 750 iki 10 000 metų.

Nesunku pastebėti, kad gautas medis skiriasi nuo visuotinai priimto (žr. Straipsnio pradžioje). Įdomu, kad naujame medyje ukrainiečiai ir baltarusiai yra arčiau lenkų nei rusų (rusų šakos iš lenkų-ukrainiečių-baltarusių grupės, kuri tada suskirstyta į tris kalbas), o pagal tradicines idėjas vakarų slavų (įskaitant lenkų) ir Rytų slavų (rusų, baltarusių, ukrainiečių) grupė. Gali būti daug priežasčių, dėl kurių skiriasi neatitikimai, o medžių statymo rezultatai daugiausia priklauso nuo to, kaip mokslininkai sprendžia iškylančias problemas (žr. Keletą pavyzdžių). Straipsnio autoriai išsamiai neapibūdina savo metodologijos dalies, todėl sunku tiksliau išanalizuoti medžių skirtumo priežastis.

Žodžių pasikeitimo greičio priklausomybė (vertikali ašis) apie jų vartojimo dažnumą (horizontali ašis) keturiomis kalbomis (a – anglų kalba b – ispanų c – rusų k. d – graikų kalba). Pilka spalva – sąjungos mėlynas – prielinksniai raudona – būdvardžiai mėlynas – veiksmažodžiai, žalia – daiktavardžiai geltona – vadinamosios "specialiosios kalbos" (specialiosios kalbos): "kas", "kur", "kada", "kaip", "čia", "ten", "ne"; oranžinė – įvardžiai, raudona – skaitmenys juodas – visus žodžius kartu. Pav. iš straipsnio Pagel ir kt.

Tuomet autoriai sukūrė anglų, rusų, ispanų ir graikų žodžių vartojimo dažnumo grafų grafiką (žr. Paveikslą). Pasirodo, kad kiekvienai kalbos daliai atskirai ir visoms koncepcijoms kaip visumai yra gerai išreikštas atvirkštinis ryšys tarp šių dviejų rodiklių. Kuo dažniau vartojamas žodis, tuo lėtesnis jis pasikeičia.

Pasak autorių, ši priklausomybė gali būti paaiškinta dviem priežastimis:
1) Žmonės yra mažiau linkę klaidingai pasakyti, pamiršti ir klausytis dažnai vartojamų žodžių. Ši prielaida pagrįsta empiriniais duomenimis.
2) Žmonės (gimtoji kalba gyventojų) mažiau linkę priimti naujovių, kai kalbama apie dažnai naudojamą žodį.

Gali būti, kad abu mechanizmai veikia vienu metu. Lengva suprasti, kad jie yra visiškai analogiški pagrindiniams biologinės evoliucijos veiksniams, būtent, mutacijos greičiui ir stabilizavimo ("valymo") atrankos veiksmingumui.Autoriai teigia, kad svarbiausių žodžių "mutacijos" dažniausiai nutrūksta "atranka", nes tokios mutacijos kelia didžiausią abipusio nesusipratimo pavojų. Galbūt dėl ​​to iš visų kalbos dalių labiausiai lėtai keičiasi tos "mutacijos", kuriose beveik visada lemia visiškas frazės reikšmės praradimas ar iškraipymas (skaitmenys, įvardžiai ir "specialiosios kalbos").

Pastebėtas modelis gali būti tinkamas ir kitoms kalbų šeimoms. 2006 m. Tie patys autoriai parodė, kad sąvokos, kurioms būdingas didelis perviršio paplitimas indoeuropiečių kalbomis, turi tą patį turtą bantu kalbomis.

Autoriai pažymi, kad nustatytas modelis leidžia mums padaryti įdomias prognozes. Pirma, galima tikėtis, kad, kai dvi kalbos, turinčios bendrą "protėvį", skiriasi, skirtumai pirmiausia kaupiasi mažiau svarbiais žodžiais, todėl dvi kalbos išliks abipusiškai suprantamos daug ilgiau, nei galima tikėtis, darant prielaidą, kad atsitiktinis pasiskirstymas nauji pokyčiai visame leksikone. Antra, tyrimas parodėkad dažnai vartojami žodžiai gali būti saugomi atpažįstame forma dar 10 000 ar daugiau metų; Tai reiškia, kad kultūros evoliucijoje yra galimos "replikatorių" (memezų) galimybės, kurių patikimumas yra beveik palyginamas su jų replikacija (perdavimu, dauginimu) su kai kuriais genais.

Norėčiau atkreipti skaitytojų dėmesį į nepaprastą lentelę, pateiktą "papildomose medžiagose" (PDF, 1.2 Mb), kurioje išvardijami analogijos tarp kalbinės ir biologinės evoliucijos (santrumpa pateikiama žemiau):

Biologinė evoliucijaKalbos raida
Diskretiški paveldimumo vienetai (genetinis kodas, morfologija, elgesys)Diskretiški paveldimumo vienetai (leksika (žodynėlis), sintaksė, fonologija)
HomologijaSusijusių žodžių grupės
Mutacijos (pvz., Nukleotidų pakaitalai)Naujovės (pavyzdžiui, garsų keitimas žodžiu)
DreifasKalbos dreifas
Natūrali atrankaSocialinė atranka
Cladogenesis (evoliucija pagal nukrypstančias linijas) – alopatrijos išskyrimas (geografinis atskyrimas) ir simpatrio išskyrimas (ekologinis / reprodukcinis atskyrimas)Kalbos neatitikimas dėl geografinio ir socialinio padalijimo
Anagenezė (evoliuciniai pokyčiai be linijų atskyrimo)Keisti be prieštaringumo
Horizontalus genų mainai (pvz., Hibridizacijos metu)Skolintis
HibridaiKreolų kalbos (pvz., Surinamas, tai yra sranantonga, tas pats)
FosilijosSenovės tekstai
Išnykimo rūšysKalbų išnykimas

Apskritai pačių autorių idėjos neturi esminės naujovės. Tačiau konkrečių statistinių metodų, išbandytų ant biologinės medžiagos glottochronologijoje, naudojimas yra neabejotinai naujas. Vienintelis apgailestauja, kad autoriai nesistengia palyginti savo rezultatų su tuo, ką jau įgijo kalbininkai.

Lingvistinės evoliucijos palyginimas su biologine įvairove taip pat buvo pastebėtas daugumoje darbų (vadiname A. Wedel, pavyzdiniai modeliai, evoliucija ir kalbos pokyčiai // Lingvistikos apžvalga, 2006. V. 23. p. 247-274) ir neabejotinai turi teisę egzistuoti tačiau reikia atsargiai suprasti žodžius ir gyvenančius asmenis, kalbas ir rūšis. Biologinių ir kalbinių objektų atsiradimo, vystymosi ir nykimo mechanizmai vis dar gana skirtingi. Nepaisant to, yra pagrindo tikėti (ir patikrinti darbai patvirtina tai), kad kai kuriuos bendrus abiejų evoliucijos mechanizmus galima apibūdinti tais pačiais metodais, kurieŽinoma, tai yra labai įdomu tiek praktiniu, tiek teoriniu požiūriu.

Šaltiniai:
1) Erez Lieberman, Jean-Baptiste Michel, Joe Jackson, Tina Tang, Martin A. Nowak. Apskaičiuojant evoliucinę kalbos dinamiką // Gamta. 2007. V. 449. P. 723-716.
2) Markas Pagelis, Kventinas D. Atkinsonas, Andrew Meade. Leksinės evoliucijos dažnis visoje Indoeuropiečių istorijoje // Gamta. 2007. V. 449. p. 717-720.

Aleksandras Марков, Aleksandras Бердичевский


Like this post? Please share to your friends:
Parašykite komentarą

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: