Miért Nyelvek és Nyelvjárások - Ezek Teljesen Más Dolgok - Alternatív Nézet

Miért Nyelvek és Nyelvjárások - Ezek Teljesen Más Dolgok - Alternatív Nézet
Miért Nyelvek és Nyelvjárások - Ezek Teljesen Más Dolgok - Alternatív Nézet

Videó: Miért Nyelvek és Nyelvjárások - Ezek Teljesen Más Dolgok - Alternatív Nézet

Videó: Miért Nyelvek és Nyelvjárások - Ezek Teljesen Más Dolgok - Alternatív Nézet
Videó: Джимми Уэйлс рассказывает о рождении википедии. 2024, Lehet
Anonim

Gyakran az egyszerű kérdések összetett válaszokat adnak. Például: mi a különbség a nyelv és a nyelvjárás között? Ha úgy dönt, hogy erről kérdez egy nyelvészt, akkor dőljön hátra. Bár első pillantásra nincs semmi nehéz ebben a kérdésben, különböző módon lehet megválaszolni.

A nyelv és a nyelvjárás megkülönböztetése egyik vagy másik nézőponttól függhet. Politikai szempontból a nyelv az, amit az emberek általában nemzetként beszélnek. Például 1850 és 1992 között létezett az úgynevezett szerb-horvát nyelv, amely több nyelvjárást is magában foglalt, köztük szerb, horvát és bosnyák. De miután Jugoszlávia az 1990-es évek közepén több független államra szakadt, ezeket a nyelvjárásokat külön nyelvként ismerték el. Ez a politikai meghatározás részben működik, bár több problémát, mint megoldást hoz magával: vannak olyan nyelvek, amelyeket különböző országokban beszélnek, ennek markáns példája a latin-amerikai spanyol. Senki nem vitatja, hogy a mexikói spanyol és a kolumbiai spanyol különböző nyelvek. Esetleg spanyolul, Spanyolország egyes részein beszélnek,annyira különbözik latin-amerikai fajtáitól, hogy megérdemli, hogy külön nyelvnek nevezzék, de ez nem teljesen világos.

Mi van, ha a kölcsönös megértés kritériuma alapján vezetjük a határt a nyelv és a nyelvjárás között? Sajnos ez a megközelítés sem ideális. Egy dán valamivel jobban meg fogja érteni a svéd nyelvet, mint egy svéd - dán. Ugyanígy az a személy, aki a brit angol sajátos paraszti dialektust beszél, sokkal jobban megérti egy Los Angeles-i amerikait, mint egy amerikai. A kölcsönös megértés gyakran külső tényezőktől függ - ezek meglehetősen kontrollálhatatlan változó - és nem a nyelv eredendő tulajdonságaitól.

Tehát talán tisztán nyelvi megközelítést kellene alkalmaznunk. Képzelje el, hogy szisztematikusan mérhetjük a két beszédváltozat közötti különbséget (D). A D sajátos jelentése lehetővé tenné számunkra a határ megadását két nyelvjárás és két nyelv között. Egy ilyen érték megtalálása nem lehet nagyon nehéz, mivel a két nyelvet sok szempont alapján lehet összehasonlítani, például hangalapú leltár, nyelvtani jellemzők vagy szókincs szerint.

De mi van akkor, ha a beszédváltozatok közötti különbségek fokozatosak, és a D adott értékének megtalálásának valószínűsége akkora, mint valamilyen más érték megtalálásának valószínűsége? Ekkor a D tetszőleges értékét kellene kiindulópontként választanunk, és egy tetszőleges érték visszavetne minket olyan politikai vagy gyakorlati jellegű megfontolások elé, amelyeket nem akartunk figyelembe venni. Azt akarjuk, hogy a törésvonalunk azon a szinten legyen, ahol a szerb és a horvát nyelv különféle vagy egy nyelv? A világ nyelveinek katalogizálásával hány ezer nyelvet akarunk feledésbe engedni: ötöt? Vagy hét? Talán tízezer?

Az elmúlt években a nyelv és a nyelvjárás megkülönböztetésének két fő akadályát sikerült legyőzni. Az első a beszédváltozatok közötti különbségek mérése - vagyis a D. értékének megtalálása. 2008-ban egy nyelvészcsoport létrehozta az Automatizált hasonlóság-megítélési programot (ASJP), amelynek napi kurátora és alapítója a tiéd. Az ASJP gondosan elkészített egy szisztematikus nyelv-összehasonlító adatkészletet, amely jelenleg 7655 szólistát tartalmaz. Ezek a világ nyelveinek kétharmadára vonatkoznak, feltételezve, hogy céljaink szempontjából a nyelveket az ISO 639-3 szabvány kód határozza meg. Mivel minden egyes szavak listája 40 fogalom rögzített halmazát tartalmazza, amelyeket következetesen értelmeznek, könnyű összehasonlítani őket, és így megmérni a különbséget. A két szó közötti különbség leggyakrabban a Levenshtein távolság, egy kifejezés, amelyet Vladimir Levenshteinről, egy szovjet tudósról neveztek el, aki 1965-ben algoritmust dolgozott ki két karakterlánc összehasonlítására. Meghatározta a "távolságot", mint a helyettesítések, beillesztések és törlések minimális számát, amelyek szükségesek ahhoz, hogy az egyik sort egy másikba átalakítsák. A Levenshtein távolságot hasznosan el lehet osztani a két vonal közül a leghosszabb hosszával, és így az összes távolságot 0-tól 1-ig terjedő skálán fel lehet tüntetni. Ezt a jelenséget normalizált Levenshtein-távolságnak vagy LDN-nek nevezzük. Meghatározta a "távolságot", mint a helyettesítések, beillesztések és törlések minimális számát, amelyek szükségesek ahhoz, hogy az egyik sort egy másikba átalakítsák. A Levenshtein távolságot hasznosan el lehet osztani a két vonal közül a leghosszabb hosszával, és így az összes távolságot 0-tól 1-ig terjedő skálán fel lehet tüntetni. Ezt a jelenséget normalizált Levenshtein-távolságnak vagy LDN-nek nevezzük. Meghatározta a "távolságot", mint a helyettesítések, beillesztések és törlések minimális számát, amelyek szükségesek ahhoz, hogy az egyik sort egy másikba átalakítsák. A Levenshtein távolságot hasznosan el lehet osztani a két vonal közül a leghosszabb hosszával, és így az összes távolságot 0-tól 1-ig terjedő skálán lehet elhelyezni. Ezt a jelenséget normalizált Levenshtein-távolságnak vagy LDN-nek nevezzük.

A második akadály az, hogy talán a „nyelv” és a „nyelvjárás” olyan fogalmak, amelyeket csak önkényes sorrendben lehet meghatározni. Itt van néhány nagyon biztató hír az Ön számára. Ha megnézzük az ASJP adatbázis összes nyelvcsaládját, ahol a projekt résztvevői a szorosan kapcsolódó fajták jelentős hányadát vették fel, elkezdhetjük keresni a nyelvek és a nyelvjárások különböző viselkedési típusait. Érdekes kép rajzolódik ki előttünk: a távolságok általában vagy egy viszonylag kis érték körül, vagy egy viszonylag nagy körül ingadoznak, és depresszió alakul ki közöttük. Mint kiderült, leggyakrabban ez a vályú keskeny tartományban fekszik, átlagosan körülbelül 0,48 LDN. Nem fogunk tévedni, ha azt mondjuk, hogy a beszédváltozatok általában nem hasonlítanak egymásra alapvető szókincsükben. Vagy hajlamos a nagyobb hasonlóságra, ebben az esetben a beszédváltozatok különböző dialektusként határozhatók meg, vagy kevésbé hasonlóságként, ebben az esetben különböző nyelvekhez rendelhetők. Itt rejlik a határ a nyelv és a nyelvjárás között.

Ez a jelenség valószínűleg társadalmi körülmények következménye. A dialektusok szétválnak, amikor az emberek új területekre telepednek és új identitásokat alakítanak ki, de ha még van némi kapcsolat közöttük, konvergencia valósulhat meg, így a beszédváltozatok több mint 50 százalékban hasonlóak maradnak (és így a beszéd is egy nyelvről szól). A divergencia felé történő enyhe törekvés azonban a nyelvváltozatok viszonylag gyors eltérését okozhatja, növelve a Levenshtein távolságot, amely esetben külön nyelveknek minősíthetjük őket. Összefüggés lehet az ASJP által használt szabványos listában szereplő szavak közötti távolság és a nyelvi szerkezet más részein lévő megfelelő távolságok között, ami a megértés súlyos elvesztéséhez vezethet. Más szavakkal,a megértés küszöbe korrelálhat a nyelvek és a dialektusok küszöbével. Még nem tanulmányoztuk ezt a kérdést, de mint kutatási tárgy rendkívül érdekes.

Promóciós videó:

Miután eljutottunk egy objektív, nem pedig önkényes kritériumhoz a nyelvek és a nyelvjárások elkülönítésére, alkalmazhatjuk a világ nyelveire. Néhány olyan beszédfajtapár, amelyet nemzeti nyelvnek tekintenek, mint például a bosnyák és a horvát, jóval a 0,48-as LDN-küszöb alatt vannak (ami azt jelenti, hogy Jugoszlávia lététől függetlenül ugyanaz a nyelv). Nem messze vannak ettől a küszöbtől olyan nyelvek, mint a hindi és az urdu (ezeket két különböző nyelvnek alig lehet nevezni). És az arab és a kínai fajták, amelyeket gyakran ugyanazoknak a nyelveknek tekintenek, az LDN = 0,48 felett szárnyalnak (ezek a fajták külön nyelvek). Valójában többféle fajfaj létezik, amelyeket általában különböző nyelveknek tekintenek, de a határon ingadoznak: például a dán és a svéd, amelyek LDN-je 0,4921.

Végül egy adatsorokból származó technikát, az úgynevezett ASJP-kronológiát lehet alkalmazni annak megállapításához, hogy mennyi idő szükséges ahhoz, hogy a dialektusok egymástól elég messze elhatárolódjanak ahhoz, hogy külön nyelveknek tekintsék őket. Az általunk talált eredmény 1059 év, ha nem veszünk figyelembe valamilyen hibát. Ezeket a megállapításokat alátámasztja, hogy mennyi időbe telik, amíg a nyelvcsalád általános nyelve szétesik leánynyelvekké, amelyek később az alcsaládok őseivé válnak. Ehhez más elemzési módszerekre van szükségünk, de az eredmények hasonlóak: körülbelül egy évezredbe telik, hogy a nyelvjárásokat nyelvekké alakítsuk. Tudjuk ezt, mert most meg tudjuk különböztetni a másikat.

Søren Wichmann dán nyelvész, aki együttműködik a Leiden Egyetemmel (Hollandia), a Kazan Szövetségi Egyetemmel (Oroszország) és a Pekingi Nyelvi Egyetemmel (Kína). Legfrissebb könyvét, a nyelvi tipológiai jellemzők időbeli stabilitását (2009) Eric W. Holman társszerzővé tette.