Hogyan Tárulnak Fel A Voynich-kézirat Titkai: Nyomozás - Alternatív Nézet

Tartalomjegyzék:

Hogyan Tárulnak Fel A Voynich-kézirat Titkai: Nyomozás - Alternatív Nézet
Hogyan Tárulnak Fel A Voynich-kézirat Titkai: Nyomozás - Alternatív Nézet

Videó: Hogyan Tárulnak Fel A Voynich-kézirat Titkai: Nyomozás - Alternatív Nézet

Videó: Hogyan Tárulnak Fel A Voynich-kézirat Titkai: Nyomozás - Alternatív Nézet
Videó: A Voynich-kézirat dekódolt és megoldott? 2024, Lehet
Anonim

Mi áll a Voynich-kézirattal és az orosz tudósokkal kapcsolatos szenzációs hírek mögött, vajon a szövegből pontosan meghatározható-e a nyelv, mennyire megfelelő matematikusok dolgoznak a nyelvészet "területén"?

Április 19-én az orosz média híreket terjesztett az orosz matematikusok "korszakalkotó" felfedezéséről: az új módszert alkalmazó tudósok nemcsak bebizonyították a híres "Voynich-kézirat" értelmességét, hanem azt is meg tudták állapítani, hogy két nyelven írták-e, kivéve a magánhangzókra szánt leveleket.

A Voynich-kézirat egy középkori illusztrált kézirat, amelyet 1912-ben vásárolt Wilfred Voynich antik kereskedő. A 15. században jött létre (a pergamen radiokarbon elemzése alapján - de a legtöbb tudós jelenleg nem tekinti magát a szöveget későbbi hamisításnak), ismeretlen nyelven, ismeretlen ábécé segítségével. Az illusztrációk alapján a szöveg tematikus blokkokból áll: botanikai, csillagászati, farmakológiai és mások. A szöveg dekódolásának bonyolultsága tette a Voynich-kéziratot „szent grálává” a kriptográfusok számára, és számos tanulmány tárgyát képezte, beleértve a Big Data módszereket használókat is.

A kézirat hírét valami szenzációsnak hozták. Ez azonnal aggodalmat ébresztett. „Előtte minden kudarcot vallott egy egyedi dokumentum megfejtése és csak annak megértése, hogy értelmes szöveg-e. 600 év haszontalan erőfeszítés!.. A CIA és az NSA kriptográfusai, szuperszámítógépek, sőt az "okkult tudományok" doktorai aláírták teljes impotenciájukat. Gordon Rugg kriptológus, az Egyesült Királyság Keele Egyetemének legújabb üzenete így hangzik: „A Voynich-kézirat hamis. Egy ilyen „összetett szöveget” könnyű elkészíteni annak, aki ismeri az egyszerű másolási módszereket”- áll a cikkben.

Először is, a szöveg értelmességét még az 1970-es években felismerték, és többször megerősítették a 2010-es évek tanulmányaiban, amelyről még a hazai médiában is kellően részletesen írtak. Másodszor, a hírhez eljuttatott felfedezést csak intézeti előnyomtatás formájában mutatták be, és nem egy nemzetközi szakértői véleményezésű folyóirat cikkében (az előnyomatot még 2016-ban publikálták).

Az anyag bemutatásának ezen furcsaságai arra kényszerítettek minket, hogy először tisztázást keressünk a tanulmány szerzőjétől, majd független szakértőktől - nyelvészektől, akik statisztikai és matematikai módszerekkel, valamint az ősi szkriptek dekódolásával dolgoznak.

Könnyű képletet írni, de nagyon drága elvégezni a numerikus elemzést

Promóciós videó:

Először röviden a tanulmány lényegéről. Az előnyomtatás szerzői, a moszkvai Fizikai és Technológiai Intézet és az Orosz Tudományos Akadémia Alkalmazott Matematikai Intézetének matematikusai munkáikra támaszkodnak, miszerint "a szövegszimbólumok frekvenciaeloszlása nem a szerző vagy a szöveg tárgya, hanem a nyelv stabil jellemzője". Vagyis matematikai eszközök segítségével egy halmaz segítségével meghatározhatja, hogy melyik nyelven van írva, annak a ténynek köszönhető, hogy minden nyelvnek megvan a saját jellegzetes "profilja" (a Hurst-kitevő eloszlása). Ezeket a módszereket alapul véve a tudósok megállapították, hogy a kézirat szövege több nyelv keverékében készült. Ugyanakkor hamis szóközöket adtak hozzá, és eltávolították a magánhangzók hangját jelző szimbólumokat.

A tanulmány vezető szerzője, Jurij Orlov (IPM RAS és MIPT) hangsúlyozta, hogy a Voynich-kézirat egyáltalán nem a munkájuk fő célja. "A" szenzációs "kézirat csupán a nyelvek szövegből történő felismerésének matematikai módszerének illusztrációja - ez valójában probléma a gépi tanulás szempontjából" - mondta Orlov.

Maga a kézirat abszolút nem érdekes számunkra. A tudomány kifejezetten a nyelvek statisztikáira utal. Rajta keresztül megérthetjük, hogy ez a kézirat milyen nyelven íródott. De nem az, amit oda írnak, ez egy fontos pont. - Jurij Orlov. A MIPT és az M. V.-ről elnevezett Alkalmazott Matematikai Intézet Keldysh

A munkában alkalmazott nyelvi módszerrel kapcsolatban Orlov megjegyzi, hogy a szövegkombinációk gyakoriságának elemzése önmagában is jól ismert dolog. A Hurst-indikátort azonban a nyelvészek alig ismerik, mivel matematikai szempontból is nehéz kiszámítani. Maga a képlet könnyen megírható, de a numerikus elemzés nagyon költséges. Ehhez az M. V.-ről elnevezett intézetben található szuperszámítógép. Keldysh, a matematikus hangsúlyozza.

Az indoeurópai nyelvek elemzésre való választását azzal magyarázzák, hogy ezek mind nagyon hasonlóak - mondja Orlov. A matematikusok által kidolgozott mutatók megkönnyítik a nyelvek megkülönböztetését ugyanazon nyelvcsoporton belül, a családok között azonban nem. Természetesen elméletileg lehetséges ugyanazt a munkát más csoportokkal (Urál, Altáj vagy mások) elvégezni, de az elemzés értéke a teljességében rejlik, Orlov biztos. Az indoeurópai nyelvek esetében nem nehéz az egyes nyelvek szövegtörzsét begépelni, nehezebb más családokkal megtenni.

Visszatérve a Voynich-kéziratra, Orlov megjegyezte, hogy kollégáival öt bizonyítást (a szövegben szereplő betűk frekvenciasorrendjének logaritmikus profilját egy és több nyelven, a Hurst-kitevő eloszlását, a feltételes valószínűségek mátrixának spektrális portréját és másokat) idézte a kéziratban szereplő nyelvek keverékéről és a törlésről betűk magánhangzókhoz. Nyomatékosan elhatárolódnak a "kézirat körüli társalgástól", de egyedülálló eredményt mutattak be - nyílt módszert, statisztikai elemzést a megbízhatóság értékelésével, amely függetlenül ellenőrizhető.

A következtetést rontja az a tény, hogy nem értjük, hogy milyen anyagból és miből származnak - ellenőrizték a képletüket

Maga a feltételezés, miszerint a Voynich-kézirat szövege nélkülözi a magánhangzók betűit, a helytelenül elrendezett szóközökkel szép és jó - jegyzi meg Evgenia Korovina nyelvész, aki a nyelv matematikai statisztikájával foglalkozik (Orosz Tudományos Akadémia Nyelvtudományi Intézete). Korábban senki nem tett fel ilyen hipotézist. Például gyönyörűen elmagyarázza, miért van kevesebb betű, mint amire egy európai szöveg esetében számítani lehetne. De a probléma az, hogy a tanulmány szerzői nem is jelezték, hogy mely nyelvű szövegeket hasonlítják össze, és mekkora volumenűek ezek a tesztek. Az előnyomatban rengeteg nyelv szerepel. Ezért a tanulmány nem reprodukálható: ha önkényes szövegeket vesz fel ugyanazon nyelveken, akkor nem tény, hogy ugyanazok a minták fognak megjelenni.

Maria Molina, az ősi nyelvek tanulmányozásának korpuszmódszerekkel foglalkozó szakembere (Nyelvtudományi Intézet, RAS) egyetért Korovinával. Véleménye szerint a nyelvi adatok feldolgozásának új módszerei segítenek abban, hogy információt szerezzenek arról, ami korábban elzárt volt a nyelvkutatók előtt. A rosszul előkészített inputanyagok azonban gyakran még a legfinomabb adatfeldolgozási technikákat is hiteltelenné teszik.

A következtetést rontja az a tény, hogy nem értjük, hogy milyen anyagból állították elő és milyen alapon tesztelték képletüket. Anyagomhoz biztosan tudom, hogy van egy apró módszertani hiba - és kritikusan eltérő számokat kapok. - Maria Molina. RAS Nyelvtudományi Intézet

„Szemét be - szemét ki”, teszi hozzá Molina (a GIGO egy alapelv a számítástechnikában, ami azt jelenti, hogy a helytelen bemeneti adatok helytelen eredményeket eredményeznek, még akkor is, ha maga az algoritmus helyes - jegyezze meg az Indicator. Ru).

A statisztikai módszerek továbbra is az eredmények tippjei, nem az eredmények

Albert Davletshin (az Orosz Állami Bölcsészettudományi Egyetem Összehasonlító Tanulmányok Intézetének a nyelvészeti összehasonlító tanulmányok központjának munkatársa, a maja és a polinéz nyelveket tanulmányozza) még élesebben beszélt. Ha az előnyomtatás szerzői nem fogták megfejteni a Voynich-kéziratot, miért csinálják? És ha konkrétan egy ismeretlen írás dekódolásáról beszélünk, kérdés után kérdés merül fel: „Az írásról nincsenek kezdeti adatok - milyen típusú levél? Hogyan érhetők el a különböző átírások? Hány karakter? Mi alapozza meg az írás természetével kapcsolatos létező feltételezéseket? Mekkora a szóközökkel elválasztott és szóköz nélküli szó hossza? Mit jelentenek a szóközök? Mekkora a szótár? Mekkora az aláírások és a rajzok aránya?

Eleinte kiderül, hogy a szöveg dán és csak dán (és ez történelmileg lehetetlen, amiről egy szó sincs a műben). Aztán kiderül, hogy a szöveg két ismeretlen nyelven van (az ellenőrzés ebben a szakaszban lehetetlennek bizonyul, és hitre épül). Ráadásul számos konzervatív mód van annak bemutatására, hogy két (nagy) oldal egy betűvel, de különböző nyelveken íródik, anélkül, hogy bonyolult matematikai modellekhez kellene folyamodni. Végül, ha magánhangzókat távolítunk el a szövegből, ezt mennyire erősítik meg a szokásos, régóta ismert módszerek (például Sukhotin, Shevoroshkina és Ventris)?"

Davletshin bírálja az ilyen jellegű kutatásokra jellemző filológia és történelem iránti érzéketlenséget is:

Amit a szövegben látok: gyakran vannak olyan emberek, akik el akarják venni az X forrást, és elfelejtik, hogy ez egy forrás, és egy bizonyos történelmi, ideértve a nyelvi kontextust is, létezik, és valahogyan számolnak benne valamit. Érdekes az a hipotézis, miszerint egy kéziratban több nyelv van. De valahogy meg tudnád mutatni emberileg. A statisztikai módszerek továbbra is az eredmények tippjei, nem az eredmények. -Albert Davletshin. Nyelvi Összehasonlító Tanulmányok Központja IVKA RSUH

Nincs kritérium az érdekes eredmények és a szörnyűek megkülönböztetésére

Kiegyensúlyozottabb álláspontot foglalt el Georgy Starostin, az összehasonlító történeti nyelvészet (RSUH) szakértője. Jobban érdekelte, hogy az új matematikai módszerek mennyire hasznosak a nyelvészek előtt álló problémák megoldásában. „A cikkben bemutatott modell furcsa benyomást kelt. Egyrészt úgy tűnik, hogy a "vak" kategóriájába tartozik, a szöveges adatokat elemzi az ábécé szerkezetére vonatkozó előzetes ítéletek nélkül (például a kétoldalas ábrákat, mint az angol ch, sh, két betű kombinációjának kell tekinteni, bár ez valójában egy hang). Másrészt magánhangzókat dobnak ki az összehasonlított húrokból, amelyek a szöveg szerzői szerint kevesebb információt tartalmaznak, és inkább zajt adnak. Általánosságban elmondható, hogy a tesztbázis egyértelműen nagyon kicsi, lehetetlen valami alapvetőről beszélni ennyi nyelven."

Az indoeurópai és az uráli nyelv összehasonlításának eredményei, amelyeket a cikk 3. összehasonlító táblázata mutat be, nem keltenek különösebb optimizmust a Starostinban. Néhány mutató a nyelvek közelségének mértékéről jól megfogható (például németen belüli vagy román belső kapcsolatok), mások gyengén (például a módszertan már nem azonosítja az indoeurópai családot). A lényeg az, hogy nincs kritérium az érdekes eredmények és a szörnyűek megkülönböztetésére. A legjobb esetben a módszer lehetővé teszi a kis nyelvi csoportok kiemelését (bár itt még nem is működik szorosan kapcsolódó finn és észt között), de mindezek a csoportok nélkül is megbízhatóan azonosíthatók.

Az előnyomás 3. táblázata, amely az indoeurópai és az uráli nyelveket összehasonlító eredményeket mutatja be. Ugyanaz a szín a táblázatban. 3 nyelvcsoportot azonosítunk, amelyek páronként közel vannak (a magánhangzó nélküli szövegekben a rendezett frekvenciák eloszlásának L1 normája értelmében). Néhány váratlanul szoros nyelvpár vörös színnel van jelölve, például német / magyar, angol / észt, latin / baszk és görög / finn. Kiadványszerzők: Arutyunov A. A., Borisov L. A., Zenyuk D. A., Ivchenko A. Yu., Kirina-Lilinskaya E. P., Orlov Yu. N., Osminin K. P., Fedorov S. L., Shilin S. A
Az előnyomás 3. táblázata, amely az indoeurópai és az uráli nyelveket összehasonlító eredményeket mutatja be. Ugyanaz a szín a táblázatban. 3 nyelvcsoportot azonosítunk, amelyek páronként közel vannak (a magánhangzó nélküli szövegekben a rendezett frekvenciák eloszlásának L1 normája értelmében). Néhány váratlanul szoros nyelvpár vörös színnel van jelölve, például német / magyar, angol / észt, latin / baszk és görög / finn. Kiadványszerzők: Arutyunov A. A., Borisov L. A., Zenyuk D. A., Ivchenko A. Yu., Kirina-Lilinskaya E. P., Orlov Yu. N., Osminin K. P., Fedorov S. L., Shilin S. A

Az előnyomás 3. táblázata, amely az indoeurópai és az uráli nyelveket összehasonlító eredményeket mutatja be. Ugyanaz a szín a táblázatban. 3 nyelvcsoportot azonosítunk, amelyek páronként közel vannak (a magánhangzó nélküli szövegekben a rendezett frekvenciák eloszlásának L1 normája értelmében). Néhány váratlanul szoros nyelvpár vörös színnel van jelölve, például német / magyar, angol / észt, latin / baszk és görög / finn. Kiadványszerzők: Arutyunov A. A., Borisov L. A., Zenyuk D. A., Ivchenko A. Yu., Kirina-Lilinskaya E. P., Orlov Yu. N., Osminin K. P., Fedorov S. L., Shilin S. A.

Végül érdekes ötlet a nyelv genetikai jellemzőinek meghatározása a Hurst-kitevő eloszlásával, és talán valamilyen tudományos pontra is eljutott. Ehhez azonban nagyszámú, különböző nyelvű szöveg feldolgozására lesz szükség. És azonnal felmerül a probléma: sok nyelv nincs megírva, és továbbra sem tisztázott, hogy mennyire helyes összehasonlítani az ábécés rögzítési rendszereket a fonetikus átírásokkal. Nagyon kevés gyakorlati értelem lesz ebből az ötletből, a Starostin biztos. Legjobb esetben valóban alkalmazható olyan esetekre, mint a Voynich-kézirat, amikor felmerül egy olyan hipotézis, hogy bizonyos szabványos ábécés betűvel ellátott nyelv bizonyos elvek szerint van titkosítva (például magánhangzók törlésével stb.). A világon azonban nagyon kevés ilyen esemény fordul elő.

Összegezve

Mi van az alsó sorban? Az IPM és a MIPT kutatás körüli vita mély szakadást tárt fel a nyelvi közösség (még a statisztikai módszereket használók) és a „kívülállók” között a nyelvészeti szakemberek között, akik úgy döntöttek, hogy matematikai eszközeiket a nyelvi anyagra alkalmazzák.

Az a tény, hogy a matematikusok nem akarnak együtt dolgozni a nyelvészekkel, nem csak durva baklövéseket okoz, amelyek aztán a médiába vándorolnak (például az előnyomtatásban szereplő baszk nyelvet indoeurópainak hívják, ott van a "magánhangzók" kifejezés). A modellek szépségét és a szuperszámítógépek számítási erejét a belépési pont hibái valójában leértékelik. Ismételten, egy másik tudományterület munkatársaival való kapcsolattartás vágyával és nyitottságával ezek a hibák könnyen elkerülhetők.

Lásd itt magát a Voynich-kéziratot.