Дослідження мовного розмаїття та його еволюції

 

Науковці з Інституту еволюційної антропології імені Макса Планка в Лейпцигу та Оклендського університету в Новій Зеландії створили базу лінгвістичних даних зі всього світу. Мета проєкту – здобути нові свідчення про розвиток слів та звуків у найпоширеніших сьогодні мовах. Зараз цей лексичний банк (Lexibank) містить стандартизовані лексичні дані з понад 2000 мов, тож зараз становить наймасштабнішу публічну колекцію.

 

 

Lexibank містить стандартизовані лексичні дані про понад 2000 мов і в майбутньому полегшить процес дослідження мовного різноманіття та його еволюції. Зображення: mpg.de.

 

Чи правда, що у багатьох мовах світу для позначення матері та батька використовують слова, подібні на “мама” й “тато”? А якщо в певній мові “руку” та “передпліччя” називають одним словом, то чи означає це, що й на позначення “ноги” та “стопи” також відведене одне слово? Як вдається обмеженою кількістю слів виражати значно більше сенсів?

 

Міждисциплінарна команда, до складу якої увійшли лінгвісти, інформатики та психологи, створила масштабну базу даних, за допомогою якої можна досліджувати чимало мовних питань комп’ютерними методами.

 

Наш відділ виник 2014 року, тоді ми зіткнулися зі справжнім викликом: на світі існує понад 7000 мов. Чи можна створити базу даних, котра б задокументувала мовне різноманіття в таких деталях, як ніяка інша, – сказав директор Рассел Ґрей (Russell Gray). – Нас надихнув GenBank (генетичний банк) – об’ємна база даних, що містить генетичні дані з цілого світу. Генетичний банк став переломним моментом. Величезний обсяг даних про ДНК у публічному доступі – це призвело до революції в тому, як ми можемо аналізувати біологічне різноманіття. Зі свого боку, ми сподіваємося, що перший лексичний банк (Lexibank), котрий ми зараз створюємо, збираючи численні лінгвістичні бази даних та збірники, так само здійснить революцію в нашому розумінні мовного розмаїття”.

 

Lexibank містить дані у формі стандартизованих списків слів для понад 2000 мовних варіацій. “Праця над Lexibank супроводжується намаганням уніфікувати формати лінгвістичних баз даних. Так Lexibank, з одного боку, демонструє переваги стандартизації, а з іншого боку, виконує функцію каталізатора стандартизації лінгвістичних даних у майбутньому, – пояснив Роберт Форкель (Robert Forkel), під чиїм керівництвом відбувається комп’ютерна частина збору даних. – Ми вирішили створити наші власні стандарти, так званий крос-лінгвістичний формат даних, які вже успішно застосовували на інших проєктах, до котрих залучений наш підрозділ”.

 

Запропоновані стандарти науковці підсилили новим програмним забезпеченням, що суттєво полегшує робочі процеси в сфері лінгвістики. “Ми розробили новий комп’ютеризований процес, що дає змогу порівнювати вже наявні мовні бази даних, – сказав Йоган-Маттіс Ліст (Johann-Mattis List), керівник практичної частини управління даними. – Завдяки такому процесу ми суттєво підвищили ефективність стандартизації та управління даними”.

 

Крім збору та підготовки стандартизованих даних, команда розробила новий комп’ютерний метод для дослідження еволюції мовного розмаїття. Як ці методи можна застосувати на практиці, пояснює нещодавня публікація, в котрій подібності та відмінності мов вираховують згідно з 6 критеріями.

 

Завдяки стандартизації мовних даних ми можемо легко перевірити, у скількох мовах слова, подібні на “мама” і “тато”, позначають “матір” та “батька, – повідомив Ліст. – Виявилося, що ця схема насправді зустрічається в багатьох мовах світу, в дуже відмінних регіонах, – додав Сімон Д. Ґрінгіл (Simon J. Greenhill), один із засновників проєкт Lexibank. – Не всі мови, яким властива ця схема, тісно пов’язані між собою. Це може вказувати на незалежну, паралельну еволюцію мови, про яку говорив ще Роман Якобсон 1968 року”.

 

З допомогою нової бази даних та автоматичного обрахунку мовних ознак, можна детально досліджувати й інші аспекти мовного різноманіття та мовної еволюції. “Очевидно, аналіз не вичерпується прикладами, наведеними вище, – сказав Ліст. – Зовсім навпаки, ми б хотіли заохотити спеціалістів у сферах лінгвістики, психології та еволюційної теорії підхопити нашу ініціативу, доповнити базу даних новими даними й розробляти нові методи дослідження”, – завершив Форкель.

 

У своїй актуальній публікації автори представили цікаві результати, які потребують наступних досліджень. “Ми з’ясували, що мови, в котрих є тільки одне слово для позначення “руки” та “передпліччя”, часто застосовують одне слово для позначення “ноги” та “стопи”, – повідомив Ліст. – Те, що здається звичайним збігом, засвідчує: людська мова в своїй цілісності значно структурованіша, ніж могло б здатися, якщо аналізувати мову поодинці”.

 

 

Sprachliche Vielfalt und ihre Evolution erforschen

mpg.de, 16.06.2022

Зреферувала С.К.

18.06.2022