Preview

Вестник НГУ. Серия: Информационные технологии

Расширенный поиск

Статистический метод количественной оценки понятности иностранных славянских языков для русскоязычного читателя

https://doi.org/10.25205/1818-7900-2021-19-1-61-79

Аннотация

Разбирается вопрос понимаемости иностранного текста на славянском языке для неподготовленного информанта. Целью статьи было выяснить, какую долю слов иностранного текста информанты смогут понять при условии, что они не знакомы с этим языком. Для определения понимаемости текста мы использовали параллельный текст с пропущенными словами. В русской версии текста пропускалась часть слов, задача информанта - восстановить эти слова, используя в качестве подсказки параллельный текст на одном из славянских языков: украинском, белорусском, польском, чешском, словацком, сербском, словенском и болгарском. Часть информантов использовалась в качестве контрольной группы, и параллельный текст им не предъявлялся. Мы высказали гипотезу о том, что понятность текста на иностранном языке может быть определена как увеличение доли корректно восстанавливаемых слов в группе, которой предъявляется параллельный текст на иностранном языке, над долей слов, корректно восстановленных контрольной группой. Результаты экспериментов подтвердили нашу гипотезу. Также мы разделили все пары «пропущенное слово - перевод» на четыре группы: полные и частичные когнаты, генетические когнаты, не когнаты и ложные друзья. Корреляция средней понятности текста по всем информантам для данного языка с долей полных и частичных когнатов составила 0.7, тогда как для остальных групп была отрицательной. За счет этого можно утверждать, что понятность иностранного текста по большей части определяется долей полных когнатов, но при этом зависит от некоторых других параметров. Результаты экспериментов и программное обеспечение для их анализа размещены по адресу https:// github.com/klyshinsky/mutual_intelligibility_Russian.

Об авторе

Э. С. Клышинский
Институт прикладной математики им. М. В. Келдыша РАН
Россия


Список литературы

1. Бейкер М. Атомы языка: грамматика в темном поле сознания. М.: Изд-во ЛКИ, 2008. 272 с.

2. Moberg, J., Gooskens C., Nerbonne J., Vaillette N. Conditional Entropy Measures Intelligibility among Related Languages. Lot Occasional Series, 2007, vol. 7, p. 51-66.

3. Gooskens C. The Contribution of Linguistic Factors to the Intelligibility of Closely Related Languages. Journal of Multilingual and Multicultural Development, 2007, vol. 28, no. 6, p. 445-467.

4. Golubović J., Gooskens C. Mutual intelligibility between West and South Slavic languages. Russ Linguist, 2015, no. 39, p. 351-373.

5. Gooskens C., Swarte F. Linguistic and extra-linguistic predictors of mutual intelligibility between Germanic languages. Nordic Journal of Linguistics, 2017. no. 40 (2), p. 123-147. DOI 10.1017/S0332586517000099

6. Kyjánek L., Haviger J. The Measurement of Mutual Intelligibility between West-Slavic Languages. Journal of Quantitative Linguistics, 2019, vol. 26, iss. 3, p. 205-230. DOI 10.1080/ 09296174.2018.1464546

7. Keatley C. W. History of bilingualism research in cognitive psychology. In: Harris R. J. (ed.). Cognitive processing in bilinguals. Elsevier, 1992, p. 15-49.

8. Grainger J. Visual word recognition in bilinguals. In: Schreuder R., Weltens B. (eds.). The bilingual lexicon. Amsterdam, 1993, p. 11-26.

9. Lemhöfer K., Dijkstra T. Recognizing cognates and interlingual homographs: Effects of code similarity in language-specific and generalized lexical decision. Memory & Cognition, 2004, no. 32 (4), p. 533-550. DOI 10.3758/BF03195845

10. Hammarström H. Counting Languages in Dialect Continua Using the Criterion of Mutual Intelligibility. Journal of Quantitative Linguistics, 2008, vol. 15, no. 1, p. 34-45.

11. Коряков Ю. Б. Проблема «язык или диалект» и попытка лексикостатистического подхода // Вопросы языкознания. 2017. № 6. C. 79-101. DOI 10.31857/S0373658X0003839-1

12. Heeringa W. J. Measuring Dialect Pronunciation Differences using Levenshtein Distance. PhD thesisю Groningen, 2004, 315 p.

13. Клышинский Э. С., Логачева В. К., Белобокова Ю. А. Понимаемость текста на иностранном языке: случай славянских языков // Препринты ИПМ им. М. В. Келдыша. 2017. № 13. 23 с. DOI 10.20948/prepr-2017-13

14. Zarei A. A., Ab M. A. The Contribution of Word Formation, Code Mixing, Multiple Choice, and Gap Filling Tasks to L2 Vocabulary Comprehension and Production. International Journal of Language Learning and Applied Linguistics World, 2013, no. 4 (1), p. 7-55.

15. Ackerman P. L., Beier M. E., Bowen K. R. Explorations of crystallized intelligence: Completion tests, cloze tests, and knowledge. Learning and Individual Differences, 2000, vol. 12, iss. 1, p. 105-121.

16. Ageeva E., Tyers F. M., Forcada M. L., Pérez-Ortiz J. A. Evaluating machine translation for assimilation via a gaplling task. In: EAMT-2015: 18th Annual Conference of the European Association for Machine Translation, 2015, p. 137-144.

17. Ягунова Е. В. Исследование избыточности русского звучащего текста // Тр. Ин-та лингвистических исследований. СПб.: Наука, 2010. Т. 4, ч. 2. С. 90-114.

18. Ferrer i Cancho R. The variation of Zipf’s law in human language. The European Physical Journal B - Condensed Matter and Complex Systems, 2005, no. 44, p. 249-257.

19. Кочеткова Н. А., Клышинский Э. С., Ермаков П. Д. Подчиняются ли составные конструкции закону Ципфа? // Системный администратор. 2016. № 11. С. 89-95.

20. Bouckaert R., Lemey P., Dunn M. et al. Mapping the Origins and Expansion of the Indo-European Language Family. Science, 2012, vol. 337, p. 957-960.

21. Klyshinskiy E., Karpik O. V. Quantitative Evaluation of Syntax Similarity. Mathematica Montisnigri, 2019, vol. 46, p. 123-132. DOI 10.20948/mathmon-2019-46-11

22. Lopukhina A., Lopukhin K., Nosyrev G. Automated word sense frequency estimation for Russian nouns. In: Lyashevskaya O., Kopotev M., Mustajoki A. (eds.). Quantitative approaches to the Russian language. Routledge, 2018, p. 79-94. DOI 10.4324/9781315105048-4


Рецензия

Для цитирования:


Клышинский Э.С. Статистический метод количественной оценки понятности иностранных славянских языков для русскоязычного читателя. Вестник НГУ. Серия: Информационные технологии. 2021;19(1):61-79. https://doi.org/10.25205/1818-7900-2021-19-1-61-79

For citation:


Klyshinsky E.S. Quantitative Estimation of Intelligibility of Foreign Slavic Languages: Case of Russian Native Speakers. Vestnik NSU. Series: Information Technologies. 2021;19(1):61-79. (In Russ.) https://doi.org/10.25205/1818-7900-2021-19-1-61-79

Просмотров: 95


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1818-7900 (Print)
ISSN 2410-0420 (Online)