Statistical criteria of analysis of syntactic idioms.
Keywords:
construction, construction grammar, text corpus, syntactic idiom, statistical analysis, association measure, sentence with phraseological structureAbstract
The article is devoted to the statistical criteria of analysis of syntactic idioms based on the Ukrainian language. Syntactic idioms are considered in terms of construction grammar and interpreted as one of the types of non-compositional language signs – constructions. The main association measures were analyzed: MI, t-score, log-likelihood, Dice, gmean. Association measure of MI was chosen as a statistical criterion that enables determination of the nonrandomness coefficient of two or more words combination in the text, takes into account the frequency of construction, frequency of its components, and size of the corpus and has a formula in general form for constructions with any amount of components. Paper reports the results of the conducted statistical analysis of syntactic idioms models of the Ukrainian language according to the Ukrainian National Linguistic Corpus. It was found that all the analyzed in terms of MI association measure syntactic idioms models are of high (МІ >>3), degree of the non-randomness of components combination that make up the constant part of the sentence, that is characterized by statistically proven coherence.References
Балобанова Л. А. Семантико-прагматический потенциал синтаксических фразеологизмов и их лексикографическое представление в словаре учебного типа : автореф. дисс. на соискание учёной степени канд. пед. наук : спец. 13.00.02 «Теория и методика обучения и воспитания (русский язык как иностранный)» / Л. А. Балобанова / Московский гос. ун-т имени М. В. Ломоносова. – М., 2004. – 28 c.
Бобкова Т. В. Теоретико-методологічні підходи до вивчення колокацій у сучасному мовознавстві / Т. В. Бобкова // Вісник КНЛУ. Серія Філологія. – 2014. – Том 17. № 2. – С. 14-22.
Величко А. В. Синтаксическая фразеология для русских и иностранцев : Учебное пособие / А. В. Величко. – М. : Изд-во МГУ, 1996. – 96 с.
Всеволодова М. В., Лим Су Ён. Принципы лингвистического описания синтаксических фразеологизмов: На материале синтаксических фразеологизмов со значением оценки / М. В. Всеволодова, Ён Лим Су. – М. : МАКС Пресс, 2002. – 164 с.
Залесская В. В. Программа выявления в тексте двучленных статистически значимых осмысленных коллокаций (на материале русского языка) / В. В. Залесская // Технологии информационного общества в науке, образовании и культуре : сборник научных статей. Труды XVII Всероссийской объединенной конференции «Интернет и современное общество» (IMS- 2014), Санкт-Петербург, 19-20 ноября 2014 г. – СПб : Университет ИТМО, 2014. – С. 283–289.
Карпіловська Є. А. Вступ до прикладної лінгвістики: комп’ютерна лінгвістика: Підручник / Є. А. Карпіловська. – Донецьк : ТОВ «Юго-Восток, Лтд», 2006. – 188 с.
Русская грамматика: В 2-х т. – Т. 2. Синтаксис / Под ред. Н. Ю. Шведовой. – М. : Наука, 1980. – 709 с.
Ситар Г. В. Статус синтаксичних фразеологізмів у системі фразеологічних одиниць / Г. В. Ситар // Вісник Донецького національного університету. Серія Б. Гуманітарні науки. – Донецьк : ДонНУ, 2011. – № 2. – С. 66–74.
Ситар Ганна. Конструкційна граматика як теоретичне підґрунтя дослідження фразеологізованих речень / Г. Ситар // Типологія та функції мовних одиниць : наук. журн. на пошану член-кореспондента НАН України І. Р. Вихованця / [редкол. : Н. М. Костусяк (гол. ред.) та ін.]. – Луцьк : Східноєвропейський нац. ун-т ім. Лесі Українки, 2015. – № 2 (4). – С. 192–205.
Хохлова М. В. Исследование лексико-синтаксической сочетаемости в русском языке с помощью статистических методов (на базе корпусов текстов) : автореф. дисс. на соискание ученой степени канд. филол. наук : спец. 10.02.21 «Прикладная и математическая лингвистика» / М. В. Хохлова / Санкт-Петербургский государственный университет. – Санкт- Петербург, 2010. – 26 с.
Хохлова М. В. Экспериментальная проверка методов выделения коллокаций / М. В. Хохлова // Slavica Helsingiensia 34. Инструментарий русистики: корпусные подходы. – Редколл.: А. Мустайоки, М. В. Копотев, Л. А. Бирюлин, Е. Ю. Протасова. – Helsinki : Department of Slavonic and Baltic Languages and Literatures, 2008. – С. 343-357.
Шмелёв Д. Н. Синтаксическая членимость высказывания в современном русском языке / Д. Н. Шмелёв. – М. : URSS, 2006. – 148 с.
Ягунова Е. В., Пивоварова Л. М. От коллокаций к конструкциям / Е. В. Ягунова, Л. М. Пивоварова // ACTA LINGUISTICA PETROPOLITANA. Труды Института лингвистических исследований РАН. Т. X. Ч. 2. Русский язык: грамматика конструкций и лексико-семантические подходы / Ред. тома С. С. Сай, М. А. Овсянникова, С. А. Оскольская. – СПб. : Наука, 2014. – С. 568–617.
Dunning Ted E. Accurate methods for the statistics of surprise and coincidence / Ted E. Dunning // Computational Linguistics. – 1993. – 19(1). – P. 61–74.
Church K., Hanks P. Word association norms, mutual information, and lexicography / K. Church, P. Hanks // Computational Linguistics. – #16(1). – 1990. – P. 22–29.
Church K., Hanks P., Hindle D., Gale W. Using Statistics in Lexical Analysis / K. Church, P. Hanks, D. Hindle, W. Gale, U. Zernik (ed) // Lexical Acquisition: Using On-line Resources to Build a Lexicon. – Lawrence Erlbaum, 1991: http://www.cs.jhu.edu/~kchurch/wwwfiles/publications.html.
Everitt B.S. The Cambridge Dictionary of Statistics. 2nd edition / B.S. Everitt. – Cambridge : Cambridge University Press, 2002. – 410 pp.
Evert S. The Statistics of Word Cooccurrences: Word Pairs and Collocations / S. Evert : PhD dissertation, IMS, University of Stuttgart, 2004 (Published in 2005). – 353 P. – Free PDF available from http://purl.org/stefan.evert/PUB/Evert2004phd.pdf
Fano Robert M. Transmission of Information: A Statistical Theory of Communications / Robert M. Fano. – The Technology Press, M.I.T., and John Wiley & Sons, Inc., New York, 1961. – 389 pp.
Fillmore Charles J. The Mechanisms of «Construction Grammar» / Charles J. Fillmore // Proceedings of the Fourteenth Annual Meeting of the Berkeley Linguistics Society. – 1988. – Pp. 35– 55.
Fillmore C. J., Kay P., O’Connor M. C. Regularity and Idiomaticity in Grammatical Constructions: the Case of let alone / C. J. Fillmore, P. Kay, M. C. O’Connor // Language. – 1988. – 64(3). – Pp. 501–538.
Fried Mirjam. Constructions and Frames as Interpretive Clues / Mirjam Fried // Belgian Journal of Linguistics. – 2010. – Vol. 24. Frames: from Grammar to Application, ed. by P. Sambre and C. Wermuth. – Рр. 83–102.
Goldberg A. E. Constructions: A Construction Grammar Approach to Argument Structure. 1 edition / A. E. Goldberg. – University Of Chicago Press, March 15, 1995. – 271 p.
Goldberg Adele E. Constructions : a New Theoretical Approach to Language / Adele E. Goldberg // Trends in Cognitive Sciences. – 2003. – Vol.7 – No. 5 May. – Pр. 219–224.
Gries S. Th., Stefanowitsch A. Extending Collostructional Analysis: a Corpus-Based Perspective on 'Alternations' / Anatol Stefanowitsch, Stefan Th. Gries // International Journal of Corpus Linguistics. – 2004. – 9(1). – Pр. 97–129.
Petrovic S., Snajder J., Basic B. D., Kolar M. Comparison of collocation extraction for document indexing / S. Petrovic, J. Snajder, B. D. Basic, M. Kolar // Journal of Computing and information technology. – 2006. – 14 (4). – P. 321–327.
Seretan V. Syntax-Based Collocation Extraction / V. Seretan // Text Speech and Language Technology. Series Editors Nancy Ide, Jean Véronis. – Volume 44. – Dordrecht – Heidelberg – London – New York : Springer, 2011. – 222 pp.
Stefanowitsch A., Gries S. Th. Collostructions: Investigating the Interaction between Words and Constructions / Anatol Stefanowitsch, Stefan Th. Gries // International Journal of Corpus Linguistics. – 2003. – 8–2. – Pp. 209–43.
Stefanowitsch A., Gries S. Th. Covarying Collexemes / Anatol Stefanowitsch, Stefan Th. Gries // Corpus Linguistics and Linguistic Theory. – 2005. – 1–1 – Pp. 1–43.
Stubbs M. Collocations and semantic profiles: On the cause of the trouble with quantitative studies / M. Stubbs // Functions of Language. – 1995. – 2, 1. – Pp. 23–55.