Тамбов
Общероссийский академический научный журнал
“Вопросы когнитивной лингвистики”

ОПЫТ КЛАСТЕРНОГО АНАЛИЗА И СЕМАНТИЧЕСКОЙ КЛАССИФИКАЦИИ АНГЛИЙСКИХ ГЛАГОЛОВ (на примере группы “Verbs of Putting”)

ОПЫТ КЛАСТЕРНОГО АНАЛИЗА И СЕМАНТИЧЕСКОЙ КЛАССИФИКАЦИИ АНГЛИЙСКИХ ГЛАГОЛОВ (на примере группы “Verbs of Putting”)


Автор:  Р.Р. Айрапетян (Маркарян), О.А. Алимурадов

Организация :  ФГБОУ ВПО «Пятигорский государственный лингвистический университет»

Аннотация

В статье описывается проведение кластерного анализа с целью построения семантической классификации англоязычных глаголов группы «VerbsofPutting». Применение математических методов в лингвистике находит отражение во многих современных работах зарубежных авторов, что доказывает актуальность выбранного метода. Авторы статьи приводят описание алгоритма кластеризации с интерпретацией полученных результатов. Проведен сравнительный анализ исходной классификации Б. Левин и классификации, полученной авторами на основе кластеризации; предложена метрика определения близости классификаций.

Ключевые слова :  глагол, классификация, кластеризация, кластерный анализ, семантический компонент, кластер, дефиниционный анализ, компонентный анализ

Список источников
Айрапетян Р.Р.
Прототипическая модель глаголов группы «Verbs of Putting», основанная на компонентном анализе семантики // Вестник Пятигорского государственного лингвистического университета. 2013. № 4. С. 53-59.
Филиппов А.К. Интерпретация дистрибуций глагольных контекстов в качестве манифестации структуры лексико-семантических групп разных типов: на примере группы глаголов положения в пространстве и глаголов мышления: дис. ... канд. филол. наук. СПб., 2011.
Baeza-Yates R.A. Introduction to data structures and algorithms related to information retrieval // Information Retrieval: Data Structures and Algorithms. URL: http://ru.scribd.com/doc/13742235/Information-Retrie-val-Data-Structures-Algorithms-William-B-Frakes
Brew Ch., Schulte im Walde S. Spectral clustering for German verbs // Proceedings of the Conference on Empirical Methods in Natural Language Processing. Philadelphia, PA, 2002. Р. 117-124.
Carroll G., Mats R. Valence induction with a headlexicalized pcfg // Proceedings of the 3rd Conference on Empirical Methods in Natural Language Processing. 1998. Р. 36-45.
Clark S., Curran J.R. Formalism-independent parser evaluation with CCG and DepBank // Proceedings of the 45th Annual Meeting of the Association for Computational Linguistics. 2007. P. 248-255. 
Clear J.H. The British national corpus // The Digital Word: Text-based Computing in the Humanities. Cambridge, MA, USA: MIT Press, 1993. Р. 163-187. 
Cruse D.A. Lexical Semantics. Cambridge, England: Cambridge University Press, 1986.
Deodhare D., Sharma G., Srivastava A., Sharma A. Semantically Driven Soft-clustering of Documents using Lexical Chains // Proceedings of ICON-2010: 8th International Conference on Natural Language Processing. URL: http://www.academia.edu/1979496/Semantically_ Driven_Soft-clustering_of_Documents_using_Lexi-cal_Chains
Dorr B. Large-scale dictionary construction for foreign language tutoring and interlingual machine translation // Machine Translation. 1997. № 12 (4).
Р
. 271-325.
Genkin A., Lewis D.D., Madigan D. Large-scale Bayesian logistic regression for text catego-rization. URL: http://sydney.edu.au/engineering/it/ ~comp5318/survey/logisticregression.pdf
Graff D. English Gigaword. Linguistic Data Consortium, Philadelphia, 2003.
Jain A.K., Dubes R.C. Algorithms for Clustering Data. NJ: Prentice-Hall, Inc., 1988.
Joanis E. Automatic verb classification using a general feature space: Master’s thesis. University of Toronto, 2002.
Joanis E., Stevenson S. A general feature space for automatic verb classification // Proceedings of the 10th Conf. of the EACL. 2003. Р. 163-170.
Joanis E., Stevenson S., James D. A general feature space for automatic verb classification // Natural Language Engineering. 2006. № 14 (03). Р. 337-367.
King B. Step-wise clustering procedures.  J. Am. Stat. Assoc. 69, 1967. 
Kogan J., Nicholas C., Teboulle M. Clustering Large and High Dimensional Data. URL: http://www.csee.umbc.edu/ nicholas/clustering/tuto-rial.pdf
Korhonen A., Krymolowski Y., Marx Z. Clustering polysemic subcategorization frame distributions semantically. URL:  http://aclweb.org/antho-logy//P/P03/P03-1009.pdf.
Korhonen A., Briscoe T. Extended lexical-semantic classification of English verbs // Workshop on Computational Lexical Semantics. Boston, Massachusetts, USA: Association for Computational Linguistics, 2004. P. 38-45.
Langacker R. Semantic Representations and the Linguistic Relativity Hypothesis // Foundations of Language, 1976. Р. 307-357.
Lapata M., Brew C. Verb class disambiguation using informative priors // Computational Linguistics. 2004. № 30 (2). Р. 45-73.
Levin B. English Verb Classes and Alternations: A Preliminary Investigation. Chicago, IL: University of Chicago Press, 1993.
Li J., Brew C. Which Are the Best Features for Automatic Verb Classification. URL: http://www.acl-web.org/anthology/P/P08/P08-1050.pdf 
Li J., Brew. С. Disambiguating Levin verbs using untagged data. URL:  http://www.ling.ohio-state.edu/~jianguo/papers/LiBrew.pdf
Li J., Brew C. Which are the best features for automatic verb classification. URL:  http://aclweb.org/ anthology//P/P08/P08-1050.pdf
Medelyan O. Computing Lexical Chains  with Graph Clustering // Proceedings of the ACL 2007. Student Research Workshop. Prague. 2007. P. 85-90.
Merlo P., Stevenson S. Automatic verb classification based on statistical distribution of argument structure // Computational Linguistics. 2001. № 27. Р. 373-408.
Murtagh F. A survey of recent advances in hierarchical clustering algorithms which use cluster centers // Comput. J. 1984. № 26. Р. 354-359.
Nagy G. State of the art in pattern recognition // Proceedings of the Institute of Electrical and Electronics Engineers 56. 1968. Р. 836-862.
O’Seaghdha, Padraig G., Marin J.W. Mediated semantic phonological priming: Calling distant relatives // Journal of Memory and Language. 1997.
№ 36 (2). Р. 226-252.
Prasada, Sandeep, Pinker S. Generalisation  of regular and irregular morphological patterns // Language and Cognitive Processes. 1993. № 8 (1). Р. 1-56. 
Radford A. Syntactic theory and the structure of English: A minimalist approach. Cambridge, England: Cambridge University Press, 1997.
Schulte im Walde S., Brew C. Inducing German semantic verb classes from purely syntactic subcategorisation information // Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics. Philadelphia, PA, 2002. Р. 223-230. 
Schulte im Walde S. Experiments on the choice of features for learning verb classes // Proceedings of EACL. 2003. Р. 315-322. 
Schulte im Walde S. Clustering verbs semantically according to their alternation behaviour. COLING, 2000. Р. 747-753.
Sneath P.H.A., Sokal R.R. Numerical Taxonomy. London, UK: Freeman, 1973.
Tishby N., Pereira F.C., Bialek W. The information bottleneck method. In Proceedings of the 37th Annual Allerton Conference on Communication, Control and Computing, 1999. Р. 368-377.

Страницы:  96-109

Возврат к списку