Программа курса для магистрантов филологического факультета МГУ
Компьютерные технологии в филологии: проблемы компьютеризации лингвистических и литературоведческих исследований и индустриальной обработки лингвистических данных
(32 часа)
Лекторы: проф. О.В.Кукушкина, проф. А.А.Поликарпов
-
Области компьютеризации лингвистических и литературоведческих исследований.
-
Построение и анализ синхронных и диахронных текстовых и речевых корпусов
-
Построение и анализ синхронных и диахронных словарных баз данных
-
Разработка математических имитационных моделей языкового существования-развития
-
Разработка комплекса математических средств анализа устройства текста с помощью компьютера
-
Авторские корпуса текстов и их использование в литературоведческом анализе
-
Анализ примеров компьютеризации лингвистических и литературоведческих исследований русского языка, ведущихся в МГУ
-
Полистилевой корпус современного русского языка
-
Компьютерный корпус русских газет конца 20 века
-
Корпус «Стихи и драматургия Пушкина»
-
Пушкинский корпус
-
Чеховский корпус
-
База данных по «Словарю древнерусского языка»
-
База данных по новым словам «Корпуса русских газет конца 20 века»
-
База данных по «Хронологическому морфемно-словообразовательному словарю русского языка»
-
Система автоматизированной обработки текстов и словарей «DicTUM-2»
-
Тексто-аналитическаясистема «СтилеАнализатор-2»
-
База данных «Webster’s New Dictionary of Synonyms»
-
База данных по русской синонимии
-
База данных по эвфемизмам русского языка
-
База данных по новым значениям русского языка
-
База данных по глоттохронологическому списку индоевропейских языков
-
База данных по «Этимологическому словарю славянских языков»
-
Разработка и компьютерная реализация «Модели
жизненного цикла языкового знака»
-
Разработка лингвистических анализаторов различной степени универсальности и комплексности
-
Разработка лемматизаторов и морфологических анализаторов
-
Разработка морфемных анализаторов (сегментаторов)
-
Разработка денотативно-смысловых анализаторов
-
Разработка семантико-синтаксических анализаторов
-
Разработка устно-речевых анализаторов
-
Разработка парсеров (комплексных анализаторов) и экспертных систем
-
Проблемы индустриальной обработки лингвистических данных
-
Информационный поиск в Интернете
-
Машинный перевод
-
Интеллектуальный поиск информации (data mining)
-
Распознавание устной речи
-
Классификация и распознавание индивидуальных стилей, гендерных вариантов и жанров текстов
-
Контекстуальные словари и экспертные системы для сбора контекстуальной информации по снятию многозначности лексических единиц
Литература
Ахмеджанов М.С., Э.И. Королёв, А.А.Поликарпов, И.И.Ратцева, М.М.Розенберг, Т.Г.Тройнова. Дистрибутивно-статистический метод анализа лексики и его реализация на ЭВМ // Прикладные аспекты лингвистики. – М.: Изд-во Моск. ун-та, 1989. - С.97-108.
Богданов В.В., Крюкова О.С., Поликарпов А.А. Хронологический морфемно-словообразовательный словарь русского языка: создание базы данных и ее системно-квантитативный анализ // Вопросы общего, сравнительно-исторического, сопоставительного языкознания. Вып.2. - М.: Московский лицей, 1998. - С.172-184.
Колодяжная Л.И., Поликарпов А.А. Исследование системных параметров лексики на основе компьютерной версии синонимического словаря // Труды машинного фонда русского языка. Том 2. Ин-т русского языка РАН. - М., 1992. - С. 3-15.
Колодяжная Л.И., Поликарпов А.А. Системно-квантитативное исследование русской синонимии // Альманах "Говор". Ч.1. D. - Сыктывкар: Сыктывк. гос. университет, 1997.
Кукушкина О.В. Словарная база данных "Грамматический словарь русского языка" А.А. Зализняка // Альманах "Говор".- Часть 1.D. - Cыктывкар: Сыктывк. гос. университет, 1997. - С. 35-40.
Кукушкина О.В., Поддубный В.В., Поликарпов А.А., Шевелев О.Г. Автоматическая классификация текстов корпуса русских текстов конца ХХ века по жанровым типам и источникам. //Русский язык: исторические судьбы и современность. Труды и материалы. Москва, МГУ, 2007 г. С. 391-392.
Кукушкина О.В., Поликарпов А.А. (2003). Жанровое распределение русских предлогов в корпусе современной газеты // Язык и социум. – Минск, 2003.
Кукушкина О.В., Поликарпов А.А., Пирятинская Е.Ф. «Полистилевой корпус текстов современного русского языка»: задачи, принципы, первичный анализ (2006). http://www.philol.msu.ru/~humlang/articles/polystylcorp.html
Кукушкина О.В., Поликарпов А.А., Токтонов А.Г. (2008). Проверка теоретически предсказанных неодериватологических закономерностей данными русской корпусной неодериватографии // (Отв. ред. М.И.Чернышёва). Теория и история славянской лексикографии.– М., 2008. – С.392-427.
Кукушкина, О.В., А.А. Поликарпов, В.В.Федотов.(2006). Читаем и исследуем. Работа с корпусами текстов с помощью информационно-исследовательской системы КИИСа. Выпуск 1: «Поэзия и драматургия А.С.Пушкина». - Москва: Изд-во МГУ, 2006. - 48 с.
Кукушкина, О.В., А.А. Поликарпов, В.В.Федотов. (2006). Диск CD-ROM: КИИСа. Корпусная информационно-поисковая система . Выпуск 1. "Поэзия и драматургия А.С. Пушкина и Путеводитель по Пушкину". – М.: МГУ им. М.В.Ломоносова. Филологический факультет. Кафедра русского языка. Лаборатория общей и компьютерной лексикологии и лексикографии, 2006. http://www.philol.msu.ru/~humlang/articles/polystylcorp.html
Кукушкина О.В., Поликарпов А.А., Хмелёв Д.В.. Определение авторства текста с использованием буквенной и грамматической информации // Проблемы передачи информации. Т. 37, №2 - М., 2001.
Мельников Г. П. Системология и языковые аспекты кибернетики. - Мос ква: Советское радио, 1978. http://www.philol.msu.ru/~lex/melnikov/meln_r/titl.htm
Поддубный, В.В., А.А. Поликарпов. Вывод закона синхронного полисемического распределения языковых знаков на основе диссипативной стохастической динамической модели эволюции знаковых ансамблей // Синхронное и диахронное в сравнительно-историческом языкознании (под общей редакцией В.А.Кочергиной). – М.: Добросвет, 2011. – С. 182-190.
Поддубный, В.В., А.А. Поликарпов. Диссипативная стохастическая динамическая модель развития языковых знаков // Компьютерные исследования и моделирование. - 2011 т. 3, № 2. - С. 103–124.
Поликарпов А.А. Теоретические проблемы прикладной лексикологии // Вестник МГУ. Сер.9 Филология. 1989, N 5. - С. 64-74.
Поликарпов А.А. Проблемы и перспективы автоматизации лексикологического и лексикографического анализа с помощью ЭВМ // Использование ЭВМ в лингвистических исследованиях. - Киев: Наукова думка, 1990. - С. 167-180.
Поликарпов А.А.. Закономерности образования новых слов: моделирование процесса и его экспериментальное исследование // Язык. Глагол. Предложение. К 70-летию Георгия Георгиевича Сильницкого. - Смоленск, 2000. - С. 211-227.
Поликарпов А.А.. Зависимость сохранности общеславянской лексики во времени от категориальной принадлежности и возраста слов // Проблемы славянского языкознания в контексте индоевропейского сравнительно-исторического языкознания. Тез. докл. научн. конф. Москва, филологический факультет МГУ им. М.В.Ломоносова. 30-31 октября 2001 г. - М.: Изд-во Моск. ун-та, 2001. - С. 95-97.
Поликарпов А.А. (2005). Эволюционное обоснование "Закона Менцерата" и поиск базовой функциональной зависимости длин морфем от их позиционных характеристик // Квантитативная лингвистика: Исследования и модели. - Новосибирск, Изд. НГПУ, 2005.
Поликарпов А.А., Бушуева О.В. Опыт построения контекстуального словаря и анализ его устройства // Теоретические и практические проблемы прикладной лингвистики. – М.: Изд-во Моск. ун-та, 1988. – С.40-65.
Поликарпов А.А., Крюкова О.С. О системном соотношении краткого и среднего толковых словарей русского языка // Квантитативная лингвистика и автоматический анализ текстов. - Тарту: Изд-во Тартуского университета, 1989. - С. 111-125.
Поликарпов А.А., Кукушкина О.В., Виноградова В.Б., Савчук С.О. Компьютерный корпус текстов русских газет конца 20-го века: создание, категоризация, автоматизированный анализ языковых особенностей // Русский язык: исторические судьбы и современность. Международный конгресс русистов-исследователей. Москва, филологический ф-т МГУ им. М.В.Ломоносова. 13-16 марта 2001 г. Труды и материалы. - М.: Изд-во Моск. ун-та, 2001. - С. 398.
Поликарпов А.А., Кукушкина О.В., Виноградова В.И., Пирятинская Е.Ф., Савчук С.О. Компьютерный корпус текстов современной русской газеты // (под ред. М.Н.Володиной). Язык средств массовой информации. – М.: Академический проект; Альма Матер, 2008. – С.540-556.
Поликарпов А.А., Курлов В.Я. Стилистика, семантика, грамматика: опыт анализа системных взаимосвязей (на основе анализа данных толкового словаря) // Вопросы языкознания, N 1, 1994. - С. 62-75.
Поликарпов А.А., Селезнева-Елецкая Л.А. (2004). Степень абстрактности и субъективности смысла – факторы варьирования степени сохранности во времени его лексических обозначений (Degree of Abstractness and Degree of Subjectivity of a Consept – Factors of the Safety Degree Variation in Time of its Lexical Names) // Сравнительно-историческое исследование языков: Современное состояние и перспективы. Сб. статей по материалам международной научной конференции (Москва, 22-24 января 2003 г.). (Comparative-Historical Linguistic: Modern State and Perspectives.) / Составитель В.А. Кочергина. – М.: Изд-во Моск. ун-та, 2004. - С. 327-376.
Поликарпов А.А., Филимонова Т.В. (2005). О системной зависимости негативно окрашенных денотативно-смысловых и субъективно-оценочных характеристик фразеологических единиц от их возраста // Text Processing and Cognitive Technologies. № 11, 2005.
Хмелёв Дмитрий Викторович. Лингвоанализатор 3-эпсилон.
http://www.philol.msu.ru/~lex/khmelev/
Kolodyazhnaya, L.I., Polikarpov, A.A. A System for Compilation and Analysis of Computerized Philological Dictionaries Using a Personal Computer. Czap, H., Nedobity W. (eds). TKE`90: Terminology and Knowledge Engineering. Vol.2. – Frankfurt/M.: Indeks Verlag, 1990. – Pp. 473-479.
Kolodyazhnaya, L.I., Polikarpov. A.A. Study of Quantitative Correlations between Stylistics, Grammar and Polysemy of Words (On the Basis of Ozhegov Dictionary) // Qualico-94. 2-ая Международная конференция по квантитативной лингвистике, 20-24 сент. 1994 г., Москва, МГУ, филологический факультет. - Москва, 1994. - С.110-112.
Kukushkina Olga V., Polikarpov Anatoliy A. DicTUM-1 - A System for Dictionary-Text Universal Manipulations and Analysis // XI International Conference "History and Computing", Moscow, Moscow State Universiti, August 20-24 1996. - Pp.50-52.
Kukushkina, O. V., Polikarpov, A. A., and Khmelev, D. V. (2001). Using Letters and Grammatical Statistics for Authorship Attribution // Problems of Information Transmission 37(2), 2001, V.37, Issue 2. - Pp. 172-184.
Polikarpov Anatoliy A. On the Model of Word Life Cycle // Koehler, R., Rieger, B. (eds.) Contributions to Quantitative Linguistics. - Dordrecht: Kluwer, 1993 - Pp. 53-66.
Polikarpov Anatoliy A. Chronological Morphemic and Word-Formational Dictionary of Russian: Some System Regularities for Morphemic Structures and Units // Linguistische ArbeitsBerichte. Institut für Linguistik - Universität Leipzig. 3. Europäische Konferenz "Formale Beschreibung slavischer Spachen, Leipzig 1999". № 75.- Leipzig, 2000. - Pp. 201-212.
Polikarpov, A.A. (2004). Cognitive Mechanisms for Emergence of some Regularities of Human Language Evolution // Text Processing and Cognitive Technologies. № 9, 2004 (The VII-th International Conference “Cognitive Modeling in Linguistics. Proceedings”). – Moscow – Varna, 2004. - Pp. 10-20.
Polikarpov Anatoliy A.(2006). Towards the Foundations of Menzerath’s Law: On the Functional Dependence of Affixes’ Length on their Positional Number within Words // Contributions to the Science of Text and Language: Word Length Studies and Related Issues. – Dordrecht: Springer, 2006. – Pp. 215-240.
Polikarpov A. A. Using Corpus for the Benefit of Neoderivatology: Theoretical and Experimental Study of New Words Based on Data from «Polystylistic Corpus of Modern Russian Texts» // Frantisek Sticha, Mirjam Fried (eds.) // Grammar and Corpora. Gramatika a Korpus 2007. (Selected contributions from the conference “Grammar and Corpora, Sept. 25-27, 2007, Liblice). — Praha: Academia, 2008. Pp. 65-76.
|