Программа курса для магистрантов филологического факультета мгу




Скачать 71.93 Kb.
Дата 19.09.2016
Размер 71.93 Kb.
Программа курса для магистрантов филологического факультета МГУ

Компьютерные технологии в филологии: проблемы компьютеризации лингвистических и литературоведческих исследований и индустриальной обработки лингвистических данных

(32 часа)

Лекторы: проф. О.В.Кукушкина, проф. А.А.Поликарпов

  1. Области компьютеризации лингвистических и литературоведческих исследований.

    1. Построение и анализ синхронных и диахронных текстовых и речевых корпусов

    2. Построение и анализ синхронных и диахронных словарных баз данных

    3. Разработка математических имитационных моделей языкового существования-развития

    4. Разработка комплекса математических средств анализа устройства текста с помощью компьютера

    5. Авторские корпуса текстов и их использование в литературоведческом анализе



  1. Анализ примеров компьютеризации лингвистических и литературоведческих исследований русского языка, ведущихся в МГУ

      1. Полистилевой корпус современного русского языка

      2. Компьютерный корпус русских газет конца 20 века

      3. Корпус «Стихи и драматургия Пушкина»

      4. Пушкинский корпус

      5. Чеховский корпус

      6. База данных по «Словарю древнерусского языка»

      7. База данных по новым словам «Корпуса русских газет конца 20 века»

      8. База данных по «Хронологическому морфемно-словообразовательному словарю русского языка»

      9. Система автоматизированной обработки текстов и словарей «DicTUM-2»

      10. Тексто-аналитическаясистема «СтилеАнализатор-2»

      11. База данных «Webster’s New Dictionary of Synonyms»

      12. База данных по русской синонимии

      13. База данных по эвфемизмам русского языка

      14. База данных по новым значениям русского языка

      15. База данных по глоттохронологическому списку индоевропейских языков

      16. База данных по «Этимологическому словарю славянских языков»

      17. Разработка и компьютерная реализация «Модели

жизненного цикла языкового знака»

  1. Разработка лингвистических анализаторов различной степени универсальности и комплексности

    1. Разработка лемматизаторов и морфологических анализаторов

    2. Разработка морфемных анализаторов (сегментаторов)

    3. Разработка денотативно-смысловых анализаторов

    4. Разработка семантико-синтаксических анализаторов

    5. Разработка устно-речевых анализаторов

    6. Разработка парсеров (комплексных анализаторов) и экспертных систем



  1. Проблемы индустриальной обработки лингвистических данных

    1. Информационный поиск в Интернете

    2. Машинный перевод

    3. Интеллектуальный поиск информации (data mining)

    4. Распознавание устной речи

    5. Классификация и распознавание индивидуальных стилей, гендерных вариантов и жанров текстов

    6. Контекстуальные словари и экспертные системы для сбора контекстуальной информации по снятию многозначности лексических единиц

Литература

Ахмеджанов М.С., Э.И. Королёв, А.А.Поликарпов, И.И.Ратцева, М.М.Розенберг, Т.Г.Тройнова. Дистрибутивно-статистический метод анализа лексики и его реализация на ЭВМ // Прикладные аспекты лингвистики. – М.: Изд-во Моск. ун-та, 1989. - С.97-108.

Богданов В.В., Крюкова О.С., Поликарпов А.А. Хронологический морфемно-словообразовательный словарь русского языка: создание базы данных и ее системно-квантитативный анализ // Вопросы общего, сравнительно-исторического, сопоставительного языкознания. Вып.2. - М.: Московский лицей, 1998. - С.172-184.

Колодяжная Л.И., Поликарпов А.А. Исследование системных параметров лексики на основе компьютерной версии синонимического словаря // Труды машинного фонда русского языка. Том 2. Ин-т русского языка РАН. - М., 1992. - С. 3-15.

Колодяжная Л.И., Поликарпов А.А. Системно-квантитативное исследование русской синонимии // Альманах "Говор". Ч.1. D. - Сыктывкар: Сыктывк. гос. университет, 1997.

Кукушкина О.В. Словарная база данных "Грамматический словарь русского языка" А.А. Зализняка // Альманах "Говор".- Часть 1.D. - Cыктывкар: Сыктывк. гос. университет, 1997. - С. 35-40.

Кукушкина О.В., Поддубный В.В., Поликарпов А.А., Шевелев О.Г. Автоматическая классификация текстов корпуса русских текстов конца ХХ века по жанровым типам и источникам. //Русский язык: исторические судьбы и современность. Труды и материалы. Москва, МГУ, 2007 г. С. 391-392.

Кукушкина О.В., Поликарпов А.А. (2003). Жанровое распределение русских предлогов в корпусе современной газеты // Язык и социум. – Минск, 2003.

Кукушкина О.В., Поликарпов А.А., Пирятинская Е.Ф. «Полистилевой корпус текстов современного русского языка»: задачи, принципы, первичный анализ (2006). http://www.philol.msu.ru/~humlang/articles/polystylcorp.html

Кукушкина О.В., Поликарпов А.А., Токтонов А.Г. (2008). Проверка теоретически предсказанных неодериватологических закономерностей данными русской корпусной неодериватографии // (Отв. ред. М.И.Чернышёва). Теория и история славянской лексикографии.– М., 2008. – С.392-427.

Кукушкина, О.В., А.А. Поликарпов, В.В.Федотов.(2006). Читаем и исследуем. Работа с корпусами текстов с помощью информационно-исследовательской системы КИИСа. Выпуск 1: «Поэзия и драматургия А.С.Пушкина». - Москва: Изд-во МГУ, 2006. - 48 с.

Кукушкина, О.В., А.А. Поликарпов, В.В.Федотов. (2006). Диск CD-ROM: КИИСа. Корпусная информационно-поисковая система . Выпуск 1. "Поэзия и драматургия А.С. Пушкина и Путеводитель по Пушкину". – М.: МГУ им. М.В.Ломоносова. Филологический факультет. Кафедра русского языка. Лаборатория общей и компьютерной лексикологии и лексикографии, 2006. http://www.philol.msu.ru/~humlang/articles/polystylcorp.html

Кукушкина О.В., Поликарпов А.А., Хмелёв Д.В.. Определение авторства текста с использованием буквенной и грамматической информации // Проблемы передачи информации. Т. 37, №2 - М., 2001.

Мельников Г. П. Системология и языковые аспекты кибернетики. - Мос ква: Советское радио, 1978. http://www.philol.msu.ru/~lex/melnikov/meln_r/titl.htm

Поддубный, В.В., А.А. Поликарпов. Вывод закона синхронного полисемического распределения  языковых знаков на основе диссипативной стохастической динамической модели эволюции знаковых ансамблей // Синхронное и диахронное в сравнительно-историческом языкознании (под общей редакцией В.А.Кочергиной). – М.: Добросвет, 2011. – С. 182-190.

Поддубный, В.В., А.А. Поликарпов. Диссипативная стохастическая динамическая модель развития языковых знаков // Компьютерные исследования и моделирование. - 2011 т. 3, № 2. - С. 103–124.

Поликарпов А.А. Теоретические проблемы прикладной лексикологии // Вестник МГУ. Сер.9 Филология. 1989, N 5. - С. 64-74.

Поликарпов А.А. Проблемы и перспективы автоматизации лексикологического и лексикографического анализа с помощью ЭВМ // Использование ЭВМ в лингвистических исследованиях. - Киев: Наукова думка, 1990. - С. 167-180.

Поликарпов А.А.. Закономерности образования новых слов: моделирование процесса и его экспериментальное исследование // Язык. Глагол. Предложение. К 70-летию Георгия Георгиевича Сильницкого. - Смоленск, 2000. - С. 211-227.

Поликарпов А.А.. Зависимость сохранности общеславянской лексики во времени от категориальной принадлежности и возраста слов // Проблемы славянского языкознания в контексте индоевропейского сравнительно-исторического языкознания. Тез. докл. научн. конф. Москва, филологический факультет МГУ им. М.В.Ломоносова. 30-31 октября 2001 г. - М.: Изд-во Моск. ун-та, 2001. - С. 95-97.

Поликарпов А.А. (2005). Эволюционное обоснование "Закона Менцерата" и поиск базовой функциональной зависимости длин морфем от их позиционных характеристик // Квантитативная лингвистика: Исследования и модели. - Новосибирск, Изд. НГПУ, 2005.

Поликарпов А.А., Бушуева О.В. Опыт построения контекстуального словаря и анализ его устройства // Теоретические и практические проблемы прикладной лингвистики. – М.: Изд-во Моск. ун-та, 1988. – С.40-65.

Поликарпов А.А., Крюкова О.С. О системном соотношении краткого и среднего толковых словарей русского языка // Квантитативная лингвистика и автоматический анализ текстов. - Тарту: Изд-во Тартуского университета, 1989. - С. 111-125.

Поликарпов А.А., Кукушкина О.В., Виноградова В.Б., Савчук С.О. Компьютерный корпус текстов русских газет конца 20-го века: создание, категоризация, автоматизированный анализ языковых особенностей // Русский язык: исторические судьбы и современность. Международный конгресс русистов-исследователей. Москва, филологический ф-т МГУ им. М.В.Ломоносова. 13-16 марта 2001 г. Труды и материалы. - М.: Изд-во Моск. ун-та, 2001. - С. 398.

Поликарпов А.А., Кукушкина О.В., Виноградова В.И., Пирятинская Е.Ф., Савчук С.О. Компьютерный корпус текстов современной русской газеты // (под ред. М.Н.Володиной). Язык средств массовой информации. – М.: Академический проект; Альма Матер, 2008. – С.540-556.

Поликарпов А.А., Курлов В.Я. Стилистика, семантика, грамматика: опыт анализа системных взаимосвязей (на основе анализа данных толкового словаря) // Вопросы языкознания, N 1, 1994. - С. 62-75.

Поликарпов А.А., Селезнева-Елецкая Л.А. (2004). Степень абстрактности и субъективности смысла – факторы варьирования степени сохранности во времени его лексических обозначений (Degree of Abstractness and Degree of Subjectivity of a Consept – Factors of the Safety Degree Variation in Time of its Lexical Names) // Сравнительно-историческое исследование языков: Современное состояние и перспективы. Сб. статей по материалам международной научной конференции (Москва, 22-24 января 2003 г.). (Comparative-Historical Linguistic: Modern State and Perspectives.) / Составитель В.А. Кочергина. – М.: Изд-во Моск. ун-та, 2004. - С. 327-376.

Поликарпов А.А., Филимонова Т.В. (2005). О системной зависимости негативно окрашенных денотативно-смысловых и субъективно-оценочных характеристик фразеологических единиц от их возраста // Text Processing and Cognitive Technologies. № 11, 2005.

Хмелёв Дмитрий Викторович. Лингвоанализатор 3-эпсилон.

http://www.philol.msu.ru/~lex/khmelev/

Kolodyazhnaya, L.I., Polikarpov, A.A. A System for Compilation and Analysis of Computerized Philological Dictionaries Using a Personal Computer. Czap, H., Nedobity W. (eds). TKE`90: Terminology and Knowledge Engineering. Vol.2. – Frankfurt/M.: Indeks Verlag, 1990. – Pp. 473-479.

Kolodyazhnaya, L.I., Polikarpov. A.A. Study of Quantitative Correlations between Stylistics, Grammar and Polysemy of Words (On the Basis of Ozhegov Dictionary) // Qualico-94. 2-ая Международная конференция по квантитативной лингвистике, 20-24 сент. 1994 г., Москва, МГУ, филологический факультет. - Москва, 1994. - С.110-112.

Kukushkina Olga V., Polikarpov Anatoliy A. DicTUM-1 - A System for Dictionary-Text Universal Manipulations and Analysis // XI International Conference "History and Computing", Moscow, Moscow State Universiti, August 20-24 1996. - Pp.50-52.

Kukushkina, O. V., Polikarpov, A. A., and Khmelev, D. V. (2001). Using Letters and Grammatical Statistics for Authorship Attribution // Problems of Information Transmission 37(2), 2001, V.37, Issue 2. - Pp. 172-184.

Polikarpov Anatoliy A. On the Model of Word Life Cycle // Koehler, R., Rieger, B. (eds.) Contributions to Quantitative Linguistics. - Dordrecht: Kluwer, 1993 - Pp. 53-66.

Polikarpov Anatoliy A. Chronological Morphemic and Word-Formational Dictionary of Russian: Some System Regularities for Morphemic Structures and Units // Linguistische ArbeitsBerichte. Institut für Linguistik - Universität Leipzig. 3. Europäische Konferenz "Formale Beschreibung slavischer Spachen, Leipzig 1999". № 75.- Leipzig, 2000. - Pp. 201-212.

Polikarpov, A.A. (2004). Cognitive Mechanisms for Emergence of some Regularities of Human Language Evolution // Text Processing and Cognitive Technologies. № 9, 2004 (The VII-th International Conference “Cognitive Modeling in Linguistics. Proceedings”). – Moscow – Varna, 2004. - Pp. 10-20.

Polikarpov Anatoliy A.(2006). Towards the Foundations of Menzerath’s Law: On the Functional Dependence of Affixes’ Length on their Positional Number within Words // Contributions to the Science of Text and Language: Word Length Studies and Related Issues. – Dordrecht: Springer, 2006. – Pp. 215-240.



Polikarpov A. A. Using Corpus for the Benefit of Neoderivatology: Theoretical and Experimental Study of New Words Based on Data from «Polystylistic Corpus of Modern Russian Texts» // Frantisek Sticha, Mirjam Fried (eds.) // Grammar and Corpora. Gramatika a Korpus 2007. (Selected contributions from the conference “Grammar and Corpora, Sept. 25-27, 2007, Liblice). — Praha: Academia, 2008. Pp. 65-76.


База данных защищена авторским правом ©infoeto.ru 2022
обратиться к администрации
Как написать курсовую работу | Как написать хороший реферат
    Главная страница