МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ
РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное бюджетное образовательное учреждение
высшего профессионального образования
«ТЮМЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»
Институт филологии и журналистики
Кафедра английского языка
Елена Владимировна Михалькова
КОРПУСНАЯ (КВАНТИТАТИВНАЯ) ЛИНГВИСТИКА
И НОВЫЕ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
Учебно-методический комплекс. Рабочая программа
для аспирантов 45.06.01 Языкознание и литературоведение
(Сравнительно-историческое, типологическое и сопоставительное языкознание)
очной и заочной форм обучения
Тюменский государственный университет
2014
Михалькова Елена Владимировна. Корпусная (квантитативная) лингвистика и новые информационные технологии. Учебно-методический комплекс. Рабочая программа для аспирантов по направлению 45.06.01 Языкознание и литературоведение (Сравнительно-историческое, типологическое и сопоставительное языкознание) очной и заочной форм обучения. Тюмень, 2014, 14 стр.
Рабочая программа составлена в соответствии с требованиями ФГОС ВО с учетом рекомендаций и ОПОП ВО по направлению и профилю подготовки.
Рабочая программа дисциплины опубликована на сайте ТюмГУ: Корпусная (квантитативная) лингвистика и новые информационные технологии [электронный ресурс] / Режим доступа: http://www.umk3plus.utmn.ru , свободный.
Рекомендовано к изданию кафедрой английского языка. Утверждено проректором по научной работе Тюменского государственного университета.
ОТВЕТСТВЕННЫЙ РЕДАКТОР: Белозёрова Н.Н., доктор филологических наук, профессор, заведующий кафедрой английского языка
© Тюменский государственный университет, 2014.
© Михалькова Е.В., 2014.
1. Пояснительная записка
1.1. Цели и задачи дисциплины
Цель дисциплины – сформировать у аспирантов знания и навыки использования корпусных (квантитативных) методов и информационных технологий для осуществления грамотных лингвистических исследований. Данная цель ставит следующие задачи:
-
сформировать у аспирантов знания о границах и содержании таких направлений современной лингвистики, как квантитативная, компьютерная и корпусная лингвистика;
-
выработать у аспирантов умения и навыки использования терминологического аппарата и методов данных направлений.
1.2. Место дисциплины в структуре образовательной программы
Дисциплина по выбору.
Для изучения дисциплины необходимы знания, умения и компетенции, полученные обучающимися на гуманитарных направлениях бакалавриата, магистратуры и специалитета. Учебная дисциплина основывается на подготовке, полученной при обучении математике, языкознанию и информационно-коммуникационным технологиям.
Таблица 1
Разделы дисциплины и междисциплинарные связи с обеспечиваемыми (последующими) дисциплинами
№ п/п
|
Наименование обеспечиваемых (последующих) дисциплин
|
Темы дисциплины необходимые для изучения обеспечиваемых (последующих) дисциплин
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
1.
|
Подготовка кандидатской диссертации
|
+
|
+
|
+
|
+
|
+
|
+
|
+
|
1.3. Компетенции обучающегося, формируемые в результате освоения данной образовательной программы.
В результате освоения основной образовательной программы аспирант должен обладать следующими компетенциями:
Данная дисциплина способствует формированию следующих профессиональных компетенций
1.Умение выявлять структурные и функциональные свойства языков и дискурсов в зависимости\независимо от характера генетических отношений между ними (ПК-14)
2. Умение выявлять различия (контрастности) между двумя сравниваемыми языковыми и\или дискурсивными явлениями (ПК-15)
3. Повышение эффективности переводческой и языковой деятельности на основе теоретических изысканий в области сравнительно-сопоставительных, квантитативных, семиотических, вероятностных, корпусных, ареальных методов и методов моделирования (ПК-16)
1.4. Перечень планируемых результатов обучения по дисциплине (модулю)
В результате освоения дисциплины обучающийся должен:
-
Знать основные сведения о квантитативной, компьютерной и корпусной лингвистике, ее терминологический аппарат и методы исследования.
-
Знать структурные и функциональные свойства языков и дискурсов;
-
Знать сходства и различия между сравниваемыми языковыми и дискурсивными явлениями;
-
Знать различные онтологии перевода и модели дискурсивных практик как производные от теоретических изысканий в области сравнительно-сопоставительных, квантитативных, семиотических, вероятностных, корпусных, ареальных методов и методов моделирования.
-
Уметь применять полученные знания в области квантитативной, компьютерной и корпусной лингвистики в научно-исследовательской и других видах деятельности;
-
Уметь выявлять структурные и функциональные свойства языков и дискурсов в зависимости\независимо от характера генетических отношений между ними;
-
Уметь выявлять явления типологического и контрастивного характера в сравниваемых корпусах языковых и дискурсивных данных;
-
Уметь сопоставлять и применять на практике в рамках переводческой и дискурсивной деятельности различные подходы к анализу языков и дискурсов.
-
Владеть основными методами и приемами исследовательской и практической работы в области квантитативной, компьютерной и корпусной лингвистики.
-
Методикой выявления структурных и функциональных свойств языков и дискурсов;
-
Владеть методикой выявления контрастных и типологических свойств языковых и дискурсивных явлений.
-
Владеть методикой комплексной имплементации современных лингвистических теоретических изысканий
2. Трудоемкость дисциплины
Семестр 3. Форма промежуточной аттестации - зачет. Общая трудоемкость дисциплины составляет 3 зачетных единиц, 108 академических часов, из них 76 часов, выделенных на самостоятельную работу
3. Тематический план
Таблица 2.
№
|
Тема
|
Всего часов
|
Виды учебной работы и самостоятельная работа, в час.
|
Из них в интерактивной форме
|
Формы контроля
|
лекции
|
семинарские (практические) занятия
|
самостоятель-ная работа
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
Модуль 1. Квантитативная лингвистика
|
|
-
|
Квантитативная лингвистика как направление общего языкознания.
|
14
|
2
|
2
|
10
|
2
|
Ответ на семина-ре, тест
|
-
|
Ключевые понятия квантитативной лингвистики.
|
12
|
1
|
1
|
10
|
2
|
Ответ на семина-ре, тест
|
-
|
Метод статистического анализа текста.
|
18
|
4
|
4
|
10
|
3
|
Ответ на семина-ре, тест
|
-
|
Направления лингвистики, использующие статистический анализ текста.
|
10
|
1
|
1
|
8
|
1
|
Ответ на семина-ре, контроль-ная работа, реферат
|
Всего
|
54
|
8
|
8
|
38
|
8
|
|
Модуль 2. Новые информационные технологии в лингвистике
|
|
5
|
Компьютерная и корпусная лингвистика.
|
20
|
4
|
4
|
12
|
4
|
Ответ на семина-ре, тест
|
6
|
Компьютерный анализ текста.
|
18
|
2
|
2
|
14
|
2
|
Ответ на семина-ре, тест
|
7
|
Лингвистические аспекты разработок в области искусственного интеллекта.
|
16
|
2
|
2
|
12
|
2
|
Ответ на семина-ре, контрол-ная работа, эссе
|
Всего
|
54
|
8
|
8
|
38
|
8
|
|
ИТОГО:
|
108
|
16
|
16
|
76
|
|
Зачет
|
Из них в интерактивной форме:
|
|
4
|
12
|
|
16
|
|
4. Содержание дисциплины
Модуль 1. Квантитативная лингвистика
-
Квантитативная лингвистика как направление общего языкознания:
Прикладная лингвистика. Математический аппарат в лингвистике. Математическая (комбинаторная и квантитативная) лингвистика. Комбинаторная лингвистика: стохастические процессы в языке, метод лингвистических переменных. Лексикостатистика (глоттохронология). Количественные методы исследования в лингвистике.
-
Ключевые понятия квантитативной лингвистики:
Возникновение дисциплины. Предмет, объект, цели и задачи квантитативной лингвистики. Статистические модели языка. Закон Ципфа. Определение необходимости проведения лингвостатистического анализа. Параметризация языковых единиц. Выборка. Переменные. Виды переменных. Шкала переменных. Группирующие переменные. Ранжирование. Статистическая значимость. Нормальное распределение.
-
Метод статистического анализа текста:
Корреляция. Коэффициент корреляций. Показатели центральной тенденции: средняя арифметическая, мода, медиана. Мера рассеяния признака. Показатели меры рассеяния признака: лимиты, вариационный размах, среднее линейное отклонение, дисперсия, среднее квадратичное отклонение, коэффициент вариации, квадратичная ошибка средней, t-критерий Стьюдента. Оценка достоверности статистических показателей в лингвистическом исследовании: корреляция и критерий знаков. Работа с программным обеспечением (Microsoft Ecxel, STATISTICA и др.). Интерпретация результатов, полученных методом лингвостатистического анализа.
-
Направления лингвистики, использующие статистический анализ текста:
Текстология и автороведение. Атрибуция текста. Определение авторства текста. Статистические характеристики гендера, возраста, социального статуса, происхождения автора текста. Статистическая стилистика. Статистическая семантика. Корпусная лингвистика. Машинный перевод. Лингводидактика.
Модуль 2. Новые информационные технологии в лингвистике
-
Компьютерная и корпусная лингвистика:
Предмет, объект, цели и задачи корпусной лингвистики. Крупномасштабные проекты в рамках корпусной лингвистики: Национальный Корпус Русского Языка (http://www.ruscorpora.ru/), WordNet (http://wordnet.princeton.edu/). Работа с системами анализа корпусов. Предмет, объект, цели и задачи компьютерной лингвистики. Возникновение и развитие дисциплины: появление ЭВМ, языки программирования, программы и алгоритмы; разработки в области искусственного интеллекта в1950-е гг. в США, тест Тьюринга, появление и развитие «Всемирной паутины», лингвистика и новые информационные технологии, Semantic Web, нейронные сети.
-
Компьютерный анализ текста:
Автоматизированные системы обработки устной и письменной речи. Парсинг. Стемминг. Поисковые системы. Автоматическое индексирование, аннотирование и реферирование текстов. Системы управления базами данных. Системы машинного перевода. Системы анализа и синтеза устной речи.
-
Лингвистические аспекты разработок в области искусственного интеллекта:
Язык и интеллект. Искусственный язык versus естественный язык. Компьютерные модели языка. Компьютерное моделирование речевых актов. Когнитивная лингвистика и модели представления знаний. Базы данных. Базы знаний. Тезаурусы, онтологии. Разработка экспертных систем. Data Mining.
5. Планы семинарских занятий
Общие рекомендации:
Семинары по дисциплине "Квантитативная лингвистика и новые информационные технологии" должны включать следующие компоненты: обсуждение теоретических вопросов на базе обязательной и дополнительной научной литературы, отработку формул либо знакомство с различным программным обеспечением и сайтами Интернет (в зависимости от того, что предусматривает план), выполнение практических заданий, тестов и контрольных работ – в группе и индивидуально – с обязательной корректировкой со стороны преподавателя. Корректирующая часть должна не только исправлять допущенные ошибки в формулах или в эксплуатации программного обеспечения, но и разъяснять вероятностный характер результатов, полученных при помощи статистических методов и компьютерного анализа. Здесь необходимо сделать акцент на части проверки и интерпретации результатов, т.к. не всегда возможно установить связь между количественными и качественными характеристиками текста. Также результаты, полученные с помощью систем автоматической обработки текста, требуют обязательной проверки и корректировки в связи с тем, что на данном уровне развития технологий системы допускают ошибки и неточности.
Модуль 1. Статистическая лингвистика
-
Квантитативная лингвистика как направление общего языкознания:
Обсуждение вопросов:
-
Каковы основные направления прикладной лингвистики? В чем ее отличие от теоретической лингвистики?
-
В чем различие между квантитативной и комбинаторной лингвистикой?
-
В каких лингвистических исследованиях применяются стохастические модели?
-
В каких исследованиях применяется метод лингвистических переменных?
-
Какие лингвистические методы основаны на количественном подсчете? Почему?
-
Какие лингвистические задачи решает параметризация языковых единиц?
Практические задания:
-
Посмотреть в Интернете, как существуют на сегодня в России лаборатории, кафедры и институты прикладной, компьютерной, математической лингвистики. Описать сферу их деятельности, достижения.
-
Создать проект лаборатории квантитативной лингвистики. Распланировать размер помещения, необходимое оборудование и программное обеспечение, персонал. Составить круг направлений в работе лаборатории.
-
Ключевые понятия квантитативной лингвистики:
Обсуждение вопросов:
-
Как определить единицу исследования?
-
Какие существуют виды выборок? Для каких целей они применяются?
-
Какие существуют виды переменных?
-
Что такое нормальное распределение? Какова его значимость в статистическом исследовании?
Практические задания:
-
Оценить объем предложенной выборки;
-
Сравнить две выборки – в какой из них наблюдается нормальное распределение?
-
Создать выборку из определенных языковых единиц любого уровня на основе предложенного текста; обосновать принципы составления выборки; для решения каких задач можно считать данную выборку достаточной.
Для выполнения данных заданий можно использовать следующее программное обеспечение: Microsoft Excel, STATISTICA (рекомендуемая версия – 5.5).
-
Метод статистического анализа текста:
Обсуждение вопросов:
-
Для чего рассчитывается коэффициент корреляций?
-
В чем разница между средней арифметической, модой и медианой?
-
Для чего рассчитывается мера рассеяния признака? К каким исследовательским недочетам может привести игнорирование меры рассеяния признака?
-
Каким образом дается обоснование количественным данным? Могут ли они свидетельствовать и о сущности языкового феномена?
Практические задания:
-
Отработать формулы расчета коэффициента корреляций, показателей средней тенденции и показателей меры рассеяния признака на различных числовых данных;
-
В заданном тексте подсчитать количество имён существительных женского, мужского и среднего рода; подсчитать коэффициент корреляций трех переменных; можно ли сказать, что для автора текста более характерно употребление существительных одного рода нежели двух других;
-
Подсчитать распределение частей речи в поэтическом и прозаическом тексте одного автора; подсчитать коэффициент корреляций различных частей речи; обосновать полученные данные; сравнить со среднестатистическими показателями для языка, на котором пишет данный автор;
-
Подсчитать среднюю частоту употребления ключевых слов в нескольких текстах на близкую тематику; обосновать полученные результаты.
Для выполнения данных заданий можно использовать следующее программное обеспечение: Word Tabulator, Microsoft Excel, STATISTICA.
-
Прикладные направления лингвистики, использующие статистический анализ текста:
Работа с «Национальным корпусом русского языка»:
-
Найти, какой вариант словоформы, где норма неустойчива, наиболее употребителен;
-
Рассчитать ядерные и периферические значения лексемы, сравнить полученный результаты со словарем.
Работа с уникальным корпусом:
-
Создать два корпуса прозаических текстов двух разных авторов;
-
Рассчитать статистику употребления нескольких квазисинонимов из рядов функциональных частей речи, наречий и сопоставить ее со статистикой аналогичных квазисинонимов в текстах другого автора;
-
Определить какому из двух авторов принадлежит данный текст: проанализировать статистику употребления ключевых слов и квазисинонимов (ответ должен носить вероятностный характер).
Работа с текстом:
-
Определить примерные гендерные, социальные, национальные характеристики автора текста с помощью статистического анализа (ответ должен носить вероятностный характер).
Для выполнения данных заданий можно использовать следующее программное обеспечение: Microsoft Excel, STATISTICA.
Модуль 2. Новые информационные технологии в лингвистике
-
Компьютерная и корпусная лингвистика:
Обсуждение вопросов:
-
В чем отличие методов компьютерной лингвистики от смежных направлений?
-
Зачем компьютерной лингвистике нужен терминологический аппарат логики?
-
Какие технические разработки привели к появлению компьютерной лингвистики?
-
Каково значение работ Н. Хомского для компьютерной лингвистики?
-
Что привносит компьютерная лингвистика сегодня в развитие информационных технологий?
-
В чем перспективность нейронных сетей? Как компьютерная лингвистика может использовать эту технологию?
Практические задания:
-
Реферировать научную статью (вып. не ранее 2000г.) по компьютерной лингвистике;
-
Ознакомиться с одной онтологией (OpenCyc, SUMO, DOLCE и др.) и описать ее функциональное предназначение.
6. Компьютерный анализ текста:
Практикум по работе с автоматическими системами работы с языком и речью:
-
Знакомство с системами распознавания и анализа устной речи (Microsoft Speech API, Google Voice и др.);
-
Знакомство с системами автоматической обработки текста, осуществляющими грамматический и лексический разбор (АОТ, «Морфологический анализатор», Word-Tabulator, Yandex Speller и др.);
-
Знакомство с различными поисковыми системами в сети Интернет (Google, Yandex и др.);
-
Знакомство с утилитами анализа корпусов (Protege, DOE и др.);
-
Знакомство с системами машинного перевода (Google Translator, Transalte Yandex и др.).
Примерные задания:
-
При помощи поисковой системы (например, Google Scholar, Google Books) составить библиографический список на заданную тему;
-
Сделать морфологический и синтаксический разбор текста с помощью системы автоматической обработки текста;
-
Составить список коллокаций лексемы при помощи системы анализа корпусов;
-
Перевести текст с помощью автоматического переводчика.
-
Лингвистические аспекты разработок в области искусственного интеллекта:
Обсуждение вопросов:
-
Какова связь между языком и знанием? Существуют ли между ними изоморфные отношения?
-
Каковы направления в компьютерном моделировании языка и речи?
-
В чем отличие баз данных от баз знаний? Для чего нужны онтологии?
-
Как можно преобразовать текст в структурное единство, модель?
-
Каковы перспективы компьютерной лингвистики в области Semantic Web?
Варианты практических заданий:
-
Представить научный или художественный текст в виде модели знаний;
-
Создать тезаурус по предложенной теме;
-
Создать базу знаний по предложенной теме;
-
Сравнить функциональность созданных тезаурусов и баз знаний.
Рекомендуемое программное обеспечение: Protege, DOE.
6. Учебно-методическое обеспечение и планирование самостоятельной работы аспирантов.
Таблица 3.
Планирование самостоятельной работы аспирантов
№
|
Темы
|
Виды СРС
|
Объем часов
|
обязательные
|
дополнительные
|
1
|
Квантитативная лингвистика как направление общего языкознания.
|
Чтение и реферирование обязательной литературы, составление конспектов
|
Ответ в устном опросе, самоконтроль
|
10
|
2
|
Ключевые понятия квантитативной лингвистики.
|
Чтение и реферирование обязательной литературы, составление конспектов
|
Ответ в устном опросе, самоконтроль
|
10
|
3
|
Метод статистического анализа текста.
|
Чтение и реферирование обязательной литературы, составление конспектов
|
Ответ в устном опросе, самоконтроль
|
10
|
4
|
Направления лингвистики, использующие статистический анализ текста.
|
Чтение и реферирование обязательной литературы, составление конспектов
|
Ответ в устном опросе, самоконтроль
|
8
|
Всего
|
38
|
5
|
Компьютерная и корпусная лингвистика.
|
Чтение и реферирование обязательной литературы, составление конспектов
|
Ответ в устном опросе, самоконтроль
|
12
|
6
|
Компьютерный анализ текста.
|
Чтение и реферирование обязательной литературы, составление конспектов
|
Ответ в устном опросе, самоконтроль
|
14
|
7
|
Лингвистические аспекты разработок в области искусственного интеллекта.
|
Чтение и реферирование обязательной литературы, составление конспектов
|
Ответ в устном опросе, самоконтроль
|
12
|
Всего
|
38
|
ИТОГО
|
76
|
Для самостоятельной работы аспирантов предусмотрены компьютерные аудитории с доступом в Интернет и необходимым программным обеспечением и информационно-библиотечные центры для работы с различными формами письменных работ.
Варианты тестов:
Дайте определение следующим понятиям: выборка, переменная, статистическая значимость, нормальное распределение, коэффициент корреляций, мода, медиана, среднее линейное отклонение, коэффициент корреляций.
Выберите правильный ответ:
1. Комбинаторная лингвистика не использует в исследованиях:
А. теорию множеств;
Б. стохастические процессы;
В. фрактальные модели;
Г. конечный набор правил;
2. Метод лингвистических переменных – это:
А. метод построения терм-множеств;
Б. формульное представление количественных подсчетов;
В. метод анализа деятельности нейронов при компьютерной томографии;
3. Количественные методы в лингвистике включают:
А. когнитивное моделирование;
Б. статистический анализ;
В. дефиниционный анализ;
Г. компонентный анализ.
Исключите лишнее:
А. Средняя арифметическая, среднее линейное отклонение, мода, медиана;
Б. t-критерий Стьюдента, среднее квадратичное отклонение, дисперсия, дизъюнкция;
В. Semantic Web, Web 3.0., социальные сети.
Варианты контрольных заданий:
Модуль 1. Квантитативная лингвистика
-
составить выборку по заданным параметрам;
-
рассчитать частоту употребления в тексте а) частей речи; б) ключевых слов; в) квазисинонимов;
-
произвести атрибуцию текста;
-
дать интерпретацию количественному результату, полученному методом квантитативной лингвистики.
Модуль 2. Новые информационные технологии в лингвистике
-
составить корпус текстов по заданным параметрам;
-
составить список словоформ, коллокаций одной лексемы в корпусе;
-
проанализировать текст с помощью системы автоматической обработки текста;
-
создать тезаурус, базу знаний.
Темы рефератов:
-
Различия квантитативной и комбинаторной лингвистики;
-
Применение статистических методов в автороведении: возможности, ограничения;
-
Переход от количественных данных к качественному анализу в лингвостатистике;
-
Применение корпусной лингвистики в современной лексикографии;
-
Связь компьютерной лингвистики с Web 3.0.
Темы эссе:
-
Нужны ли термины "математическая", "комбинаторная", "квантитативная", "статистическая", "компьютерная" лингвистика, статистическая и стилистическая семантика?
-
Статистика – панацея от лингвистической философии;
-
Машина, обладающая знаниями человека, непременно заговорит;
-
Куда двигаться компьютерной лингвистике?
-
Поймет ли программист лингвиста?
7. Типовые контрольные задания или иные материалы, необходимые для оценки знаний, умений, навыков и (или) опыта деятельности, характеризующей этапы формирования компетенций в процессе освоения образовательной программы
Вопросы к зачету:
-
Количественные исследования в языкознании.
-
Соотношение комбинаторной и квантитативной лингвистики.
-
Предмет, объект, цели и задачи лингвостатистики.
-
Статистические модели языка. Закон Ципфа.
-
Выборка. Виды выборки.
-
Переменная. Виды переменных.
-
Статистическая значимость. Нормальное распределение.
-
Корреляция. Коэффициент корреляций.
-
Показатели центральной тенденции: средняя арифметическая, мода, медиана.
-
Мера рассеяния признака. Показатели меры рассеяния признака.
-
Оценка достоверности статистических показателей: корреляция и критерий знаков.
-
Интерпретация результатов, полученных методом статистического анализа.
-
Текстология и автороведение. Атрибуция текста.
-
Статистические характеристики гендера, возраста, социального статуса, происхождения автора текста.
-
Предмет, объект, цели и задачи корпусной лингвистики.
-
Предмет, объект, цели и задачи компьютерной лингвистики.
-
Лингвистика и новые информационные технологии.
-
Автоматизированные системы обработки устной и письменной речи. Парсинг.
-
Поисковые системы. Автоматическое индексирование, аннотирование и реферирование текстов.
-
Системы управления базами данных.
-
Системы машинного перевода.
-
Язык и интеллект.
-
Компьютерные модели языка.
-
Компьютерное моделирование речевых актов.
-
Когнитивная лингвистика и модели представления знаний.
8. Образовательные технологии
Рекомендуемые образовательные технологии: проблемные лекции, семинарские занятия, самостоятельная работа аспирантов. При проведении занятий рекомендуется использование активных и интерактивных форм работы (проектных методик, мозгового штурма, разбора конкретных ситуаций, компьютерного моделирования, решения лингвистических задач индивидуально и в команде) в сочетании с внеаудиторной работой. Удельный вес занятий, проводимых в интерактивных формах, должен составлять не менее 30 % аудиторных занятий.
В темах 1, 2, 4, 7 планируется разработка собственных проектов: проект лаборатории квантитативной лингвистики (тема 1), проект лингвостатистического исследования (тема 2), проект автороведческого исследования (тема 4), проект собственного тезауруса/онтологии (тема 7).
В теме 3 планируется «мозговой штурм» при обсуждении вопроса об интерпретации количественных результатов и переходе к качественному анализу. В теме 4 «мозговой штурм» требуется при обосновании выводов автороведческой и лингвостилистической экспертизы текста.
В теме 3 планируется разбор конкретных лингвистических задач для отработки лингвостатистических формул. В темах 5 и 6 осуществляется интерактивный разбор существующих онтологий, тезаурусов и баз знаний.
Тема 7 требует создания компьютерной модели представления знаний в заданной проблемной области.
9. Учебно-методическое и информационное обеспечение дисциплины
9.1. Основная литература:
-
Баранов А.Н. Лингвистическая экспертиза текста: теоретические основания и практика: учеб. пособие/ А. Н. Баранов; РАН, Ин-т рус. яз. им. В. В. Виноградова. 2-е изд.. Москва: Флинта: Наука, 2013. 592 с.
-
Белозерова Н.Н. Шекспир и компания, или Использование электронных библиотек при лингвистическом исследовании: учеб. пособие/ Н.Н. Белозерова, Л.Е. Чуфистова. Тюмень: Изд-во ТюмГУ, 2011. 296 с.
9.2. Дополнительная литература:
-
Кто написал "Тихий Дон"?: проблема авторства "Тихого Дона": перевод. - Москва: Книга, 1989. - 192 с.
-
Алефиренко Н.Ф. Современные проблемы науки о языке. М.: Флинта: Наука, 2009. 416 с.
-
Арапов М. В. Квантитативная лингвистика. – М.: Наука, 1988.
-
Гвишиани Н.Б. Практикум по корпусной лингвистике: учеб. пособие по англ. яз. / Н.Б. Гвишиани. Москва: Высшая школа, 2008. 191 с.
-
Головин Б. Н. Язык и статистика. – Москва: Высшая школа, 1971.-.191 с.
-
Коваль С. А. Лингвистические проблемы компьютерной морфологии. – Санкт-Петербург: Изд-во СПбГУ, 2005. – 151 с.
-
Новое в зарубежной лингвистике: Сб. ст. – Вып. 24: Компьютерная лингвистика. – Москва: Прогресс, 1989. – 428 c.
-
Овчинникова И.Г. Компьютерное моделирование вербальной коммуникации: учеб.-метод. пособие/ И. Г. Овчинникова, И. А. Угланова. Москва: Флинта: Наука, 2009. 136 с.
-
Филиппович Ю. Н. Семантика информационных технологий: Опыты словарно-тезаурусного описания. – Москва: Изд. МГУП, 2002. – 368 c.
-
Шайкевич А. Я. Статистический словарь языка русской газеты: 1990-е гг. – Москва: Языки славянских культур, 2008.
9.3. Интернет-ресурсы:
-
http://api.yandex.ru/speller/
-
http://books.google.ru/
-
http://scholar.google.com/
-
http://translate.google.com/
-
http://translate.yandex.ru/
-
http://wordnet.princeton.edu/
-
http://www.aot.ru/
-
http://www.coli.uni-saarland.de/page.php?id=whatis
-
http://www.loa-cnr.it/DOLCE.html
-
http://www.ontologyportal.org/
-
http://www.opencyc.org/
-
http://www.ruscorpora.ru/
-
http://www.wikipedia.org/
10. Перечень информационных технологий, используемых при осуществлении образовательного процесса по дисциплине (модулю), включая перечень программного обеспечения и информационных справочных систем (при необходимости).
Компьютерные программы: Word (для подготовки текстовых документов), Ехсеl (для составления таблиц), РоwerPoint (для подготовки презентаций).
11. Технические средства и материально-техническое обеспечение дисциплины
Компьютерное оборудование, доступ в Интернет, информационно-библиотечный центр.
|