1. Перечень компетенций с указанием этапов (уровней) их формирования




Скачать 350.5 Kb.
страница 1/3
Дата 30.08.2016
Размер 350.5 Kb.
  1   2   3
Волгоградский государственный университет


УТВЕРЖДЕНО

__ ________201_ г.

Директор института

Приоритетных технологий

______ (подпись) ______ (Запороцкова И.В.)


РЕКОМЕНДОВАНО КАФЕДРОЙ ______________

Протокол №_____

__ ______ 201_ г.

Заведующий кафедрой

Биоинженерии и биоинформатики

________ (подпись) ______ (Новочадов В.В.)



ФОНД ОЦЕНОЧНЫХ СРЕДСТВ
по дисциплине
«Базы данных и основные методы биоинформатики»
Направление подготовки

Код 06.05.01- Биоинженерия и биоинформатика

Составитель ФОС по дисциплине



Широкий Александр Александрович., к.ф-м.н,, доц.

Волгоград 2015 г.



1. Перечень компетенций с указанием этапов (уровней) их формирования.

ОПК-8: Способность находить и использовать информацию накопленную в базах данных по структуре геномов, белков и другой биологической информации, владением основными биоинформатическими средствами анализа геномной, структурной и иной биологической информации.


Знать:

Уровень 1

Основные принципы биоинформационного поиска информации

Уметь:

Уровень 1

Применять на практике методы исследования объектов

Владеть:

Уровень 1

Техническими приемами биоинформационных исследований




2. Описание показателей и критериев оценивания компетенций на различных этапах их формирования, описание шкал оценивания.

Уровень освоения компетенции1

Планируемые результаты обучения (в соотв. с уровнем освоения компетенции)2

Критерии оценивания результатов обучения

13

24

35

46

57

(Шифр компетении)-уровень8

Знать:

Отсутствие знаний, см. соотв. сноску

см. соотв. сноску

см. соотв. сноску

см. соотв. сноску

см. соотв. сноску

Уметь:

Отсутствие умений, см. соотв. сноску

см. соотв. сноску

см. соотв. сноску

см. соотв. сноску

см. соотв. сноску

Владеть:

Отсутствие навыков, см. соотв. сноску

см. соотв. сноску

см. соотв. сноску

см. соотв. сноску

см. соотв. сноску

ОПК-8

уровень 1
















3. Типовые контрольные задания или иные материалы, необходимые для оценки знаний, умений, навыков и (или) опыта деятельности, характеризующих этапы формирования компетенций в процессе освоения образовательной программы.

3.1. Задания для оценивания результатов обучения в виде знаний.

типы контроля:

- индивидуальное собеседование,

- письменные ответы на вопросы.



3.2. Задания для оценивания результатов обучения в виде умений и владений.

- индивидуальные задания в рамках курса (по блокам)



3.2.1. – Основы биоинформатики (ОПК-8 З.1)

Задание 1. Укажите в предыдущем тексте варианты путей нахождения информации, о том, как и когда P. Hogeweg определила биоинформатику. Попробуйте найти эту же информацию в Интернете традиционным способом и укажите проблемы, с которыми вы столкнулись при поиске информации.
Это ожидаемо! В Интернете часто под биоинформатикой понимают телепатию, парапсихологию, какие-то «биоинформационные» поля и тому подобные околонаучные вещи. Эта мистика не имеет ничего общего с дисциплиной, которую вы начинаете изучать. Поэтому не следует искать биологическую информацию с использованием популярных поисковиков общего назначения. Это бесполезная трата времени, указывающая на грубый непрофессионализм того, кто пытается что-либо найти.

То, насколько биоинформатика динамична, насколько ее границы еще не вполне состоялись, демонстрирует экспрессия одного из наиболее авторитетных ученых с этой сфере – Михаила Гельфанда (Институт проблем передачи информации РАН), при объяснении студентам МГУ, что это за наука. Полный текст лекции по введению в биологические базы данных Юрия Порозова, откуда взята эта цитата, доступен по ссылке http://www.myshared.ru/slide/283265/.

«Биоинформатика – это способ заниматься биологией, не наблюдая живые существа, как зоологи, не делая опытов в пробирке, как экспериментальные биологи, а анализируя результаты массовых данных или целых проектов.

Там есть два аспекта. Один – чисто практический. Оказывается, глядя на буковки, или на структуры белков, или на карты белковых взаимодействий, которые получены из таких массовых экспериментов, вы можете делать совершенно конкретные, проверяемые биологические утверждения.

Вторая вещь. Это началось с чистой техники. Размер генома человека – 3 миллиарда нуклеотидов, 3 миллиарда букв. Их надо где-то хранить, ими надо уметь манипулировать. Это чисто техническая сторона. Но очень важная. Кроме того, оказалось, что можно делать утверждения уже не настолько частные, что «этот белок делает это», а строить утверждения о системе взаимодействия белков в клетке. Описания общих свойств на уровне целой клетки.

Третий аспект биоинформатики, с моей точки зрения, самый интересный, потому что самая правильная биоинформатика – это биоинформатика эволюционная. Интереснее всего описывать не то, как клетка устроена сейчас, а то, как она такой получилась. Что происходило, что породило такие механизмы внутри клетки и т. д. Эволюционная биология - наука очень старая, а молекулярная эволюция, то есть использование молекулярных данных для реконструкции эволюционных событий, – вещь более новая. Она стала возможной, когда такие данные стали приходить в эволюционную биологию. Происходят, по-видимому, некие культурные войны между классическими эволюционными биологами и молекулярными эволюционистами. Причем они происходят в одну сторону…»

М. Гельфанд

Биоинформатика и ее связь с другими дисциплинами.

Биоинформатика ≈ вычислительная молекулярная биология наиболее тесно связана с информатикой (в том числе – с теорией алгоритмов), теорией вероятностей, математической статистикой и молекулярной биологией. В практической деятельности акценты модно расставить по-разному.


БИОинформатика:

Цели, задачи и результаты

биологические

БиоИНФОРМАТИКА
Создание и использование баз

данных, алгоритмов и программ,

математических методов анализа

биологической информации

Вычислительная МОЛЕКУЛЯРНАЯ

биология:

объекты изучения – биологические молекулы (белки, ДНК, РНК …) и их поведение в живых системах

ВЫЧИСЛИТЕЛЬНАЯ

молекулярная биология:

объекты изучения – результаты массовых экспериментов (последовательности, экспрессии генов, пространственные структуры сложных молекул …)


Задание 2. Предшествующая информация взята из вводной лекции в. н. с., доц. А. В. Алексеевского студентам факультета биоинженерии и биоинформатики МГУ имени М. В. Ломоносова. Зайдите на учебный сайт этого факультета http://kodomo.fbb.msu.ru и отыщите эту лекцию. Установите на своем PC активную ссылку на эту лекцию. Попытайтесь найти продолжения в многоточиях (…) лектора.
Молекулы, с которыми работает биоинформатика, имеют информационную составляющую. Таким образом, их можно представить и как молекулы, состоящие из атомов, и как последовательности…

Например, любой фрагмент ДНК, помимо классической структурной формулы (из атомов водорода, углерода, азота, кислорода и фосфора), может быть описан как последовательность нуклеотидов:


-GATCAACACTACTTGACTTCAAGACTTACCATAAAGAAAACTATAGTGTG-

-GTATTGGCAAAAGACAAGACAAATAGATCAACATAACAAAATAAAGGGCC-

-ATGAAATAGACCCATATAGTCAATTGATTTTTGACAAAGAAGGATTGGCAA-

-TAGAATGGGGTAAAGATAGTCTTCTCAACAAACGGTACCAGAATGACTGAA-
Задание 3. Попробуйте вручную найти первые 20 аминокислот соответствующей белковой последовательности. Найдите в интернете программу автоматического перевода кодонов в аминокислотные последовательности. Сравните трудоемкость ручного и машинного перевода для этих «биологических языков». Подумайте, что будет, если удалить из последовательности количество символов, не кратных трем с начала цепи, ее конца, из середины. Что вам известно о защитных механизмах в ядре клетки против таких «правок текста».
Первоначально аминокислотные последовательности белков определяли, отщепляя по одному аминокислотному остатку и определяя, каков он. Но в конце 70-х годов XX века был изобретен существенно более быстрый и дешевый метод экспериментального определения последовательности ДНК – секвенирование. Это привело к лавинообразному накоплению данных о последовательностях и расшифровке полных наборов генетическиой информации – геномов. В настоящее время общедоступные базы данных известных последовательностей содержат около 6 х 106 записей. Прямой поиск потребует слишком больших затрат машинного времени, а сервер просто не сможет обрабатывать массовые запросы. Решение заключается в создании специальных индексных таблиц для ускорения поиска. Это классический пример использования методов биоинформатики. Любая база данных содержит:

  • Записи (они же документы, entries) – каждая запись соответствует одному объекту, информация о котором хранится в базе.

  • Поля (fields) – каждое поле соответствует некоторому типу информации. Разделение на поля – продукт творчества создателей базы. Например, для базы адресов предприятий полями будут являться название, юридический адрес, фактический адрес, телефон, e-mail, URL.

Банк данных – по своему содержанию, является базой данных, но обычно это предполагает (а) общедоступность и (б) некую степень универсальности ресурса.

В качестве первого знакомства с профессиональной базой данных мы выбрали не самую молекулярную, но абсолютно незаменимую для современного специалиста в области биологии и медицины. Это знаменитый NCBI PubMed Central.
Задание 4. Зарегистрируйтесь к следующему занятию на PubMed и ознакомьтесь с ресурсами, которые он в себя включает. Обратите внимание на ресурсы в области молекулярной биологии и наличие полнотекстового доступа PubMed Central. Скриншоты стартового окна и странички регистрации приведены ниже. Как и большинство подобных ресурсов, он строится на сочетании формальной логики и интуитивного дизайна, так что особых комментариев не требует.


3.2.2. – PuBMed и PubMed Central ((ОПК-8 З.1))

Задание 1. Воспроизведите описанный выше поиск на ресурсе PubMed Central и сверьте полученные вами данные, а также первую сверху ссылку с приведенным ниже скриншотом. Объясните полученные вами расхождения. Попробуйте сузить поиск, добавив фильтр по году выпуска, ограничив доступ только к публикациям не старше 2010 года. Оцените, какая доля публикаций по теме относится к последнему пятилетию.


Чтобы найти публикации человека, который подписывает статьи как Carol G. Chen (один из соавторов статьи, открытой ранее), следует написать в строке запроса: Carol G Chen [Author].

Чтобы самому не писать слово "Author", можно воспользоваться сервисом "Limits", на котором можно установить дополнительные ограничения (например, в меню «Dates» можно установить лимит по времени, за который были опубликованы статьи).


Задание 2. Найдите в PubMed Central статьи крупных отечественных молекулярных биологов из МГУ имени М. В. Ломоносова: заведующего кафедрой биоинженерии академика РАН М. П. Кирпичникова (Kirpichnikov M. P.), заведующего кафедрой иммунологии, члена-корреспондента РАН С. А. Недоспасова (Nedospasov S. A.), декана факультета биоинженерии и биоинформатики, академика В. П. Скулачева (Skulachev V. P.). Сохраните ссылки на наиболее интересные из них.
Для просмотра статьи достаточно начать на один из активных доступов: в е-pub формате или .pdf-формате.

Мы также можем просмотреть наши предыдущие запросы на PMC, воспользовавшись окошком Recent activity.



С помощью поиска по ключевым словам, можно отметить и отправить (через меню «Send to») интересующие нас статьи в личную коллекцию. Чтобы просмотреть ее, по окончании работы нужно зайти в список коллекций («My NCBI» -> «Collections»).

Задание 3. Создайте свои «золотые коллекции» статей 2012-2014 годов по ключевым цитокинам (сигнальным молекулам межклеточных взаимодействий) – ФНО-α (tumor necrosis factor alpha) и ИЛ-1 (interleukin 1). Оцените общий объем публикаций. Пооткрывайте и выберите на основании авторских коллективов, университетов и институтов, а также тематики, обзоры или статьи из самых известных мировых журналов. Проверьте эффективность работы, закрыв PubMed и вновь обратившись к нему и своей коллекции. Работает?

3.2.3. – Банки данных биологической информации ((ОПК-8 У.1))



Задание 1. Зайдите на сайт SIB, приведенный выше (начало внушительного списка доступных баз данных приведено на скриншоте). Попытайтесь выйти на 2-3 сайта высокоспециализированных баз данных (например, семейств белков, межмолекулярных взаимодействий, токсикологических и т. п.). Не забудьте обратиться к помощи в виде Help или User Manual. Найдите сведения об объеме ресурса и кратко охарактеризуйте его целевое назначение. Если вы можете выделить особенности дизайна, отличающие такие базы данных от неспециализированного медико-биологического ресурса PubMed, укажите их.


Сравнение последовательностей – одна из важнейших элементарных операций вычислительной биологии и биоинформатики, являющаяся основание для многих других, более сложных манипуляций. На первый взгляд, задача не представляет особой сложности и заключается в определении схожих и отличающихся частей последовательностей. Тем не менее, за кажущейся простотой скрывается целый класс разнообразных задач, для эффективного решения которых зачастую требуются применять специальные алгоритмы.

Для работы с данными о составе биологических последовательностей предназначены многие базы данных и прикладные программы. Наиболее распространены следующие форматы описания последовательностей.

FASTA – формат для представления данных последовательности в виде текста. Иногда используются расширения .fna (Fasta Nucleic Acid) или .faa (Fasta Amino Acid) – для нуклеотидных и аминокислотных последовательностей соответственно.

EMBL – формат, используемый для представления нуклеотидных и пептидных последовательностей в базах данных EMBL (European Molecular Biology Laboratory).

GenBank – формат, используемый NCBI (National Center for Biotechnology Information) для представления нуклеотидных и пептидных последовательностей в базах данных GenBank и RefSeq.

PDB – формат для представления структур биологических молекул в базе данных Protein Data Bank.

SwissProt – формат для представления белковых последовательностей, используемый базой данных SwissProt.

Stockholm – формат, используемый базами Pfam и Rfam для представления множественного выравнивания последовательностей.
Задание 2. Зайдите на сайт SIB, а с него переходите поочередно на ресурсы UniProt, NCBI protein resourse и Pfam. Все они входят в top-20, и расположены на первой же странице поисковика. Проанализируйте на примере поиска интерлейкина-1, какие форматы записи последовательностей используют эти базы данных, насколько они совместимы и как организован экспорт для сравнения этих последовательностей специализированными программами.

3.2.4. – GenBank-NCBI ((ОПК-8 У.1))



Задание 1. Варьируя опциями запроса, постарайтесь получить информацию по ИЛ-2А, максимально близкую той, что приведена на скриншоте. Попробуйте изменить вид организма или вывести информацию о нескольких видах, нескольких интерлейкинах.

Используя дополнительное меню, вы можете ограничить поиск в соответствии с тем, что вы ищете конкретно: организм, публикация и т.п. Вы можете использовать фильтры, расположенные справа. Наиболее популярные фильтры доступны сразу, остальные открываются с помощью Manage Filters:



Выберем, например фильтр mRNA (1), получим на единственный источник с данными о mRNA искомого интерлейкина. Выбрав этот результат (привыкаем использовать Search), можно посмотреть общую информацию о нуклеотидной последовательности, получить доступ к расширению FASTA и графике:





Изменить формат отображающейся информации можно, нажав в левом углу Display Settings, после чего выбрать то, что вам необходимо и применить эти параметры. В этом случае информация будет выдаваться в заданном вами объеме и очередности.

Для того, чтобы сохранить файл с результатами поиска, в правом углу нужно кликнуть Send Coding Sequences и выбрать нужный формат записи. После этого нажмите Create format и сохраняйте.


Для изменения вида кликните Customize view в правой стороне экрана, и выберите нужные параметры. Для отображения части последовательности применяется опция Change region show.




Если у вас несколько последовательностей, выберите Highlight Bar, это поможет быстро перемещаться между анализами без потери данных.

Общая информация о гене выдаются сразу же, после активирования ссылки на него, и включает в себя имя гена и его тип, официальный символ, синонимы, первоисточник и связанные ссылки, кодирующий белок, а также тип организма с полной систематикой. Ссылка Genomic context позволяет показать точное место гена, то есть сайт в конкретной хромосоме данного организма. Так же можно визуализировать геномные области:



Используя другие опции, большинство из которых построено в интуитивном дизайне, можно познакомиться с типичными фенотипами, ассоциированными с экспрессией гена, актуализировать информацию о кодируемых белках, связанных последовательностях, известных вариациях структуры гена и описанных молекулярных взаимодействиях. Доступно еще несколько дополнительных ссылок, полезных при специальных исследованиях. Актуальная библиография доступна из одноименной опции.


Достаточно типовой является задача, когда нам нужно отыскать и сравнить ген двух и более различных организмов. В этом случае мы выбираем эти организмы и с помощью программы BLAST сравниваем последовательности. Вначале находим нужные гены и открываем их последовательности в формате FASTA. Эти последовательности копируем целиком, чтобы вставить в соответствующие окна программы BLAST. На самом деле программа готова работать с любым текстовым файлом, так что найденные последовательности можно набирать как текст, используя, например блокнот MS Windows, и хранить в текстовых файлах.


Далее вставляем нужные нам последовательности BLAST, жмем одноименную клавишу, программа начинает сравнение:

  1   2   3


База данных защищена авторским правом ©infoeto.ru 2022
обратиться к администрации
Как написать курсовую работу | Как написать хороший реферат
    Главная страница