5. Кодирование информации. 8 кл
Информация никогда не появляется в "чистом виде", она всегда как – то представлена, как-то закодирована. Одна и та же информация может быть представлена различными способами – различными знаками. Например, количество учеников в классе может быть представлено в виде рисунка, буквенной записи, числа, звука голоса. При этом разнятся лишь способы представления, а сама информация остаётся неизменной.
Очень важным является способ представления той или иной информации. Только представив информацию наиболее удобным способом, её можно передавать, хранить, обрабатывать.
Для представления информации используется язык со своим алфавитом и правилами представления информации.
Алфавит – конечное множество знаков для представления сообщений, образуемых по определённым правилам. Это знаковая система.
Примерами алфавитов являются:
-
Алфавит арифметики – множество из цифр, знаков арифметических операций, десятичной точки;
-
Алфавит из букв русского языка;
-
Алфавит китайских иероглифов;
-
Алфавит мимики и жестов языка глухонемых, и другие.
Форма знаков. В соответствии со способом восприятия знаки можно разделить на зрительные, слуховые, осязательные, обонятельные и вкусовые, причем в человеческом общении используются знаки первых трех типов. К зрительным знакам, воспринимаемым с помощью зрения, относятся буквы и цифры, которые используются в письменной речи, знаки химических элементов, музыкальные ноты, дорожные знаки и т. д.
К слуховым знакам (воспринимаемым с помощью слуха) относятся звуки, которые используются в устной речи, а также звуковые сигналы, которые производятся с помощью звонка, свистка, гудка, сирены и т. д.
Для слепых разработана азбука Брайля, которая использует осязательный способ восприятия текстовой информации. К разряду осязательных знаков принадлежат также жесты-касания: рукопожатия, похлопывания по плечу и др. В коммуникации многих видов животных особую роль играют обонятельные знаки. Например, медведи и другие дикие животные помечают место обитания клочьями шерсти, сохраняющей запах, чтобы отпугнуть чужака и показать, что данная территория уже занята.
Для долговременного хранения знаки записываются на носители информации.
Для передачи информации на большие расстояния используются знаки в форме сигналов. Всем известны световые сигналы светофора, звуковые сигналы школьного звонка оповещают о начале или конце урока, электрические сигналы передают информацию по телефонным и компьютерным сетям, электромагнитные волны передают сигналы радио и телевидению.
Значение знаков. Знаки отображают объекты окружающего мира или понятия, т. е. имеют определенное значение (смысл).
Знаки различаются по способу связи между их формой и значением. Иконические знаки (иконки) позволяют догадаться об их смысле, так как имеют форму, похожую на отображаемый объект. Примером таких знаков являются значки на Рабочем столе операционной системы компьютера, например значок Компьютер.
Символами называются знаки, для которых связь между формой и значением устанавливается по общепринятому соглашению. Примером таких знаков являются символы химических элементов, отображающие атомы химических веществ.
Если неизвестно соглашение о связи формы и значения символов, то ничего нельзя сказать о смысле информации, записанной такими знаками. Существуют найденные археологами и до сих пор не расшифрованные тексты на древних языках, так как неизвестно значение знаков, которыми они записаны.
В современном мире широко применяется шифрование, которое использует секретный ключ в качестве соглашения о связи формы символов с их значениями. Если секретный ключ неизвестен, то содержание передаваемого текста понять невозможно.
Один и тот же символ может иметь различное значение в разных знаковых системах. Например, знак «О» используется в качестве:
-
буквы «О» в русском алфавите;
-
буквы «О» [оу] в английском алфавите;
-
цифры 0 (ноль) в системах счисления;
-
символа химического элемента «О» (кислорода) в таблице Д. И. Менделеева.
Язык – это совокупность имен объектов некоторой предметной области и имен отношений между этими областями. Каждый язык имеет свой алфавит. Имена объектов и явлений строятся из символов алфавита и называются словами. Одну и ту же фразу можно представить в виде слов разных языков. Например, "my baby"-по-английски, "mein klėine"- по-немецки, "мой малыш" - по-русски. Правила, согласно которым из знаков алфавита образуются слова данного языка, называются грамматикой этого языка.
То, что слово (имя) обозначает, называют лексическим значением слова. Не исключено, что разные слова-имена имеют одно и то же значение. Такие имена называют синонимами. Примеры: «лавка» - «скамья» - имена одного и того же предмета. «Предмет» - «объект» - так же являются словами – синонимами.
Со временем язык претерпевает изменения. Иногда это приводит к тому, что одно имя соответствует нескольким предметам. В языке такие слова-имена называют омонимами. Примеры: «ручка», «коса».
Кроме значения, для каждого имени определен еще смысл, зависящий от окружения, в котором употреблено данное имя. Это окружение называют контекстом. Вопросы соотнесения имени, значения и смысла составляют семантику языка.
Информацию можно представлять в виде набора символов на бумаге, в виде жестов, звуков, электрических импульсов и др. Значение информации не зависит от способа представления информации. Однако оно зависит от семантики языка. Поэтому важно, чтобы при передаче информации семантика используемого языка была одинакова и для источника, и для приемника информации. К сожалению, естественные языки человеческого общения такому требованию не удовлетворяют.
Естественные языки начали формироваться еще в древнейшие времена в целях обеспечения обмена информацией между людьми. В настоящее время существуют сотни естественных языков (русский, английский, китайский и др.). В устной речи, которая используется как средство коммуникации при непосредственном общении людей, в качестве знаков языка используются различные звуки (фонемы). В основе письменной речи лежит алфавит. В большинстве современных языков буквы соответствуют определенным звукам устной речи. Алфавит русского языка называется кириллицей и содержит 33 знака, английский язык использует латиницу и содержит 26 знаков.
В процессе развития наук были разработаны формальные языки. Каждая наука стремиться создать свой язык, в котором ограничено количество строгих правил грамматики и синтаксиса, а за каждым именем закреплен в точности один смысл и одно значение. Например, слово «вода» в химии означает соединение из двух атомов водорода и одного атома кислорода. Вода же в реке, чайнике – это вовсе не вода, а водный раствор и взвесь самых разнообразных веществ.
Закрепление за каждым именем ровно одного значения и смысла называют формализацией языка. Наиболее формализованным считается язык математики. Так, алфавит десятичной нумерации – это упорядоченное множество из десяти цифр; слово – это запись произвольного числа в десятичной системе счисления; грамматика – это правила, согласно которым образуется запись числа; язык десятичной нумерации – это множество записей всех натуральных чисел.
Существуют формальные языки, в которых в качестве знаков используют не буквы и цифры, а другие символы, например обозначения химических элементов, музыкальных нот, изображения элементов электрических или логических схем, дорожные знаки, точки и тире (код азбуки Морзе).
Генетический алфавит является «азбукой», с помощью которой строится единая система хранения и передачи наследственной информации живыми организмами. Как слова в языках образуются из букв, так и гены состоят из знаков генетического алфавита. В процессе эволюции от простейших организмов до человека количество генов постоянно возрастало, так как было необходимо закодировать все более сложное строение и функциональные возможности живых организмов.
В процессах хранения, обработки и передачи информации в компьютере используется двоичная знаковая система, алфавит которой состоит всего из двух знаков {0, 1}. Физически знаки реализуются в форме электрических импульсов (нет импульса — 0, есть импульс — 1), а также состояний ячеек памяти и участков поверхностей носителей информации (одно состояние — 0, другое состояние — 1). Именно двоичная знаковая система используется в компьютере, так как существующие технические устройства могут надежно сохранять и распознавать только два различных состояния (знака). Однако, в 60-е годы XX века в СССР учеными Московского государственного университета им. М. В. Ломоносова была разработана и запущена в производство элетронно-вычислительная машина «Сетунь» (всего было выпущено 50 экземпляров). «Сетунь» использовала троичное кодирование информации и, соответственно, состояла из устройств, способных находиться в одном из трех возможных состояний.
В любом случае для представления информации её нужно закодировать. Кодирование представляет собой процесс представления информации в виде кода. Код – это набор условных обозначений для представления информации. Примерами кодов являются последовательности букв в тексте, цифр в числе, генетический код, двоичный компьютерный код и т. д. В более узком смысле кодирование – процесс преобразования символов одного алфавита в символы другого по определённым правилам. Код – правило, описывающее отображение одного набора знаков в другой набор знаков.
Например, при кодировании кодом Цезаря каждый символ алфавита, на котором записано сообщение, заменяется другим символом этого же алфавита, отстоящим от него на заданное число символов. В процессе обмена информацией между людьми часто приходится переходить от одной формы представления информации к другой. Так, в процессе чтения вслух производится переход от письменной формы представления информации к устной и, наоборот, в процессе диктанта или записи объяснения учителя происходит переход от устной формы к письменной. В процессе преобразования информации из одной формы представления (знаковой системы) в другую происходит перекодирование информации.
Кодирование информации – это представление сведений в той или иной стандартной форме. Грандиозные достижения человечества – письменность и арифметика – есть не что иное, как системы кодирования речи и числовой информации. Исторически первым кодом считается код, предназначенный для передачи сообщений, связанный с именем изобретателя телеграфного аппарата Сэмюэля Морзе и известен как азбука Морзе. Средством перекодирования служит таблица соответствия знаковых систем (таблица перекодировки), которая устанавливает взаимно однозначное соответствие между знаками или группами знаков двух различных знаковых систем.
A A · −
|
I И · ·
|
R Р · − ·
|
CH Ш − − − −
|
1 · − − − −
|
9 − − − − ·
|
B Б − · · ·
|
J Й · − − −
|
S С · · ·
|
Q Щ − − · −
|
2 · · − − −
|
0 − − − − −
|
W В · − −
|
K К − · −
|
T Т −
|
Ъ − − · − −
|
3 · · · − −
|
Кавычки · − · · −
|
G Г − − ·
|
L Л · − · ·
|
U У · · −
|
Y Ы − · − −
|
4 · · · · −
|
? · · − − · ·
|
D Д − · ·
|
M М − −
|
F Ф · · − ·
|
X Ь − · · −
|
5 · · · · ·
|
! − − · · − −
|
E Е ·
|
N Н − ·
|
H Х · · · ·
|
Э · · − · ·
|
6 − · · · ·
|
Точка · · · · · ·
|
V Ж · · · −
|
O О − − −
|
С Ц − · − ·
|
Ю · · − −
|
7 − − · · ·
|
Запятая · − · − · −
|
Z З − − · ·
|
P П · − − ·
|
Ч − − − ·
|
Я · − · −
|
8 − − − · ·
|
Знак раздела − · · · −
|
Скобка − · − − · −
|
Двоеточие − − − · · ·
|
Апостроф · − − − − ·
|
Точка с запятой
− · − · −
|
Конец связи · · − · −
|
Ошибка (перебой)
· · · · · · · ·
|
Код состоит из определенного количества знаков (например, текстовое сообщение состоит из определенного количества букв, число — из определенного количества цифр и т. д.), т.е. имеет определенную длину. Так, длина кода текста учебника информатики составляет около 300 тысяч знаков, а генетический код человека в 10 тысяч раз длиннее, так как состоит из 3 миллиардов знаков генетического алфавита.
Не следует путать понятия кодирование и шифрование. Кодирование не ставит основной целью недоступность для чтения, а ставит целью более сжатое, компактное и быстрое представление и преобразование информации. Шифрование же ставит целью сделать сообщение недоступным для чтения без обладания ключом к шифру. Шифры появились в глубокой древности в виде криптограмм (по-гречески тайнописи), когда ими пользовались для засекречивания важного сообщения от тех, кому они не были предназначены. Между кодированием и шифрованием очень токая грань. Очень часто эти понятия превращаются друг в друга.
Контрольные вопросы:
-
Как может быть представлена информация? Ваши примеры.
-
Зависит ли смысл, содержание информации от способа представления?
-
Что такое алфавит? Ваши примеры.
-
Приведите собственные примеры зрительных, слуховых, осязательных, обонятельных и вкусовых знаков. Какие типы знаков применяются в человеческом общении?
-
В чем состоит различие между иконическими знаками и символами? Ваши примеры.
-
Что такое язык? Ваши примеры.
-
Что такое слово? Ваши примеры.
-
Приведите собственные примеры символов, которые имеют различное значение в нескольких языках.
-
Что такое грамматика? Семантика языка?
-
Что такое кириллица? Латиница?
-
Что такое формализация языка? В чем состоит различие между естественными и формальными языками? Ваши примеры формализованных языков.
-
Что такое кодирование? Код?
-
Почему в компьютерах используется двоичная знаковая система для кодирования информации?
-
Чем отличаются кодирование и шифрование?
-
Приведите 2 собственных примера кодов и определите их длины.
Задания:
-
Дана кодовая таблица азбуки Морзе
Расшифруйте (декодируйте), что здесь написано (буквы отделены друг от друга пробелами)?
-
Закодируйте с помощью азбуки Морзе свои фамилию и имя.
-
Заменяя каждую букву ее порядковым номером в алфавите, зашифруйте фразу:
“Я УМЕЮ КОДИРОВАТЬ ИНФОРМАЦИЮ”.
Зашифрованный текст должен быть записан без пропусков.
-
Дана кодировочная таблица (первая цифра кода – номер строки, вторая – номер столбца).
Используя кодировочную таблицу, расшифруйте текст: 25201538350304053835111503040038
|