Как посчитать информацию
Анализируя информацию, мы сталкиваемся с необходимостью
оценки качества и определения количества получения информации. Определить
качество информации чрезвычайно сложно, а часто и вообще невозможно.
Какие-либо сведения, например исторические, десятилетиями считаются
ненужными, и вдруг их ценность может резко возрасти. Вместе с этим определить
количество информации не только нужно, но и можно. Это прежде всего
необходимо для того, чтобы сравнить друг с другом массивы информации, определить,
какие размеры должны иметь материальные объекты (бумага, магнитная лента и т.
д.), хранящие эту информацию.
Для определения количества информации нужно найти способ
представить любую ее форму (символьную, текстовую, графическую) в едином
виде. Иначе говоря, надо суметь эти формы информации преобразовать так, чтобы
она получила единый стандартный вид. Таким видом стала так называемая
двоичная форма представления информации — запись любой информации в виде
последовательности только двух символов.
Эти символы могут на бумаге обозначаться любым способом:
буквами А, Б; словами ДА, НЕТ. Однако ради простоты записи взяты цифры 1 и 0.
В электронном аппарате, хранящем либо обрабатывающем информацию,
рассматриваемые символы могут также обозначаться по-разному: один из них —
наличием в рассматриваемой точке электрического тока либо магнитного поля,
второй — отсутствием в этой точке электрического тока либо магнитного поля.
Методику представления информации в двоичной форме можно
пояснить, проведя следующую игру. Нужно у собеседника получить интересующую
нас информацию, задавая любые вопросы, но получая в ответ только одно из
двух: ДА либо НЕТ.
Известным способом получения во время этого диалога
двоичной формы информации является перечисление всех возможных событий.
Рассмотрим простейший пример получения информации. Вы
задаете только один вопрос: «Идет ли дождь?». При этом условимся, что с
одинаковой вероятностью ожидаете ответ «ДА» или «НЕТ». Легко увидеть, что
любой из этих ответов несет самую малую порцию информации. Эта порция
определяет единицу измерения информации, называемую битом. Благодаря введению
понятия единицы информации появилась возможность определения размера любой
информации числом битов. Образно говоря, если, например, объем грунта
определяют в кубометрах, то объем информации — в битах.
Условимся каждый положительный ответ представлять цифрой
1, а отрицательный — цифрой 0. Тогда запись всех ответов образует
многозначную последовательность цифр, состоящую из нулей и единиц, например
0100.
Рассмотренный процесс получения двоичной информации об
объектах исследования называют кодированием информации. Кодирование
информации перечислением всех возможных событий очень трудоемко. Поэтому на
практике кодирование осуществляется более простым способом. Он основан на
том, что один разряд последовательности двоичных цифр имеет уже вдвое больше
различных значений (00, 01, 10, 11), чем одноразрядная последовательность (0
и 1). Трехразрядная последовательность имеет также вдвое больше значений (000,
001, 010,011, 100, 101, 110, 111), чем двухразрядная, и т. д. Добавление
одного разряда увеличивает число значений вдвое. Вообще говоря, п-разрядная
последовательность имеет 2" значений.
Пользуясь этим, легко закодировать любое множество
событий. Например, нам нужно закодировать 32 буквы русского алфавита, для
этой цели достаточно взять пять разрядов, потому что пятиразрядная
последовательность имеет 32 различных значения.
В информационных документах широко используются не только
русские, но и латинские буквы, цифры, математические знаки и другие
специальные знаки, всего примерно 200— 250 символов. Поэтому для кодировки
всех указанных символов используется восьмиразрядная последовательность цифр
0 и 1. Например, русские буквы представляются восьмиразрядными
последовательностями следующим образом: А — 11000001, И - 1100101), Я -
11011101.
Следует отметить, что указанный способ кодирования
используется тогда, когда к нему не предъявляются дополнительные требования:
допустим, необходимо указать на возникшую ошибку, исправление ошибки,
обеспечить секретность информации. В этих случаях применяют специальное
кодирование, при использовании которого коды получаются длиннее, чем в
указанном способе.
Для представления графической информации в двоичной форме
используется так называемый поточечный способ. На первом этапе вертикальными
и горизонтальными линиями делят изображение. Чем больше при этом по/училось
квадратов, тем точнее будет передана информация о картинке. Как известно из
физики, любой цвет может быть представлен в виде суммы различной яркости
зеленого, синего и красного цветов. Поэтому информация о каждой клетке будет
иметь довольно сложный вид: номер клетки — 101 10010, 01111010, яркость
зеленого — 1010, яркость синего — 1101, яркость красного - ООП.
Перед тем как кодировать любую информацию, нужно
договориться о том, какие используются кодь, в каком порядке они
записываются, хранятся и передаются Это называется языком представления
информации.
Из примеров, рассмотренных выше, видно, что информация
описывается многоразрядными последовательностями двоичных чисел. Поэтому для
удобства эти г оследовательно-сти объединяются в группы по 8 бит. Такая
группа именуется байтом, например, число 11010011 — это ннфэрмация величиной
в один байт.
В своей деятельности человек использует все большие
массивы информации. Так, если с 1940 по 1950 год объем информации удвоился
примерно за 10 лет, то в настоящее время это удвоение уже происходит за 2—3
года. При работе с информацией приходится решать большо'.1 число вопросов,
связанных с удобными и выгодными формами ее хранения, передачи, поиска,
обработки. Кроме этого, исзникают задачи, связанные с определением структуры
информации. Необходимо также изучать общие свойства информации. Всем этим
занимается наука информатика.
|