ИЗМЕРЕНИЕ И КОДИРОВАНИЕ ИНФОРМАЦИИ
Автор: drug | Категория: Технические науки / Информатика | Просмотров: | Комментирии: 0 | 03-11-2013 10:47

ИЗМЕРЕНИЕ И КОДИРОВАНИЕ ИНФОРМАЦИИ

Информация в переводе с латинского (informatio) - сведение, разъяснение, ознакомление.

Информация относится к фундаментальным, неопределяемым понятиям науки информатика.

 Тем не менее:

ü в быту информацией называют любые данные, сведения, знания, которые кого-либо интересуют. Например, сообщение о каких-либо событиях, о чьей-либо деятельности и т.п.;

ü в технике под информацией понимают сообщения, передаваемые в форме знаков или сигналов (в этом случае есть источник сообщений, получатель (приемник) сообщений, канал связи);

ü в теории информации под информацией понимают сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают степень неопределенности, неполноты имеющихся о них знаний.

Применительно к компьютерной обработке данных под информацией понимают некоторую последовательность символических обозначений (букв, цифр, закодированных графических образов и звуков и т.п.), несущую смысловую нагрузку и представленную в понятном компьютеру виде. Каждый новый символ в такой последовательности символов увеличивает информационный объем сообщения.

Свойства информации

 

Чтобы информация способствовала принятию правильных решений, она должна характеризоваться следующими свойствами:

 

1. Понятность - информация выражена на языке, понятном всем участникам обмена информацией

2. Полезность - информация должна иметь практическую ценность.

3. Объективность - информация не зависит от чего-либо мнения, суждения.

4. Достоверность - информация отражает истинное положение дел.

5. Полнота - информации достаточно для понимания и принятия решения.

6. Актуальность - информация важна, существенна для настоящего времени.

 

 

 

1 бит — минимальная единица измерения информации. При вероятностном подходе к измерению информации это количество информации, уменьшающее неопределенность знаний в 2 раза.

Связь между единицами измерения информации:
• 1 байт = 8 бит;
• 1 Кб (килобайт) = 210 (1024) байт = 213 бит;
• 1 Мб (мегабайт) = 210 (1024) Кб = 220 (1 048 576) байт = 223 бит;
• 1 Гб (гигабайт) = 210Мб = 220 Кб = 230 байт = = 233 бит;
• 1 Тб (терабайт) = 210 Гб = 220 Мб = 230 Кб = 240 байт = 243 бит.

Кодирование информации - это представление сообщений в конкретном виде при помощи некоторой последовательности знаков. Правило отображения одного набора знаков в другой называется кодом.  Обычно кодированием называют перевод информации с «человеческого» языка на формальный, например, в двоичный код, а декодированием – обратный переход.

При кодировании информации для представления ее в памяти ЭВМ используется двоичный способ, т.е. любая информация — будь то числа, текст, графическое изображение, звук или видео — представляется универсальным двоичным кодом. Алфавит этого кода составляют символы 0 и 1. Этот способ кодирования был выбран потому, что технически реализовать два существенно различных состояния, представляющих, соответственно, 0 или 1, значительно проще, чем, например,  три или десять. Действительно, отсутствие напряжения может обозначать 0, наличие — 1; отсутствие намагниченности участка носителя информации — 0, присутствие намагниченности — 1 и т.д. Каждая цифра машинного кода несет 1 бит информации.

Для кодирования одного символа используют 8 бит - один байт.

 Байт - это наименьшая единица обработки информации. С помощью одного байта можно закодировать 28=256 символов.

            Существует таблица кодов символов.  Первые коды с 0 по 127 являются стандартными и обязательными для всех стран и всех компьютеров.

            Коды с 0 по 32  соответствуют операциям (перевод строки, ввод пробела и т.д.)

               Коды с 33 по 127 являются  интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания.

                        Коды с 128 по 225 являются национальными (в каждой стране разные), т.е. в национальных кодировках одному и тому же коду соответствуют различные символы.

Первую половину называют таблицей ASCII (Американский стандартный код для обмена информацией).

Для русских букв существует пять однобайтовых таблиц:

Windows, MS-DOS, КОИ-8, Mac, ISO.

Также разработан международный стандарт Unicode, в котором каждый символ кодируется двумя байтами.

Задания на кодирование текстовой информации 

Задание 1

Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку КОИ-8. При этом информационное сообщение уменьшилось на 720 бит. Какова длина сообщения в символах?

1) 90

2) 45

3) 180

4) 720  

Решение:

Пусть в первоначальном сообщении х символов. Тогда его объем равен:  

16 бит*х=16х бит

В перекодированном сообщении количество символов  не изменилось, т.е. оно также равно х, а вот его объем стал равен:   8 бит*х = бит.

И этот объем меньше первоначального на 720 бит. Составим уравнение и решим его: 

16х — 8х =720

8х = 720

х = 90 

Ответ: 1

 

 

 Задание 2

В кодировке Unicode на каждый символ отводится два байта. Определите информационный объем слова из двадцати четырех символов в этой кодировке.

1) 384 бита;

2) 192 бита;

3) 256 бит;

4) 48 бит.

Решение:

24 * 2байта=48 байтов=384 бита

Ответ: 1

Задание 3

Текстовый документ, состоящий из 5120 символов, хранился в 8-битной кодировке КОИ-8. Этот документ был преобразован в 16-битную кодировку Unicode. Укажите, какое дополнительное количество Кбайт потребуется для хранения документа. В ответе запишите только число.

Решение. После перехода от 8-битной кодировки из 16-битного на каждый символ стало тратиться на 8 бит = 1 байт больше. На 5120 символов будет нужно больше на 5120*8 бит=5120*1 байт = 5120 байт = 5*1024 байт = 5 Кбайт.

Ответ: 5

Задание 4

Считая, что каждый символ кодируется 16 битами, оцените информационный объем следующей Пушкинской фразы в кодировке Unicode:

Привычка свыше нам дана: Замена счастию она.

1) 44 бита;

2) 704 бита;

3) 44 байта;

4) 704 байта.

Решение

Данное предложение содержит 44 символа (включая точку и двоеточие), то есть в кодировке Unicode оно содержит 88 байт или 704 бита.

Ответ: 2      

 

ЗАДАНИЯ ДЛЯ САМОСТОЯТЕЛЬНОГО ВЫПОЛНЕНИЯ НА ЗАНЯТИИ

Вариант 1

Задание 1   Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения из пушкинских строк:

                      Певец Давид был ростом мал, Но повалил же Голиафа!     

1) 400 битов;            2) 50 битов;           3) 400 байтов;             4) 5 байтов.

 Задание 2 Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке длиной в 100 символов, первоначально записанного в 2-байтном коде Unicode, в 8-битную кодировку КОИ-8. На сколько бит  уменьшилась длина сообщения? В ответе запишите только число.

 

Вариант 2

Задание 1   Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего высказывания Жан-Жака Руссо:

Тысячи путей ведут к заблуждению, к истине – только один.

1) 92 бита;            2) 220 бит;                3) 456 бит;               4) 512 бит.

 

 Задание 2 Текстовый документ хранился в 8-битной кодировке КОИ-8. Этот документ был преобразован в 16-битную кодировку Unicode, при этом размер памяти, необходимой для хранения документа увеличился на 4 Кбайт. При этом хранится только последовательность кодов символов. Укажите, сколько символов в документе. В ответе запишите только число.

 

Вариант 3

 

Задание 1   Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего высказывания Алексея Толстого:

Не ошибается тот, кто ничего не делает, хотя это и есть его основная ошибка.

1) 512 бит;           2) 76 байт;            3) 8 Килобайт;                4) 123 байта.

Задание 2 Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 2-байтном коде Unicode, в 8-битную кодировку КОИ-8. При этом длина сообщения уменьшилась на 600 бит. Укажите, сколько символов было в сообщении.

 

Вариант 4

 

Задание 1   Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего высказывания Рене Декарта:

Я мыслю, следовательно, существую.

1) 28 бит;            2) 272 бита;                3) 32 Кбайта;               4) 34 байта.

Задание 2 Текстовый документ, состоящий из 5120 символов, хранился в 8-битной кодировке КОИ-8. Этот документ был преобразован в 32-битную кодировку. Укажите, какое дополнительное количество Кбайт потребуется для хранения документа. В ответе запишите только число.

 

Вариант 5

 

Задание 1   Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего высказывания Дени Дидро:

Что такое истина? Соответствие наших суждений созданиям природы.

1)    64 бита;         2) 128 бит;             3) 256 бит;           4) 512 бит.

Задание 2    Текстовый документ хранился в 8-битной кодировке КОИ-8, а затем был преобразован в 32-битную кодировку. При этом для хранения документа дополнительно потребовалось 30 Кбайт. Определите длину документа (в символах). В ответе запишите только число.

Вариант 6

Задание 1   Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего высказывания Блеза Паскаля:

Красноречие – это живопись мысли.

1) 264 бита;          2) 28 бит;              3) 32 Кбайт;               4) 34 байта.

Задание 2    Текстовый документ, состоящий из 3072 символов, хранился в 16-битной кодировке Unicode, а затем  был преобразован в 8-битную кодировку КОИ-8. Укажите, на какое количество Кбайт уменьшился размер файла, в котором хранился документ.

 

 

         ЗАДАНИЯ ДЛЯ САМОСТОЯТЕЛЬНОГО ВЫПОЛНЕНИЯ ДОМА

 

Задание 1   Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего высказывания Оноре де Бальзака:

Ключом ко всякой науке является вопросительный знак.

1) 52 бита;            2) 216 бит;               3) 416 бит;               4) 512 бит.

Задание 2 Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку КОИ-8. При этом информационное сообщение уменьшилось на 480 бит. Какова длина сообщения в символах?

1)  30                   2) 60                     3) 120       4) 480

Сочинения курсовыеСочинения курсовые