какое количество информации необходимо чтобы закодировать каждый знак в unicode

Семинар ДОПИNG 09-10 Задачи на определение количества информации

Тупикова Валентина Владимировна, учитель информатики, МОУ лицей 60
Задачи с выбором правильного варианта ответа:

1. В кодировке Unicode каждый символ закодирован двухбайтовым словом. Определите информационный объем следующего предложения в этой кодировке:
Я сдаю экзамен по информатике.

2. Сообщение, записанное буквами 64-символьного алфавита, содержит 20 символов. Какой объем информации оно несет?

3. Объем сообщения, содержащего 4096 символов, равен 1/512 части Мбайта. Какова мощность алфавита, с помощью которого записано это сообщение?

4. Сколько информации несет сообщение о том, что было угадано число в диапазоне целых чисел от 684 до 811?

5. В корзине лежат 32 клубка шерсти, из них 4 красных. Сколько бит информации несет сообщение о том, что достали клубок красной шерсти?

6.Объем информационного сообщения 12288 битов можно выразить так:

7. Жители планеты Пинг используют алфавит из 64 знаков, а жители планеты Понг — из 128 знаков. Для жителей какой планеты сообщение из 10 знаков несет больше информации и на сколько?

8. Текст занимает 4 страницы, на каждой из которой помещается 45 строк по 50 символов. Определите информационный объем текста.

9. Мощность алфавита равна 128 символов. Какое количество информации несет в себе сообщение из 10 символов, написанное с помощью этого алфавита?

10. Один символ алфавита племени Джумбо несет 3 бита информации. Сколько всего символов в алфавите племени?

1) Метеорологическая станция ведет наблюдение за влажностью воздуха. Результатом одного измерения является целое число от 0 до 100 процентов, которое записывается при помощи минимально возможного количества бит. Станция сделала 80 измерений. Определите информационный объем результатов наблюдений.

2) В кодировке Unicode каждый символ закодирован двухбайтовым словом. Определите информационный объем следующего предложения в этой кодировке: Терпенье и труд все перетрут.

3) В некоторой стране автомобильный номер длиной 7 символов составляется из заглавных букв (всего используется 26 букв) и десятичных цифр в любом порядке. Каждый символ кодируется одинаковым и минимально возможным количеством бит, а каждый номер – одинаковым и минимально возможным количеством байт. Определите объем памяти, необходимый для хранения 20 автомобильных номеров.

5) Для кодирования нотной записи используется 7 значков-нот. Каждая нота кодируется одним и тем же минимально возможным количеством бит. Чему равен информационный объем сообщения, состоящего из 180 нот?

6) Информационное сообщение объемом 1,5 килобайта содержит 3072 символа. Сколько символов содержит алфавит, с помощью которого было записано это сообщение?

7) Информационный объем текста, набранного в кодировке unicode (1 символ закодирован 2 байтами), равен 1,5 Мбайт. Сколько символов в этом тексте?

8) Жители планеты Пинг используют алфавит из 256 знаков, а жители планеты Понг — из 128 знаков. Для жителей какой планеты сообщение из 10 знаков несет больше информации и на сколько?

9) Мощность алфавита равна 64. Сколько Кбайт памяти потребуется, чтобы сохранить 128 страниц текста, содержащего в среднем 256 символов на каждой странице?

10) Дан текст из 600 символов. Известно, что символы берутся из таблицы размером 16 на 32. Определите информационный объем текста в битах.

Источник

Какое количество информации необходимо чтобы закодировать каждый знак в unicode

Двоичное кодирование текстовой информации в компьютере. Информация, выраженная с помощью естественных и формальных языков в письменной форме, обычно называется текстовой информацией.

Для представления текстовой информации (прописные и строчные буквы русского и латинского алфавитов, цифры, знаки и математические символы) достаточно 256 различных знаков. По формуле можно вычислить, какое количество информации необходимо, чтобы закодировать каждый знак:

N = 2 i => 256 = 2 i => 2 8 = 2 i => I = 8 битов.

Для обработки текстовой информации на компьютере необходимо представить ее в двоичной знаковой системе. Для кодирования каждого знака требуется количество информации, равное 8 битам, т. е. длина двоичного кода знака составляет восемь двоичных знаков. Каждому знаку необходимо поставить в соответствие уникальный двоичный код из интервала от 00000000 до 11111111 (в десятичном коде от 0 до 255) (табл. 3.1).

Таблица 3.1. Кодировки знаков
какое количество информации необходимо чтобы закодировать каждый знак в unicode

В процессе вывода знака на экран компьютера производится обратное перекодирование, т. е. преобразование двоичного кода знака в его изображение.

Десятичные коды с 33 по 127 являются интернациональными и соответствуют знакам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания.

Десятичные коды с 128 по 255 являются национальными, т. е. в различных национальных кодировках одному и тому же коду соответствуют разные знаки. К сожалению, в настоящее время существуют пять различных кодовых таблиц для русских букв (Windows, MS-DOS, КОИ-8, Mac, ISO (табл. 3.1 и 3.2)), поэтому тексты, созданные в одной кодировке, не будут правильно отображаться в другой.

Таблица 3.2. Десятичные коды некоторых символов в различных кодировках
какое количество информации необходимо чтобы закодировать каждый знак в unicode

Например, в кодировке Windows последовательность числовых кодов 221, 194, 204 образует слово «ЭВМ», тогда как в других кодировках это будет бессмысленный набор символов.

К счастью, в большинстве случаев пользователь не должен заботиться о перекодировках текстовых документов, так как это делают специальные программы-конверторы, встроенные в операционную систему и приложения.

В последние годы широкое распространение получил новый международный стандарт кодирования текстовых символов Unicode, который отводит на каждый символ 2 байта (16 битов). По формуле можно определить количество символов, которые можно закодировать согласно этому стандарту:

N = 2 i = 2 16 = 65 536.

Такого количества символов оказалось достаточно, чтобы закодировать не только русский и латинский алфавиты, цифры, знаки и математические символы, но и греческий, арабский, иврит и другие алфавиты.

Источник

Решение задач по нахождению объема информации

какое количество информации необходимо чтобы закодировать каждый знак в unicode

какое количество информации необходимо чтобы закодировать каждый знак в unicode

Содержимое разработки

какое количество информации необходимо чтобы закодировать каждый знак в unicode

Решение задач по нахождению объема информации

Вопросы для повторения:

Двоичное кодирование текстовой информации в компьютере

Для представления текстовой информации достаточно 256 различных символов.

Для кодирования каждого знака требуется количество информации, равное 8 битам. Формула для определения количества информации:

i – количество информации (в битах),

N – количество информационных сообщений (событий)

Для представления символов и соответствующих им кодов используется кодовая таблица.

Таблица ASCII (American Standard Code for Information Interchange – Американский стандартный код для обмена информацией).

какое количество информации необходимо чтобы закодировать каждый знак в unicode

Различные кодировки знаков

Кодировки для русских букв: Windows, MS-DOS, КОИ-8, Mac, ISO – 8-битовый двоичный код – 256 символов

Новый международный стандарт кодирования текстовых символов Unicode отводит на каждый символ 2 байта (16 битов)

Для расчёта информационного объёма текстового сообщения используется формула

где V – это информационный объём текстового сообщения, измеряющийся в байтах, килобайтах, мегабайтах;

K – количество символов в сообщении,

i – информационный вес одного символа, который измеряется в битах на один символ.

Текстовое сообщение, содержащее 1048576 символов общепринятой кодировки, необходимо разместить на дискете ёмкостью 1,44Мб. Какая часть дискеты будет занята?

Дано : K=1048576 символов; i=8 бит/символ

V=K×i=1048576*8=8388608бит=1048576байт=1024 Кб=1Мб, что составляет 1Мб*100%/1,44Мб=69% объёма дискеты

Ответ: 69% объёма дискеты будет занято переданным сообщением

какое количество информации необходимо чтобы закодировать каждый знак в unicode

1. Полный набор символов, используемый для кодирования, называют:

2. Минимальным объектом, используемым для кодирования текста, является:

какое количество информации необходимо чтобы закодировать каждый знак в unicode

3. Количество битов, необходимое для кодирования одного символа алфавита в коде Unicode, равно:

4. Сообщение «урок» содержит следующее количество информации:

5. Какие символы могут быть зашифрованы кодами таблицы ASCII 119 и 251?

какое количество информации необходимо чтобы закодировать каждый знак в unicode

Задача1 . Во сколько раз увеличится информационный объем страницы текста при его преобразовании из кодировки Windows (таблица кодировки содержит 256 символов) в кодировку Unicode (таблица кодировки содержит 65 536 символов)?

1) в 2 раза 2) в 8 раз 3) в 16 раз 4) в 256 раз

Количество информации, необходимое, чтобы закодировать каждый знак в кодировке Windows (256 символов):

Количество информации, необходимое, чтобы закодировать каждый знак в кодировке Unicode (65 536 символов):

какое количество информации необходимо чтобы закодировать каждый знак в unicode

Алфавит содержит 32 буквы. Какое количество информации несет одна буква?

Мощность алфавита N = 32

Какое количество информации несет одна буква?

1. 32 = 2 5, значит вес одного символа b = 5 бит.

Ответ: одна буква несет 5 бит информации.

какое количество информации необходимо чтобы закодировать каждый знак в unicode

Сообщение, записанное буквами из 16-символьного алфавита, содержит 10 символов. Какой объем информации оно несет?

Информационное сообщение объемом 300 бит содержит 100 символов. Какова мощность алфавита?

Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку КОИ-8. При этом информационное сообщение уменьшилось на 480 бит. Какова длина сообщения в символах?

какое количество информации необходимо чтобы закодировать каждый знак в unicode

Сообщение, записанное буквами из 16-символьного алфавита, содержит 10 символов. Какой объем информации оно несет?

Мощность алфавита N = 16

Текст состоит из 10 символов.

Определить объем информации в битах.

2. Всего символов 10, значит объем информации 10×4 = 40 бит.

Ответ: сообщение несет 40 бит информации (8 байт).

какое количество информации необходимо чтобы закодировать каждый знак в unicode

Информационное сообщение объемом 300 бит содержит 100 символов. Какова мощность алфавита?

Объем сообщения = 300 бит

Текст состоит из 100 символов

Какова мощность алфавита?

1. Определим вес одного символа: 300 / 100 = 3 бита.

2. Мощность алфавита определяем по формуле: 2 3 = 8.

Ответ: мощность алфавита N = 8.

какое количество информации необходимо чтобы закодировать каждый знак в unicode

Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку КОИ-8. При этом информационное сообщение уменьшилось на 480 бит. Какова длина сообщения в символах?

1) 30 2) 60 3) 120 4) 480

х – длина сообщения в символах

16 * х бит – объем сообщения в 16-битном коде Unicode

8 * х бит – объем сообщения в 8-битной кодировке КОИ-8

Источник

Какое количество информации необходимо чтобы закодировать каждый знак в unicode

Двоичное кодирование текстовой информации в компьютере. Информация, выраженная с помощью естественных и формальных языков в письменной форме, обычно называется текстовой информацией.

Для представления текстовой информации (прописные и строчные буквы русского и латинского алфавитов, цифры, знаки и математические символы) достаточно 256 различных знаков. По формуле можно вычислить, какое количество информации необходимо, чтобы закодировать каждый знак:

N = 2 i => 256 = 2 i => 2 8 = 2 i => I = 8 битов.

Для обработки текстовой информации на компьютере необходимо представить ее в двоичной знаковой системе. Для кодирования каждого знака требуется количество информации, равное 8 битам, т. е. длина двоичного кода знака составляет восемь двоичных знаков. Каждому знаку необходимо поставить в соответствие уникальный двоичный код из интервала от 00000000 до 11111111 (в десятичном коде от 0 до 255) (табл. 3.1).

Таблица 3.1. Кодировки знаков
какое количество информации необходимо чтобы закодировать каждый знак в unicode

В процессе вывода знака на экран компьютера производится обратное перекодирование, т. е. преобразование двоичного кода знака в его изображение.

Десятичные коды с 33 по 127 являются интернациональными и соответствуют знакам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания.

Десятичные коды с 128 по 255 являются национальными, т. е. в различных национальных кодировках одному и тому же коду соответствуют разные знаки. К сожалению, в настоящее время существуют пять различных кодовых таблиц для русских букв (Windows, MS-DOS, КОИ-8, Mac, ISO (табл. 3.1 и 3.2)), поэтому тексты, созданные в одной кодировке, не будут правильно отображаться в другой.

Таблица 3.2. Десятичные коды некоторых символов в различных кодировках
какое количество информации необходимо чтобы закодировать каждый знак в unicode

Например, в кодировке Windows последовательность числовых кодов 221, 194, 204 образует слово «ЭВМ», тогда как в других кодировках это будет бессмысленный набор символов.

К счастью, в большинстве случаев пользователь не должен заботиться о перекодировках текстовых документов, так как это делают специальные программы-конверторы, встроенные в операционную систему и приложения.

В последние годы широкое распространение получил новый международный стандарт кодирования текстовых символов Unicode, который отводит на каждый символ 2 байта (16 битов). По формуле можно определить количество символов, которые можно закодировать согласно этому стандарту:

N = 2 i = 2 16 = 65 536.

Такого количества символов оказалось достаточно, чтобы закодировать не только русский и латинский алфавиты, цифры, знаки и математические символы, но и греческий, арабский, иврит и другие алфавиты.

    1. Почему при кодировании текстовой информации в компьютере в большинстве кодировок используется 256 различных символов, хотя русский алфавит включает только 33 буквы?
    2. С какой целью ввели кодировку Unicode, которая позволяет закодировать 65 536 различных символов?

Источник

Открытый урок на тему: «Алфавитный подход к определению количества информации. Единицы измерения информации. Кодирование текстовой информации»

Ищем педагогов в команду «Инфоурок»

Тема урока: «Алфавитный подход к определению количества информации. Единицы измерения информации. Кодирование текстовой информации»

Изучение нового материала

познакомить с алфавитным подходом к измерению информации;

ввести единицы измерения информации и соотношение между ними;

научить вычислять информационный объём сообщения, записанного знаками какого-либо алфавита и представлять его в различных единицах измерения;

дать представление о способе хранения текстовой информации в памяти компьютера.

Алфавит, мощность алфавита, единицы измерения информации, текстовая информация, кодовая таблица.

Проверка домашнего задания.

1 Кбайт = 2 10 *2 3 =2 13 бит

1 Мбайт = 2 10 *2 13 =2 23 бит

1 Гбайт= 2 10 *2 23 =2 33 бит

1. Что такое код, кодирование, длина кода?

2. Какая единица принимается за количество информации?

Бит – минимальная единица измерения информации.

Байт – единица измерения информации в системе СИ.

Теоретически основы урока.

Алфавитный подход к определению количества информации

Алфавит – набор всех допустимых символов знаковой системы.

какое количество информации необходимо чтобы закодировать каждый знак в unicode

где N – мощность алфавита;

i количество информации, которое несёт каждый символ алфавита;

I – Количество информации в сообщении при алфавитном подходе.

4. Объяснение нового материала.

При алфавитном подходе рассматривается запись сообщения с помощью какой-либо знаковой системы. Пусть алфавит знаковой системы состоит из N символов. Представим, что передать нужно всего один символ (это может быть один из N символов). Опять возникает неопределённость. Значит, количество информации, которое несёт сообщение, равное одному знаку, определяется соотношением:

какое количество информации необходимо чтобы закодировать каждый знак в unicode

С помощью этой формулы можно определить количество информации, которое несёт знак в двоичной знаковой системе:

Пусть передаётся простое арифметическое выражение. Алфавит арифметических выражений состоит из 16 знаков:

Один знак арифметического выражения несёт 4 бита информации.

Пусть сообщение записано русскими буквами. Алфавит русского языка состоит из 32 знаков(исключая ё) N =32, => 32=2 5 =>2 5 = 2 I => I = 5 бит.

Один знак русского алфавита несёт 5 бит информации.

Алфавит двоичной знаковой системы состоит из двух знаков (0,1), поэтому N =2, =>

Т.О. в двоичной знаковой системе знак несёт 1 бит информации.

Информационная ёмкость знака двоичной знаковой системы составляет один бит

Какова мощность алфавита:

нотных знаков: N =7 (до, ре, ми, фа, соль, ля, си)

Слово «ЭВМ» содержит I = 5 бит • 3 символа = 15 бит

(Информационная ёмкость знака русского алфавита равна 5 бит, N =32, => 32=2 5 =>2 5 = 2 I => I = 5 бит)

Слово «Компьютер» содержит I = 5 бит • 9 символов = 45 бит.

Выражение «4+5=9» содержит I = 4 бита • 5символов = 20 бит.

Выражение «2•(4+5)=18» содержит I = 4 бита • 10 символов = 40 бит.

Двоичный код «1000101» содержит I = 1 бит •7 символов = 7 бит.

Двоичный код «1111111» содержит I = 1 бит •7 символов = 7 бит.

какое количество информации необходимо чтобы закодировать каждый знак в unicode

Необходимо вычислить количество информации, содержащейся на одной странице набранного на компьютере текста. Текст состоит из 50 строк по 60 символов.

Сообщение содержит: k =5060=3000 символов

Количество информации в тексте:

I = i*k = 1 байт3000 = 3000 байт = 3000/1024 =2.93 Кбайт

Вычислить количество информации на 10 страницах.

k = 3000 символов * 10 страниц = 30000 символов.

I = i * k = 1 байт30000 символов = 30000 байт = 30000/1024=29.3 Кбайт

Сколько страниц текста уместится на дискету и компакт-диск?

Объём одной дискеты:

1.44 Мбайт = 1.44 • 1024 = 1509949,44 байт

k = 1509949,44 / 3000 = 500 страниц

Объём одного компакт-диска:

650 Мбайт = 650 • 1024 = 681574400 байт

k = 681574400/3000 = 227190 страниц

Кодирование текстовой информации

Информация, выраженная в письменной форме, называется текстовой информацией.

Достаточно 256 различных символов.

Для представления текста в память компьютера необходимо представить его в двоичной знаковой системе.

Для кодирования каждого знака требуется количество информации, равное 8 битам.

какое количество информации необходимо чтобы закодировать каждый знак в unicode

Коды 0-31 соответствуют операциям (перевод строки и т.д)

Коды 32-127 – международный алфавит (латинские буквы, цифры, знаки препинания).

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *