Что такое findslide.org?

FindSlide.org - это сайт презентаций, докладов, шаблонов в формате PowerPoint.


Для правообладателей

Обратная связь

Email: Нажмите что бы посмотреть 

Яндекс.Метрика

Презентация на тему Двоичное кодирование текстовой информации

Ч т о т а к о е т е к с т ?Первые компьютеры были созданы для обработки числовой информации, но начиная с 60-х годов XX века, появилась возможность обработки и текстовой (символьной) информации. Компьютерный
Д В О И Ч Н О Е К О Д И Ч т о т а к о е т е к с В с п о м н и м …Любая информация Что такое  т а б л и ц а  к С т а н д а р т A S C I К о д и р о в к а  к и К о д и р о в к а A S C К о д и р о в к а Windows-1251 (CP1251) С т а н д а р т  K O I 8 - R С т а н д а р т C P 8 6 6 Сортировка текста по алфавитуВ таблицах кодировки соблюдается принцип последовательного кодирования (лексикографический): в Информационный объем текстаСтатьи, рефераты, дипломы и прочие документы, подготавливают на компьютере в Р е ша е м з а д а ч и с О т в е т ь т е н а в о
Слайды презентации

Слайд 2
Ч т о т а к о е

Ч т о т а к о е т е к

т е к с т ?
Первые компьютеры были созданы

для обработки числовой информации, но начиная с 60-х годов XX века, появилась возможность обработки и текстовой (символьной) информации.
Компьютерный текст – любая последовательность символов из компьютерного алфавита. Текст может быть на естественном языке (например, русском или английском), может содержать химические или математические формулы, таблицы и пр. Главное, чтобы все символы, используемые в тексте, входили в компьютерный алфавит.
Алфавит должен включать латинские и русские прописные и строчные буквы, цифры, знаки препинания и арифметических операций, специальные знаки.
Для представления текста в компьютерном алфавите используется 256 символов

Слайд 3
В с п о м н

В с п о м н и м …Любая информация

и м …
Любая информация представляется в памяти компьютера в

двоичном виде.
Для компьютерной обработки текста необходимо кодирование – преобразование входной информации (каждого символа текста) в форму, воспринимаемую компьютером, т.е. двоичный код.
Чтобы вывести текст из памяти на экран или печать, нужно декодирование - преобразование двоичных кодов в символы.
Алфавит – множество символов для записи текста.
Мощность алфавита (N) – количество символов в алфавите.
Определить информационный вес символа (i), т. е. количество бит для представления одного символа из алфавита указанной мощности, можно по формуле Хартли:
N = 2I (256 = 28 i = 8 бит = 1 байт).
Для кодирования одного символа в алфавите мощностью 256 символов требуется 8 бит или 1 байт информации.

Слайд 4
Что такое т а б л и

Что такое т а б л и ц а к о

ц а к о д и р о

в к и ?


Чтобы поставить в соответствие каждому символу числовой код нужна таблица кодировки – стандарт, в котором всем символам компьютерного алфавита поставлены в соответствие порядковые номера в двоичной системе счисления.
Международным стандартом является таблица кодировки ASCII
Для кодировки русских букев существует пять различных кодовых таблиц : КОИ-8, СЗ1251, СР866, Mac, ISO
В последнее время появился новый международный стандарт UNICODE, в котором для представления символа отводится 2 байта.



Слайд 5
С т а н д а р т

С т а н д а р т A S C

A S C I I
В 1967 году в

США был введен код ASCII (Аmerican Standart Code for Information Interchange - Американский Стандартный Код для Обмена Информацией). В нем каждому символу ставился в соответствие 7-битный двоичный код, всего 128 символов (кодов), из них:
Управляющие (коды от 0 до 31, а также 127), не отображаются на экране;
Отображаемые (коды от 32 до 126). Код 32 – пробел, отображает пропуск на экране. Далее следуют знаки препинания, скобки, арабские цифры (0 - 9), некоторые знаки, латинские прописные, затем строчные буквы, знаки.
После модификации в 1977 году стандартом был принят 1 байт, и каждому символу в ASCII поставлено число от 00000000 до 11111111 (0 - 255 в десятичной системе счисления).
Коды 0 -127 - являются международным стандартом,
128 – 255 используются для национальных алфавитов и специальных знаков (расширенная таблица).

Слайд 6
К о д и р о в к

К о д и р о в к а к и

а к и р и л л и

ц ы

Стандарт CP866, альтернативная кодировка — кодовая страница, где все специфические европейские символы в верхней половине кодовой таблицы были заменены на кириллицу. Популярен в среде MS-DOS и OS/2. Разработана в ВЦ АН СССР, для которого впервые в СССР была закуплена партия IBM PC.
Стандарт CP1251. Кодовая страница Microsoft CP1251 создана Microsoft как стандарт для кодировки кириллицы в Windows.
Стандарт КОИ8. В нем символы русской кириллицы поместили так, что позиции символов кириллицы соответствуют их фонетическим аналогам в английском алфавите. Это означает, что если в тексте, написанном в КОИ8, убрать восьмой бит каждого символа, то мы имеем "читабельный" текст, хотя он и написан английскими символами. KOI8-R быстро стал фактически стандартом для русской кириллицы в Internet


Слайд 7
К о д и р о в к

К о д и р о в к а A S

а A S C I I (коды 0

– 127)

Слайд 8
К о д и р о в к

К о д и р о в к а Windows-1251 (CP1251)

а Windows-1251 (CP1251)


Слайд 9
С т а н д а р т

С т а н д а р т K O I 8 - R

K O I 8 - R


Слайд 10
С т а н д а р т

С т а н д а р т C P 8 6 6

C P 8 6 6


Слайд 11
Сортировка текста по алфавиту
В таблицах кодировки соблюдается принцип

Сортировка текста по алфавитуВ таблицах кодировки соблюдается принцип последовательного кодирования (лексикографический):

последовательного кодирования (лексикографический): в начале упорядочены цифры (от 0

до 9), затем приводится латинский алфавит: прописные (большие), затем - строчные (маленькие) буквы, во второй части таблицы дается кириллица (русский алфавит), также сначала прописные, затем строчные буквы. Этот принцип позволяет сортировать символьную информацию.
П р и м е р
Изучите в приведенных кодировках размещение символов.
Попробуйте определить: в каком порядке будут идти фрагменты текста «excel», «байт», «8в», «10г», «9а», «10а», если упорядочить их по возрастанию?
Ответ: «10а», «10г», «8в», «9а», «excel», «байт»
Почему? Сначала будут упорядочены по возрастанию коды первых символов, затем, затем среди одинаковых первых символов, будут упорядочены вторые и т. д.

Слайд 12
Информационный объем текста
Статьи, рефераты, дипломы и прочие документы,

Информационный объем текстаСтатьи, рефераты, дипломы и прочие документы, подготавливают на компьютере

подготавливают на компьютере в текстовых редакторах. Обычно известно, какая

кодировка используется программой. Все это позволяет определить информационный объем документа.
П р и м е р
Пусть реферат содержит 32 страницы; на каждой странице — 32 строки, в каждой строке — 64 символа. Определить информационный объем реферата в кодировке ASCII .
Одна страница содержит 32 x 64 = 25 x 26 = 211 символов. Тогда в всем реферате: 32 x 211 = 25 x 211 = 216 символов. В кодировке ASCII для хранения символа требуется один байт. Объем реферата: 216 х 1 = 216 байт = 216/ 210 = 26 Кбайт = 64 Кбайта

Слайд 13
Р е ша е м з а д

Р е ша е м з а д а ч и

а ч и с а м и …
Оцените информационный

объем сообщения в битах и байтах, представленного в кодировке ASCII:
В одном килограмме 1000 граммов
Какое сообщение закодировано в кодировке Windows-1251: 0011010100100000111000011110000011101011111010111110111011100010
Считая, что каждый символ кодируется двумя байтами, оцените информационный объем следующего предложения из пушкинского четверостишия: Певец-Давид был ростом мал, Но повалил же Голиафа!
Выбрать слово, имеющее наибольшую сумму кодов символов в таблице кодировки ASCII.
А. окно; B. кино; C. ника; D. конь; E. ночь.
Выбрать слово, имеющее наибольшую сумму кодов символов в таблице кодировки ASCII.
А. 2b2d; B. файл; C. file; D. 1999; E. 2001.
Декодируйте следующее сообщение, записанное восьмибитовой кодировке:
01010101 01110000 00100000 00100110 00100000
01000100 01101111 01110111 01101110
Определите вид кодировки и декодируйте следующие сообщения:
а) 235 207 212 197 204 216 206 201 203 207 215
б) 213 224 244 244 236 224 237




  • Имя файла: dvoichnoe-kodirovanie-tekstovoy-informatsii.pptx
  • Количество просмотров: 99
  • Количество скачиваний: 0