“Информационные технологии”

ПРАКТИЧЕСКОЕ ЗАНЯТИЕ N 10

ТЕМА: Архивация данных. Виды архивных файлов. Работа с архивными данными.

ЦЕЛЬ: Научиться осуществлять операции упаковки в новый архив и распаковки данных из существующего архива.

ВРЕМЯ НА ВЫПОЛНЕНИЕ: 2 часа.

МЕСТО ВЫПОЛНЕНИЯ РАБОТЫ:  лаборатория «Информационных технологий»

ДИДАКТИЧЕСКОЕ И МЕТОДИЧЕСКОЕ ОБЕСПЕЧЕНИЕ: Персональный компьютер. Электронные методические указания.

I. Внеурочная подготовка

Подготовить титульный лист отчета включающий тему, цель работы.

 

II. Работа в кабинете

Теоретические сведения

Архивация файлов

Термин "архивация" не совсем точен. Главное назначение программ-архиваторов - сжатие файлов с целью экономии памяти. Поскольку со сжатыми файлами часто невозможно работать по их прямому назначению, их используют для хранения копий файлов, т.е. для их архивации. Сжатию (уплотнению) могут быть подвергнуты: файлы, папки, диски. Сжатие файлов и папок необходимо либо для их транспортировки, либо для резервного копирования, либо для обмена информацией по сети Интернет. Уплотнение дисков применяют для повышения эффективности использования их рабочего пространства (обычно для дисков недостаточной емкости).

Существует много программ-архиваторов, имеющих различные показатели по степени и времени сжатия, эти показатели могут быть разными для различных файлов (текстовых, графических, исполняемых и т.д.), то есть один архиватор хорошо сжимает текстовый файл, а другой - исполняемый.

Архиватором (упаковщиком) называется программа, позволяющая за счет применения специальных методов сжатия информации создавать копии файлов меньшего размера, а также объединять копии нескольких файлов в один архивный файл, из которого можно при необходимости извлечь файлы в их первоначальном виде.

Весь спектр существующих сегодня архиваторов можно разделить на три группы, которые мы условно назовем файловыми, программными и дисковыми.

Файловые архиваторы позволяют упаковывать один или несколько файлов (например, все содержимое данного подкаталога вместе с вложенными в него подкаталогами) в единый архивный файл. Размер последнего, как правило, меньше, чем суммарный размер исходных файлов, но воспользоваться запакованными программами или данными, пока они находятся в архиве, нельзя, пока они не будут распакованы. Для распаковки архивного файла обычно используется тот же самый архиватор. 

Программные архиваторы действуют иначе. Они позволяют упаковать за один прием один единственный файл - исполняемую программу ЕХЕ-типа, но зато так, что заархивированная программа будет сразу после ее запуска на исполнение самораспаковываться в оперативной памяти и тут же начинать работу.

Дисковые архиваторы позволяют программным способом увеличить доступное пространство на жестком диске. Типичный дисковый архиватор представляет собой резидентный драйвер, который незаметно для пользователя архивирует любую записываемую на диск информацию и распаковывает ее обратно при чтении. Однако операции чтения/записи файлов несколько замедляются, поскольку процессору требуется время для упаковки и распаковки.

Для архивирования используются специальные программы - архиваторы или диспетчеры архивов. Наиболее известные архиваторы: WinZip; WinRar; WinArj. Эти программы обеспечивают возможность использования и других архиваторов, поэтому, если на компьютере, куда перенесены сжатые в них файлы, отсутствуют указанные программы, архивы можно распаковать с помощью другого архиватора. До сих пор широко используются и соответствующие программы, созданные в MS DOS, но способные работать и в Windows.

Почти все архиваторы позволяют создавать удобные самораспаковывающиеся архивы (SFX – Self-extracting-архивы) – файлы с расширением .ехе. Для распаковки такого архива не требуется программы-архиватора, достаточно запустить архив *.ехе как программу. Многие архиваторы позволяют создавать многотомные (распределенные) архивы, которые могут размещаться на нескольких дискетах.

Основными характеристиками программ-архиваторов являются:

·                  скорость работы;

·                  сервис (набор функций архиватора);

·                  степень сжатия – отношение размера исходного файла к размеру упакованного файла.

Основными функциями архиваторов являются:

·                  создание архивных файлов из отдельных (или всех) файлов текущего каталога и его подкаталогов, загружая в один архив до 32 000 файлов;

·                  добавление файлов в архив;

·                  извлечение и удаление файлов из архива;

·                  просмотр содержимого архива;

·                  просмотр содержимого архивированных файлов и поиск строк в архивированных файлах;

·                  ввод в архив комментарии к файлам;

·                  создание многотомных архивов;

·                  создание самораспаковывающихся архивов, как в одном томе, так и в виде нескольких томов;

·                  обеспечение защиты информации в в архиве и доступ к файлам, помещенным в архив, защиту каждого из помещенных в архив файлов циклическим кодом;

·                  тестирование архива, проверка сохранности в нем информации;

·                  восстановление файлов (частично или полностью) из поврежденных архивов;

·                  поддержки типов архивов, созданных другими архиваторами и др.

Типы архивов

Для сжатия используются различные алгоритмы, которые можно разделить на обратимые и методы сжатия с частичной потерей информации. Последние более эффективны, но применяются для тех файлов, для которых частичная потеря информации не приводит к значительному снижению потребительских свойств. Характерными форматами сжатия с потерей информации являются:

·                  .jpg - для графических данных;

·                  .mpg - для видеоданных;

·                  .mp3 - для звуковых данных.

Характерные форматы сжатия без потери информации:

·                  .tif, .pcx и другие - для графических файлов;

·                  .avi - для видеоклипов;

·                  .zip, .arj, .rar, .lzh, .cab и др. - для любых типов файлов.

Основные алгоритмы сжатия

Говоря об алгоритмах сжатия, будем иметь в виду обратимые алгоритмы.

Алгоритм RLE (Run-Length Encoding) использует принцип выявления повторяющихся последовательностей. При сжатии записывается последовательность из двух повторяющихся величин: повторяемого значения и количества его повторений.

Пример

Исходная последовательность: 3, 3, 12, 12, 12, 0, 0, 0, 0.

Сжатая информация: 3, 2, 12, 3, 0, 4.

Коэффициент сжатия: 6/9*100% = 67%.

Алгоритм KWE (Keyword Encoding) предполагает использование словаря, в котором каждому слову соответствует двухбайтовый код. Эффективность сжатия увеличивается с ростом объема кодируемого текста.

Алгоритм Хафмана предполагает кодирование не байтами, а битовыми группами. В нем можно выделить три основные этапа.

1.              Выявляется частота повторения каждого из встречающихся символов.

2.              Чем чаще встречается символ, тем меньшим количеством битов он кодируется.

3.              К закодированной последовательности прикладывается таблица соответствия.

Создание SFX-архивов.

Предположим, что вы хотите принести файл в такое место, где нет архиватора. Если вы просто заархивируете ваш файл, то после вы не сможете его разархивировать и, следовательно, не сможете им пользоваться. Для этого существуют так называемые SFX- (self extractor) или самораспаковывающиеся архивы. Они несколько больше, чем обычные, но не требуют наличия распаковщика.

Выборочная архивация и извлечение.

Вы можете извлечь файлы из архива выборочно. Чтобы задать маску выборки, надо нажать клавишу “+” на цифровой клавиатуре. Точно так же вы можете выбирать файлы для архивации.

Многотомные архивы.

Если даже после упаковки файл не помещается на дискету, понятно, придется использовать несколько дискет. Для этого можно создать многотомный архив. Т.е. архив, разбитый на несколько файлов. (Для этого при исполнении команды “Добавить в архив” в окошке “Имя и параметры архива” на вкладке “Общие” есть поле “Разделить на тома…”).

Информация для восстановления.

При переносе файлов на дискетах, файлы иногда повреждаются. Для того, чтобы архив можно было восстановить, в него можно добавить дополнительную информацию. Она увеличит объем архива, но поможет его восстановить в случае чего.

Непрерывные архивы.

Все архивируемые файлы будут рассматриваться как один. Этот метод заметно улучшает сжатие, однако если какой-либо один файл будет поврежден, станет невозможным разархивировать его и следующие за ним (если не добавить информацию для восстановления).

Пароль.

На свой архив вы можете завести пароль. Архив будет зашифрован, и никто не сможет его разархивировать без знания этого пароля.

Сжатие информации — это процесс преобразования информации, хранящейся в файле, к виду, при котором уменьшается избыточность в ее пред­ставлении и соответственно требуется меньший объем памяти для хранения.

Сжатие информации в файлах производится за счет устранения избыточности различными способами, например за счет упрощения кодов или представления повторяющихся символов, или повторяющейся последовательности символов в виде коэффициента повторения и соответствующих символов. Применяются различные алгоритмы подобного сжатия информации.

Сжиматься могут как один, так и несколько файлов, которые в сжатом виде помещаются в так называемый архивный файл или архив.

Архивный файл — это специальным образом организованный файл, содержащий в себе один или несколько файлов в сжатом или несжатом виде и служебную информацию об именах файлов, дате и времени их создания или модификации, размерах и т.п.

 Целью упаковки файлов обычно являются обеспечение более компактного размещения информации на диске, сокращение времени и соответственно стоимости передачи информации по каналам связи в компьютерных сетях. Кроме того, упаковка в один архивный файл группы файлов существенно упрощает их перенос с одного компьютера на другой, сокращает время копирования файлов на диски, позволяет защитить информацию от несанкционированного доступа, способствует защите от заражения компьютерными вирусами.

Степень сжатия файлов характеризуется коэффициентом Кс, определяемым как отношение объема сжатого файла Vc к объему исходного файла Vо, выраженное в процентах:

Kc=(Vc/ V0)*100%

Степень сжатия зависит от используемой программы, метода сжатия и типа исходного файла. Наиболее хорошо сжимаются файлы графических образов, текстовые файлы и файлы данных, для которых степень сжатия может достигать 5 - 40%, меньше сжимаются файлы исполняемых программ и загрузочных модулей — 60 - 90%. Почти не сжимаются архивные файлы. Программы для архивации отличаются используемыми методами сжатия, что соответственно влияет на степень сжатия.

Архивация (упаковка) — помещение (загрузка) исходных файлов в архивный файл в сжатом или несжатом виде.

Разархивация (распаковка) — процесс восстановления файлов из архива точно в таком виде, какой они имели до загрузки в архив. При распаковке файлы извлекаются из архива и помешаются на диск или в оперативную память.

Программы, осуществляющие упаковку и распаковку файлов, называются про­граммами-архиваторами.

Большие по объему архивные файлы могут быть размещены на нескольких дисках (томах). Такие архивы называются многотомными. Том — это составная часть многотом­ного архива. Создавая архив из нескольких частей, можно записать его части на несколько частей.

 

Задание

Все файлы и папки, которые необходимо будет создать в процессе работы, следует размещать в Вашей личной папке.

1.      Создать следующую систему папок

Структура папок

2.      Скопировать:

в папку ВМР — все файлы с расширением ВМР из папки C:\ Program Files;

в папку DOC — все файлы с расширением DOC из папки C:\Documents and Settings;

в папку ТХТ — все текстовые файлы из папки C:\ Program Files;

4.    С помощью программы WinRar в папке Архив создать архивы txt.zip, bmp.zip, doc.zip, в которые поместить файлы из папок с соответствующим именем.

Как заархивировать файлы в RAR?

Как разархивировать файл RAR

 

Архивировать со степенью сжатия Обычный.

4.      С помощью программы WinRar в папке Архив создать архивы txt_max.zip, bmp_max.zip, doc_max.zip, в которые поместить файлы из папок с соответствующим именем. Архивировать со степенью сжатия Максимальный.

5.      С помощью программы WinRar в папке Архив создать архивы txt.rar, bmp.rar, doc.rar, в которые поместить файлы из папок с соответствующим именем.

Архивировать со степенью сжатия Обычный.

6.      С помощью программы WinRar в папке Архив создать txt_max.rar, bmp_max.rar, doc_max.rar, в которые поместить файлы из папок с соответствующим именем.

Архивировать со степенью сжатия Максимальный.

7.      С архивировать с помощью программы WinRar все файлы из папок TXT, BMP, DOC в файл ALL.ZIP.

8.      С архивировать с помощью программы WinRar все файлы из папок TXT, BMP, DOC в файл ALL.RAR.

9.      Занести информацию про созданные архивы в таблицы:

Размер, Kb

txt

bmp

doc

незаархивированных файлов

 

 

 

RAR-архив, Обычный

 

 

 

RAR-архив, Максимальный

 

 

 

Подсчитать степень сжатия:

Степень сжатия

txt

bmp

doc

RAR-архив, Обычный

 

 

 

RAR-архив, Максимальный

 

 

 

10.  Удалить все файлы из папок TXT, BMP, DOC.

11.  Разархивировать:

·     Из архива txt.zip в папку TXT - все файлы.

·     Из архива bmp.zip в папку BMP - все файлы.

·     Из архива doc.zip в папку DOC - все файлы.

Использовать способы:

·     Команду Extract (Извлечь).

·    Перетаскиванием.

12. С помощью программы WinRar создать SFX-архив.

13. С помощью программы WinRar создать непрерывный архив.

14. С помощью программы WinRar создать архив с паролем.

III. СОДЕРЖАНИЕ ОТЧЕТА

3.1. Номер практического занятия, тема и цель работы.

3.2. Ответы на контрольные вопросы.

3.2. Протокол выполненных действий.

 

Контрольные вопросы

Каково назначение программ-архиваторов?

Для чего используются сжатые файлы и папки?

Какие программы называются архиваторами?

По каким показателям отличаются программы-архиваторы?

Каковы возможности дисковых архиваторов?

Перечислите наиболее известные архиваторы.

Какие архивы называются самораспаковывающимися? Как распаковываются такие архивы?

Какие архивы называются многотомными?

Каковы основные характеристики программ-архиваторов?

Каковы основные функции архиваторов?

На какие типы можно разделить алгоритмы сжатия?

Чем отличаются алгоритмы сжатия без потери информации от алгоритмов сжатия с частичной потерей информации?

Каковы характерные форматы сжатия с потерей информации и без потери информации?

Каковы основные алгоритмы сжатия?