えりちゃん
1日に水を1ℓ以上飲むことが目標
リーダー堀川氏
本日の講師
はじめに
拡張子について
ファイルの種類を識別するために、ファイル名の末尾に付けられる文字列。
ファイル名と拡張子の間は.(ドット)で区切られる。
一般的に使われる拡張子の種類
データ圧縮について
データ圧縮とは、冗長性のあるデータを
情報量を減らした別のデータに置き換えること。高効率符号化。
「可逆圧縮方式」と「非可逆圧縮方式」の2種類がある。
可逆圧縮方式
- データを置き換えることでデータ量を小さくすることが可能。
- 圧縮率は低くなるが、圧縮後のデータから圧縮前のデータを完全に復元できるデータ圧縮方法。
- 主にファイルの圧縮方式で用いられる。
- 代表的な可逆圧縮方式 : GIF、PNG、ZIPなど。
非可逆圧縮方式
- 不要な情報を削除し、元データへの復元を考慮せず計算できるため、高い圧縮率でデータ量を小さくすることが可能。
- 圧縮前のデータに似せた状態を復元できるが、圧縮前のデータと圧縮後のデータが完全には一致しないデータ圧縮方法。
- 主に画像や動画、音声などの圧縮方式で用いられる。
- 代表的な非可逆圧縮方式 : JPEG、MP3、MPEG-1/2/4、WMV9など。
圧縮アルゴリズム
ランレングス符号化
圧縮アルゴリズムの一つで、文字列の中で同じ文字(符号)が
繰り返される場合に繰り返し部分を反復回数と文字の組に置き換えて文字列を短くする方法。
ファクシミリなど単純な画像データの圧縮方式で用いられる。
次のようなデータがある場合、
Aが7回、Bが4回、Cが5回、Dが3回、Eが1回繰り返し連続しているため、
回数と文字の組に置き換えて以下のように表すことが可能。
ハフマン符号化
圧縮アルゴリズムの一つで、出現率が高いデータに短い符号を与え
出現率が低いデータには長い符号を与えることで効率よく圧縮を行う方法。
JPEGやZIPなどの圧縮方式で用いられる。
ハフマン符号は可変長符号を表す。
例として、次のようなデータがある場合、固定長符号化を行うと以下のように表示される。