Naiv módszer (Naive method)

A naiv módszer egyenletes kódot használó betűnkénti kódolás. A tömörítendő szöveget karakterenként, fix hosszúságú bitsorozatokkal kódoljuk.

Működése:

Ha a $\sum$ abc $d$ karaktert tartalmaz, akkor egy-egy karakter $\lceil log_{2} \space d \rceil$ bittel kódolható. Például, ha az abc $5$ karakterből áll ($A, B, D, K, R$), akkor $\lceil log_{2} \space 5 \rceil = 3$ bittel kódolható egy karakter. Az, hogy egy-egy karakter milyen $3$ (jelen esetben $3$) hosszúságú bitsorozatot kap, tetszőlegesen megválasztható. Például, az előbbi abc-ben lehet $A = 000$, vagy $A = 001$ vagy akár $A = 101$ stb. A lényeg az, hogy egy karakterhez, egy egyedi bitsorozat tartozzon. Ezek alapján elkészíthető egy kódtáblázat, amelyet a tömörített fájlnak tartalmaznia kell, ahhoz, hogy dekódolni tudjuk.

Karakter	Kód
$A$	$000$
$B$	$001$
$D$	$010$
$K$	$011$
$R$	$100$

Ebben a kódtáblában egy-egy karakterhez más kódot is választhattunk volna.

Ha például az $ABRAKADABRA$ szöveget szeretnénk kódolni a fentebb lévő kódtáblával, akkor a tömörített kód a következő lesz: $000001100000011000010000001100000$.

A tömörített fájlba foglalt kódtáblázat alapján könnyedén $3$ (jelen esetben $3$) bites szakaszokra bontható és kitömöríthető. A kódtáblázat mérete miatt a gyakorlatban csak hosszabb szövegeket érdemes így tömöríteni. Viszont előnye, hogy egyszerű a dekódolás a fix hosszúság bitsorozatok miatt.

Gyakorlati alkalmazása:

A kódtáblázat mérete miatt a gyakorlatban csak hosszabb szövegeket érdemes így tömöríteni, feltéve, hogy az abc kis méretű, és nem törekszünk (közel) optimális tömörítésre.

Animáció

Feladatok

Az alábbi feladatok a gyakorlatokon elvégzendő kötelező, illetve gyakorló feladatok.