A naiv módszer egyenletes kódot használó betűnkénti kódolás. A tömörítendő
szöveget karakterenként, fix hosszúságú bitsorozatokkal kódoljuk.
Működése:
Ha a $\sum$ abc $d$ karaktert tartalmaz, akkor egy-egy karakter $\lceil log_{2}
\space d \rceil$ bittel kódolható. Például, ha az abc $5$ karakterből áll ($A, B, D, K, R$), akkor
$\lceil log_{2} \space 5 \rceil = 3$ bittel kódolható egy karakter. Az, hogy egy-egy karakter milyen
$3$ (jelen esetben $3$) hosszúságú bitsorozatot kap, tetszőlegesen megválasztható. Például, az
előbbi abc-ben lehet $A = 000$, vagy $A = 001$ vagy akár $A = 101$ stb. A lényeg az, hogy egy
karakterhez, egy egyedi bitsorozat tartozzon. Ezek alapján elkészíthető egy kódtáblázat, amelyet a
tömörített fájlnak tartalmaznia kell, ahhoz, hogy dekódolni tudjuk.
Karakter |
Kód |
$A$ |
$000$ |
$B$ |
$001$ |
$D$ |
$010$ |
$K$ |
$011$ |
$R$ |
$100$ |
Ebben a kódtáblában egy-egy karakterhez más kódot is választhattunk volna.
Ha például az $ABRAKADABRA$ szöveget szeretnénk kódolni a fentebb lévő
kódtáblával, akkor a tömörített kód a következő lesz: $000001100000011000010000001100000$.
A tömörített fájlba foglalt kódtáblázat alapján könnyedén $3$ (jelen esetben $3$)
bites szakaszokra bontható és kitömöríthető. A kódtáblázat mérete miatt a gyakorlatban csak hosszabb
szövegeket érdemes így tömöríteni. Viszont előnye, hogy egyszerű a dekódolás a fix hosszúság
bitsorozatok miatt.
Gyakorlati alkalmazása:
A kódtáblázat mérete miatt a gyakorlatban csak hosszabb szövegeket érdemes így
tömöríteni, feltéve, hogy az abc kis méretű, és nem törekszünk (közel) optimális tömörítésre.