Huffman bináris fa kódoló gyakorlat a Rozo2 által - OpenClassrooms

Kérdés ? Ne aggódjon, mi segítünk !

A "leghosszabb szó" gyakorlattal és a francia szavak szótárával kapcsolatban (nagyon messze) arra gondoltam, hogy javaslatot tegyek a Huffman-kódolás és egy bináris fa létrehozására.
Utána jöttem rá, hogy ezt a témát a C és a C ++ fórumok érintették, a Pythonban azonban nem. és nem állhatunk ellen a rekurzió használatának örömének

A Huffman kódolás az adatok tömörítésének módja az információk elvesztése nélkül.
A szöveg, a szabványos kódolás (pl. ASCII vagy UTF-8) egy (legalább) vagy több bájtot használ karakterenként. Ezt a kódolást változó hosszúságú kódolással helyettesítjük, ahol a leggyakrabban használt karakterek rövidebben vannak kódolva, mint a legkevésbé használtak (pl. Valós: 'e' = 010 - 3 bitre kódolva, '

"= 1 0101 1011 1001 1101 0111 - 21 biten kódolva!).
Úgynevezett fél-adaptív módban a kódoló táblázatot kiszámítják a forrás fájl. A számítás a fájl karaktereinek megjelenési gyakorisága alapján történik, ezért a kódolás optimális ehhez a fájlhoz.
Az algoritmust a http://fr.wikipedia.org/wiki/Codage_de_huffman (vagy a http://en.wikipedia.org/wiki/Huffman_coding, angolul, de kifejezettebben) leírás ismerteti: főleg bináris fát használ az építkezéshez járni.