| Znak | Frekvence |
|---|---|
| Interpunkce | 4,0 |
| Mezera | 18,0 |
| Čísla | 1,0 |
| A | 7,9 |
| B | 1,0 |
| C | 2,0 |
| D | 2,0 |
| E | 8,2 |
| F | 0,2 |
| G | 0,5 |
| H | 1,6 |
| I | 5,5 |
| J | 2,5 |
| K | 2,7 |
| L | 4,8 |
| M | 3,0 |
| N | 4,4 |
| O | 6,0 |
| P | 3,1 |
| Q | 0,0 |
| R | 2,7 |
| S | 4,5 |
| T | 4,0 |
| U | 2,7 |
| V | 2,7 |
| W | 0,0 |
| X | 0,2 |
| Y | 1,4 |
| Z | 2,7 |
Začal jsem číst pojednání od Simona Singha Kniha kódů a šifer. Podle názvu je jasné, že jde o dobrodružnou četbu, v níž do děje zasahují tři nadpřirozené bytosti: steganografie, kryptografie a kryptoalytika.
Připomnělo mi to, že vlastně pořád mám v psacím stole index, a tudíž jsem studentem lingviky. Sice je mi komputační lingvistika poměrně záhadnou múzou, ale nějaké drobné základy už jsem pochytil. V první kapitole jsem měl ohromnou radost, že jsem sám přišel na princip dekompozice monoalfabetické šifry na principu frekvenční analýzy (i když s nulami jsem nepočítal). Ale začíná to být čím dál složitější a zajímavější čtení.
Vzpomněl jsem si, že při jedné výpravě do antikvariátu na Bělehradské jsem se z lovu vrátil se skripty o dějinách matematické a strojové lingvistiky. Těšil jsem se, že tu najdu tabulku frekvence jednotlivých českých znaků, ale ouha. Jen pár příkladů.
Chtěl jsem blognout jednoduše zašifrovaný spot a nedat k němu klíč. Ale chtěl jsem k němu připojit alespoň frekvenční tabulku. No, v nouzi se naučí Dalibor housti. Udělal jsem frekvenční analýzu aspoň minulého svého spotu (zbaveného diakritiky):
Samozřejmě, že předchozí spot je trochu neobvyklý kvůli poznávací značce a ping pongu, ale není úplně krátký (1312 znaků), takže jako výchozí bod pro luštění může docela dobře posloužit. Mimochodem, průměrná délka mého slova je 5,56 znaku, což je skoro český průměr.
ZSQMKZKBCGTJMSFAHAEKBKMKHEK
CKHYKKRAFKVQAHGNANTHTVNMCA
PWANPEYBVPGNGQTPSZKFHTCKPCSH
KCSPRSNGTKJKEPAVYHKBHGGRGBGT
IAZKMKJUKARABVJGCHARSJKEJTFH
ABAPRSNGTHGESCKCKNKZACKVTQAM
YPAVMKISBZJKQEYHGJMKUY
Tak co? Víte, co jsem napsal? Není to náhodou něco o vás?
Interpunkci, diakritiku, mezery a čísla jsem odstranil. Každé písmeno původního textu odpovídá vždy jednomu písmenu zašifrovaného textu. A ještě jeden skromný tip: nejčastější znak v zašifrované abecedě neodpovídá nejčastějšímu znaku v mém minulém spotu, ale bude vám to jasné, když si znovu přečtete nadpis…
3 komentářů for "ZKUKHK, anebo záhada"
na rozlusteni je ten text moc kratkej, jsou tam moc velke shluky znaku, ktere maji stejnou cetnost (to absolutni cislo neni podstatny, dulezity je poradi )
K 53
A 33
G 25
H 25
S 19
C 19
T 19
P 17
M 15
B 15
J 15
N 15
E 13
V 13
Z 11
Y 11
R 11
Q 9
F 7
I 3
U 3
W 1
Překlad, pls.
Nevím, co je tak těžkého. V nadpisu je “ZKUKHK, anebo záhada”. Takže Z = z, K = a, U = h, H = d. Když pak vezmete data od Davida, dojdete ještě k tomu, že A = e, G = o; S, C nebo T = i… Pak můžete zkusit odhadnout nějaké slovo.
Přidej komentář