Frekvence znaků spotu ADX 27-69
Znak Frekvence
Interpunkce 4,0
Mezera 18,0
Čísla 1,0
A 7,9
B 1,0
C 2,0
D 2,0
E 8,2
F 0,2
G 0,5
H 1,6
I 5,5
J 2,5
K 2,7
L 4,8
M 3,0
N 4,4
O 6,0
P 3,1
Q 0,0
R 2,7
S 4,5
T 4,0
U 2,7
V 2,7
W 0,0
X 0,2
Y 1,4
Z 2,7

Začal jsem číst pojednání od Simona Singha Kniha kódů a šifer. Podle názvu je jasné, že jde o dobrodružnou četbu, v níž do děje zasahují tři nadpřirozené bytosti: steganografie, kryptografie a kryptoalytika.

Připomnělo mi to, že vlastně pořád mám v psacím stole index, a tudíž jsem studentem lingviky. Sice je mi komputační lingvistika poměrně záhadnou múzou, ale nějaké drobné základy už jsem pochytil. V první kapitole jsem měl ohromnou radost, že jsem sám přišel na princip dekompozice monoalfabetické šifry na principu frekvenční analýzy (i když s nulami jsem nepočítal). Ale začíná to být čím dál složitější a zajímavější čtení.

Vzpomněl jsem si, že při jedné výpravě do antikvariátu na Bělehradské jsem se z lovu vrátil se skripty o dějinách matematické a strojové lingvistiky. Těšil jsem se, že tu najdu tabulku frekvence jednotlivých českých znaků, ale ouha. Jen pár příkladů.

Chtěl jsem blognout jednoduše zašifrovaný spot a nedat k němu klíč. Ale chtěl jsem k němu připojit alespoň frekvenční tabulku. No, v nouzi se naučí Dalibor housti. Udělal jsem frekvenční analýzu aspoň minulého svého spotu (zbaveného diakritiky):

Samozřejmě, že předchozí spot je trochu neobvyklý kvůli poznávací značce a ping pongu, ale není úplně krátký (1312 znaků), takže jako výchozí bod pro luštění může docela dobře posloužit. Mimochodem, průměrná délka mého slova je 5,56 znaku, což je skoro český průměr.

 
ZSQMKZKBCGTJMSFAHAEKBKMKHEK
CKHYKKRAFKVQAHGNANTHTVNMCA
PWANPEYBVPGNGQTPSZKFHTCKPCSH
KCSPRSNGTKJKEPAVYHKBHGGRGBGT
IAZKMKJUKARABVJGCHARSJKEJTFH
ABAPRSNGTHGESCKCKNKZACKVTQAM
YPAVMKISBZJKQEYHGJMKUY

Tak co? Víte, co jsem napsal? Není to náhodou něco o vás?

Nápověda

Interpunkci, diakritiku, mezery a čísla jsem odstranil. Každé písmeno původního textu odpovídá vždy jednomu písmenu zašifrovaného textu. A ještě jeden skromný tip: nejčastější znak v zašifrované abecedě neodpovídá nejčastějšímu znaku v mém minulém spotu, ale bude vám to jasné, když si znovu přečtete nadpis…