Частотность

Материал из Википедии — свободной энциклопедии
Это старая версия этой страницы, сохранённая 178.187.2.216 (обсуждение) в 07:39, 24 января 2013 (Частотность букв русского алфавита). Она может серьёзно отличаться от текущей версии.
Перейти к навигации Перейти к поиску

Частотность — термин лексикостатистики, предназначенный для определения наиболее употребительных слов. Расчёт осуществляется по формуле:

где Freqx — частотность слова «x», Qx — количество словоупотреблений слова «x», Qall — общее количество словоупотреблений. В большинстве случаев частотность выражается в процентах. В словарях частотность слов может отражаться пометами — употребительное, малоупотребительное и т. д.

Аналогичным образом определяется частотность для букв. Бо́льшая частотность согласных на данном отрезке текста (например, в стихотворениях) получила название аллитерации. Высокие показатели частотности гласных называются ассонансом. Частотный анализ используется в криптографии для выявления наиболее частотных букв того или иного языка.

Не следует путать термины частотность и частота.

Частотность букв русского алфавита

Статистика частотности букв русского алфавита (на материале НКРЯ):[1]

ранг буква частота
1 А 11,06%
2 О 8,41%
3 И 7,92%
4 Е 6,83%
5 Н 6,72%
6 Р 6,18%
7 К 5,33%
8 Т 5,00%
9 С 4,45%
10 Л 4,33%
11 В 3,36%
12 П 3,26%
13 Д 3,05%
14 М 2,81%
15 У 2,80%
16 Я 2,13%
17 Б 1,96%
18 Г 1,92%
19 Ь 1,75%
20 Ы 1,74%
21 З 1,71%
22 Й 1,47%
23 Ж 1,12%
24 Ч 1,05%
25 Х 0,89%
26 Ш 0,81%
27 Ё 0,61%
28 Ю 0,38%
29 Ц 0,37%
30 Ф 0,36%
31 Щ 0,19%
32 Э 0,02%
33 Ъ 0,01%

См. также

Примечания

Ссылки

Шаблон:Нет интервики