Частотность: различия между версиями

Интерактивная навигация по истории

(Показать все непатрулированные изменения)

[отпатрулированная версия]

[непроверенная версия]

← Предыдущая правка Следующая правка →

Содержимое удалено Содержимое добавлено

ВизуальныйВики-текст

Линейный

Версия от 08:12, 10 сентября 2019

Частотность — термин лексикостатистики, предназначенный для определения наиболее употребительных слов. Расчёт осуществляется по формуле:

Freq_{x}={\frac {Q_{x}}{Q_{all}}},

где Freq_x — частотность слова «x», Q_x — количество словоупотреблений слова «x», Q_all — общее количество словоупотреблений. В большинстве случаев частотность выражается в процентах. В словарях частотность слов может отражаться пометками — употребительное, малоупотребительное и т. д.

Аналогичным образом определяется частотность для букв. Бо́льшая частотность согласных на данном отрезке текста (например, в стихотворениях) получила название аллитерации. Высокие показатели частотности гласных называются ассонансом. Частотный анализ используется в криптографии для выявления наиболее частотных букв того или иного языка.

Частотность слов и букв являлась важнейшим инструментов криптоанализа в эпоху до повсеместного распространения блочных шифров.

Не следует путать термины частотность и частота.

Частотность букв русского языка

Статистика частотности букв русского языка (на материале НКРЯ):^[1]

ранг	буква	употреблений	частотность
1	ф	55414481	10.97%
2	у	42691213	8.45%
3	д	40487008	8.01%
4	о	37153142	7.35%
5	м	33838881	6.70%
6	а	31620970	6.26%
7	н	27627040	5.47%
8	и	23916825	4.73%
9	я	22930719	4.54%
10	л	22230174	4.40%
11	к	17653469	3.49%
12	м	16203060	3.21%
13	д	15052118	2.98%
14	п	14201572	2.81%
15	у	13245712	2.62%
16	я	10139085	2.01%
17	ы	9595941	1.90%
18	ь	8784613	1.74%
19	г	8564640	1.70%
20	з	8329904	1.65%
21	б	8051767	1.59%
22	ч	7300193	1.44%
23	й	6106262	1.21%
24	х	4904176	0.97%
25	ж	4746916	0.94%
26	ш	3678738	0.73%
27	ю	3220715	0.64%
28	ц	2438807	0.48%
29	щ	1822476	0.36%
30	э	1610107	0.32%
31	ф	1335747	0.26%
32	ъ	185452	0.04%
33	ё	184928	0.04%

См. также

Примечания

↑ ¹ ² О. Н. Ляшевская, С. А. Шаров. Новый частотный словарь русской лексики (Дата обращения: 23 апреля 2017)

Ссылки

В Викисловаре есть статья «частотность»

Самые частотные буквы в различных языках (англ.)
Пиперски А. Частотность в языке (неопр.). ПостНаука (24 декабря 2015).
en:Most common words in English (англ.)

[dict-1] ¹ ² О. Н. Ляшевская, С. А. Шаров. Новый частотный словарь русской лексики (Дата обращения: 23 апреля 2017)

[1]

@@ Строка 89: / Строка 89: @@
 !ранг	||буква	||употреблений	||частотность
 |-
-|	1	||	о	||	55414481	||	10.97%
+|	1	||	ф	||	55414481	||	10.97%
 |-
-|	2	||	е	||	42691213	||	8.45%
+|	2	||	у	||	42691213	||	8.45%
 |-
-|	3	||	а	||	40487008	||	8.01%
+|	3	||	д	||	40487008	||	8.01%
 |-
-|	4	||	и	||	37153142	||	7.35%
+|	4	||	о	||	37153142	||	7.35%
 |-
-|	5	||	н	||	33838881	||	6.70%
+|	5	||	м	||	33838881	||	6.70%
 |-
-|	6	||	т	||	31620970	||	6.26%
+|	6	||	а	||	31620970	||	6.26%
 |-
-|	7	||	с	||	27627040	||	5.47%
+|	7	||	н	||	27627040	||	5.47%
 |-
-|	8	||	р	||	23916825	||	4.73%
+|	8	||	и	||	23916825	||	4.73%
 |-
-|	9	||	в	||	22930719	||	4.54%
+|	9	||	я	||	22930719	||	4.54%
 |-
 |	10	||	л	||	22230174	||	4.40%