Частотность: различия между версиями
[непроверенная версия] | [непроверенная версия] |
→Частотность букв русского языка: оформление |
→Частотность букв русского языка: сортировка по алфавиту |
||
Строка 13: | Строка 13: | ||
{|class="standard sortable" |
{|class="standard sortable" |
||
! |
!буква ||ранг ||употреблений || colspan="2" | частотность |
||
|- |
|- |
||
|align=" |
|align="center"|а||align="right"|3||align="right"|40487008||align="right"|{{bartable|8.01|%|40|1.5em|background:red}} |
||
|- |
|- |
||
|align=" |
|align="center"|б||align="right"|21||align="right"|8051767||align="right"|{{bartable|1.59|%|40|1.5em|background:blue}} |
||
|- |
|- |
||
|align=" |
|align="center"|в||align="right"|9||align="right"|22930719||align="right"|{{bartable|4.54|%|40|1.5em|background:blue}} |
||
|- |
|- |
||
|align=" |
|align="center"|г||align="right"|19||align="right"|8564640||align="right"|{{bartable|1.70|%|40|1.5em|background:blue}} |
||
|- |
|- |
||
|align=" |
|align="center"|д||align="right"|13||align="right"|15052118||align="right"|{{bartable|2.98|%|40|1.5em|background:blue}} |
||
|- |
|- |
||
|align=" |
|align="center"|е||align="right"|2||align="right"|42691213||align="right"|{{bartable|8.45|%|40|1.5em|background:red}} |
||
|- |
|- |
||
|align=" |
|align="center"|ё||align="right"|33||align="right"|184928||align="right"|{{bartable|0.04|%|40|1.5em|background:red}} |
||
|- |
|- |
||
|align=" |
|align="center"|ж||align="right"|25||align="right"|4746916||align="right"|{{bartable|0.94|%|40|1.5em|background:blue}} |
||
|- |
|- |
||
|align=" |
|align="center"|з||align="right"|20||align="right"|8329904||align="right"|{{bartable|1.65|%|40|1.5em|background:blue}} |
||
|- |
|- |
||
|align=" |
|align="center"|и||align="right"|4||align="right"|37153142||align="right"|{{bartable|7.35|%|40|1.5em|background:red}} |
||
|- |
|- |
||
|align=" |
|align="center"|й||align="right"|23||align="right"|6106262||align="right"|{{bartable|1.21|%|40|1.5em|background:blue}} |
||
|- |
|- |
||
|align=" |
|align="center"|к||align="right"|11||align="right"|17653469||align="right"|{{bartable|3.49|%|40|1.5em|background:blue}} |
||
|- |
|- |
||
|align=" |
|align="center"|л||align="right"|10||align="right"|22230174||align="right"|{{bartable|4.40|%|40|1.5em|background:blue}} |
||
|- |
|- |
||
|align=" |
|align="center"|м||align="right"|12||align="right"|16203060||align="right"|{{bartable|3.21|%|40|1.5em|background:blue}} |
||
|- |
|- |
||
|align=" |
|align="center"|н||align="right"|5||align="right"|33838881||align="right"|{{bartable|6.70|%|40|1.5em|background:blue}} |
||
|- |
|- |
||
|align=" |
|align="center"|о||align="right"|1||align="right"|55414481||align="right"|{{bartable|10.97|%|40|1.5em|background:red}} |
||
|- |
|- |
||
|align=" |
|align="center"|п||align="right"|14||align="right"|14201572||align="right"|{{bartable|2.81|%|40|1.5em|background:blue}} |
||
|- |
|- |
||
|align=" |
|align="center"|р||align="right"|8||align="right"|23916825||align="right"|{{bartable|4.73|%|40|1.5em|background:blue}} |
||
|- |
|- |
||
|align=" |
|align="center"|с||align="right"|7||align="right"|27627040||align="right"|{{bartable|5.47|%|40|1.5em|background:blue}} |
||
|- |
|- |
||
|align=" |
|align="center"|т||align="right"|6||align="right"|31620970||align="right"|{{bartable|6.26|%|40|1.5em|background:blue}} |
||
|- |
|- |
||
|align=" |
|align="center"|у||align="right"|15||align="right"|13245712||align="right"|{{bartable|2.62|%|40|1.5em|background:red}} |
||
|- |
|- |
||
|align=" |
|align="center"|ф||align="right"|31||align="right"|1335747||align="right"|{{bartable|0.26|%|40|1.5em|background:blue}} |
||
|- |
|- |
||
|align=" |
|align="center"|х||align="right"|24||align="right"|4904176||align="right"|{{bartable|0.97|%|40|1.5em|background:blue}} |
||
|- |
|- |
||
|align=" |
|align="center"|ц||align="right"|28||align="right"|2438807||align="right"|{{bartable|0.48|%|40|1.5em|background:blue}} |
||
|- |
|- |
||
|align=" |
|align="center"|ч||align="right"|22||align="right"|7300193||align="right"|{{bartable|1.44|%|40|1.5em|background:blue}} |
||
|- |
|- |
||
|align=" |
|align="center"|ш||align="right"|26||align="right"|3678738||align="right"|{{bartable|0.73|%|40|1.5em|background:blue}} |
||
|- |
|- |
||
|align=" |
|align="center"|щ||align="right"|29||align="right"|1822476||align="right"|{{bartable|0.36|%|40|1.5em|background:blue}} |
||
|- |
|- |
||
|align=" |
|align="center"|ъ||align="right"|32||align="right"|185452||align="right"|{{bartable|0.04|%|40|1.5em|background:yellow}} |
||
|- |
|- |
||
|align=" |
|align="center"|ы||align="right"|17||align="right"|9595941||align="right"|{{bartable|1.90|%|40|1.5em|background:red}} |
||
|- |
|- |
||
|align=" |
|align="center"|ь||align="right"|18||align="right"|8784613||align="right"|{{bartable|1.74|%|40|1.5em|background:yellow}} |
||
|- |
|- |
||
|align=" |
|align="center"|э||align="right"|30||align="right"|1610107||align="right"|{{bartable|0.32|%|40|1.5em|background:red}} |
||
|- |
|- |
||
|align=" |
|align="center"|ю||align="right"|27||align="right"|3220715||align="right"|{{bartable|0.64|%|40|1.5em|background:red}} |
||
|- |
|- |
||
|align=" |
|align="center"|я||align="right"|16||align="right"|10139085||align="right"|{{bartable|2.01|%|40|1.5em|background:red}} |
||
|} |
|} |
||
Версия от 17:19, 27 августа 2020
Частотность — термин лексикостатистики, предназначенный для определения наиболее употребительных слов. Расчёт осуществляется по формуле:
где Freqx — частотность слова «x», Qx — количество словоупотреблений слова «x», Qall — общее количество словоупотреблений. В большинстве случаев частотность выражается в процентах. В словарях частотность слов может отражаться пометками — употребительное, малоупотребительное и т. д.
Аналогичным образом определяется частотность для букв. Бо́льшая частотность согласных на данном отрезке текста (например, в стихотворениях) получила название аллитерации. Высокие показатели частотности гласных называются ассонансом. Частотный анализ используется в криптографии для выявления наиболее частотных букв того или иного языка.
Частотность слов и букв являлась важнейшим инструментов криптоанализа в эпоху до повсеместного распространения блочных шифров.
Не следует путать термины частотность и частота.
Частотность букв русского языка
Статистика частотности букв русского языка (на материале НКРЯ):[1]
буква | ранг | употреблений | частотность
| |
---|---|---|---|---|
а | 3 | 40487008 | 8,01% | |
б | 21 | 8051767 | 1,59% | |
в | 9 | 22930719 | 4,54% | |
г | 19 | 8564640 | 1,70% | |
д | 13 | 15052118 | 2,98% | |
е | 2 | 42691213 | 8,45% | |
ё | 33 | 184928 | 0,04% | |
ж | 25 | 4746916 | 0,94% | |
з | 20 | 8329904 | 1,65% | |
и | 4 | 37153142 | 7,35% | |
й | 23 | 6106262 | 1,21% | |
к | 11 | 17653469 | 3,49% | |
л | 10 | 22230174 | 4,40% | |
м | 12 | 16203060 | 3,21% | |
н | 5 | 33838881 | 6,70% | |
о | 1 | 55414481 | 10,97% | |
п | 14 | 14201572 | 2,81% | |
р | 8 | 23916825 | 4,73% | |
с | 7 | 27627040 | 5,47% | |
т | 6 | 31620970 | 6,26% | |
у | 15 | 13245712 | 2,62% | |
ф | 31 | 1335747 | 0,26% | |
х | 24 | 4904176 | 0,97% | |
ц | 28 | 2438807 | 0,48% | |
ч | 22 | 7300193 | 1,44% | |
ш | 26 | 3678738 | 0,73% | |
щ | 29 | 1822476 | 0,36% | |
ъ | 32 | 185452 | 0,04% | |
ы | 17 | 9595941 | 1,90% | |
ь | 18 | 8784613 | 1,74% | |
э | 30 | 1610107 | 0,32% | |
ю | 27 | 3220715 | 0,64% | |
я | 16 | 10139085 | 2,01% |
См. также
- Частотный словарь
- Анализ текста
- Математическая лингвистика
- Статистика запросов
- Списки частотности в Викисловаре
Примечания
- ↑ О. Н. Ляшевская, С. А. Шаров. Новый частотный словарь русской лексики (Дата обращения: 23 апреля 2017)
Ссылки
- Самые частотные буквы в различных языках (англ.)
- Пиперски А. Частотность в языке . ПостНаука (24 декабря 2015).
- en:Most common words in English (англ.)
- Letter frequency-simia.net (англ.)
Это заготовка статьи по лингвистике. Помогите Википедии, дополнив её. |