Частотность: различия между версиями

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
[непроверенная версия][непроверенная версия]
Содержимое удалено Содержимое добавлено
м откат правок 188.93.26.207 (обс.) к версии InternetArchiveBot
Метки: откат с мобильного устройства из мобильной версии
Строка 17: Строка 17:
== Частотность букв русского языка ==
== Частотность букв русского языка ==
Статистика частотности букв русского языка (на материале [[НКРЯ]]):<ref name="dict">О. Н. Ляшевская, С. А. Шаров. [http://dict.ruslang.ru/freq.php?act=show&dic=freq_letters Новый частотный словарь русской лексики] {{Wayback|url=http://dict.ruslang.ru/freq.php?act=show&dic=freq_letters |date=20210509141100 }}{{проверено|23|4|2017}}</ref>
Статистика частотности букв русского языка (на материале [[НКРЯ]]):<ref name="dict">О. Н. Ляшевская, С. А. Шаров. [http://dict.ruslang.ru/freq.php?act=show&dic=freq_letters Новый частотный словарь русской лексики] {{Wayback|url=http://dict.ruslang.ru/freq.php?act=show&dic=freq_letters |date=20210509141100 }}{{проверено|23|4|2017}}</ref>

{|class="standard sortable"
!буква ||ранг ||употреблений || colspan="2" | частотность

|-
|align="center"|а||align="right"|3|| align="right" |40487008||align="right"|{{bartable|8.01|%|40|1.5em|background:red}}
|-
|align="center"|б||align="right"|21|| align="right" |8051767||align="right"|{{bartable|1.59|%|40|1.5em|background:blue}}
|-
|align="center"|в||align="right"|9||align="right"|22930719||align="right"|{{bartable|4.54|%|40|1.5em|background:blue}}
|-
|align="center"|г||align="right"|19||align="right"|8564640||align="right"|{{bartable|1.70|%|40|1.5em|background:blue}}
|-
|align="center"|д||align="right"|13||align="right"|15052118||align="right"|{{bartable|2.98|%|40|1.5em|background:blue}}
|-
|align="center"|е||align="right"|2||align="right"|42691213||align="right"|{{bartable|8.45|%|40|1.5em|background:red}}
|-
|align="center"|ё||align="right"|33||align="right"|184928||align="right"|{{bartable|0.04|%|40|1.5em|background:red}}
|-
|align="center"|ж||align="right"|25||align="right"|4746916||align="right"|{{bartable|0.94|%|40|1.5em|background:blue}}
|-
|align="center"|з||align="right"|20||align="right"|8329904||align="right"|{{bartable|1.65|%|40|1.5em|background:blue}}
|-
|align="center"|и||align="right"|4||align="right"|37153142||align="right"|{{bartable|7.35|%|40|1.5em|background:red}}
|-
|align="center"|й||align="right"|23||align="right"|6106262||align="right"|{{bartable|1.21|%|40|1.5em|background:blue}}
|-
|align="center"|к||align="right"|11||align="right"|17653469||align="right"|{{bartable|3.49|%|40|1.5em|background:blue}}
|-
|align="center"|л||align="right"|10||align="right"|22230174||align="right"|{{bartable|4.40|%|40|1.5em|background:blue}}
|-
|align="center"|м||align="right"|12||align="right"|16203060||align="right"|{{bartable|3.21|%|40|1.5em|background:blue}}
|-
|align="center"|н||align="right"|5||align="right"|33838881||align="right"|{{bartable|6.70|%|40|1.5em|background:blue}}
|-
|align="center"|о||align="right"|1||align="right"|55414481||align="right"|{{bartable|10.97|%|40|1.5em|background:red}}
|-
|align="center"|п||align="right"|14||align="right"|14201572||align="right"|{{bartable|2.81|%|40|1.5em|background:blue}}
|-
|align="center"|р||align="right"|8||align="right"|23916825||align="right"|{{bartable|4.73|%|40|1.5em|background:blue}}
|-
|align="center"|с||align="right"|7||align="right"|27627040||align="right"|{{bartable|5.47|%|40|1.5em|background:blue}}
|-
|align="center"|т||align="right"|6||align="right"|31620970||align="right"|{{bartable|6.26|%|40|1.5em|background:blue}}
|-
|align="center"|у||align="right"|15||align="right"|13245712||align="right"|{{bartable|2.62|%|40|1.5em|background:red}}
|-
|align="center"|ф||align="right"|31||align="right"|1335747||align="right"|{{bartable|0.26|%|40|1.5em|background:blue}}
|-
|align="center"|х||align="right"|24||align="right"|4904176||align="right"|{{bartable|0.97|%|40|1.5em|background:blue}}
|-
|align="center"|ц||align="right"|28||align="right"|2438807||align="right"|{{bartable|0.48|%|40|1.5em|background:blue}}
|-
|align="center"|ч||align="right"|22||align="right"|7300193||align="right"|{{bartable|1.44|%|40|1.5em|background:blue}}
|-
|align="center"|ш||align="right"|26||align="right"|3678738||align="right"|{{bartable|0.73|%|40|1.5em|background:blue}}
|-
|align="center"|щ||align="right"|29||align="right"|1822476||align="right"|{{bartable|0.36|%|40|1.5em|background:blue}}
|-
|align="center"|ъ||align="right"|32||align="right"|185452||align="right"|{{bartable|0.04|%|40|1.5em|background:yellow}}
|-
|align="center"|ы||align="right"|17||align="right"|9595941||align="right"|{{bartable|1.90|%|40|1.5em|background:red}}
|-
|align="center"|ь||align="right"|18||align="right"|8784613||align="right"|{{bartable|1.74|%|40|1.5em|background:yellow}}
|-
|align="center"|э||align="right"|30||align="right"|1610107||align="right"|{{bartable|0.32|%|40|1.5em|background:red}}
|-
|align="center"|ю||align="right"|27||align="right"|3220715||align="right"|{{bartable|0.64|%|40|1.5em|background:red}}
|-
|align="center"|я||align="right"|16||align="right"|10139085||align="right"|{{bartable|2.01|%|40|1.5em|background:red}}
|}


== См. также ==
== См. также ==

Версия от 07:29, 25 сентября 2024

Частотность (или относительная частотность) — отношение количества экземпляров данного объекта полному количеству экземпляров всех объектов в данном множестве. Иногда количество экземпляров данного объекта называют абсолютной частотностью этого объекта. В лингвистике и лексикостатистике в качестве таких объектов понимаются слова, буквы, словосочетания, в криптографии и информатике - также сочетания букв и просто любые символы. Под множеством может пониматься какой-либо текст, совокупность текстов (корпус) или даже язык.

Расчёт частотности слов осуществляется по формуле:

где — частотность слова ,
— количество употреблений слова ,
— количество употреблений всех слов.

В большинстве случаев частотность выражается в процентах. В словарях частотность слов может отражаться пометками — употребительное, малоупотребительное и т. д.

Аналогичным образом определяется частотность для букв. Бо́льшая частотность согласных на данном отрезке текста (например, в стихотворениях) является одним из признаков аллитерации (наряду с позиционными характеристиками). Высокие показатели частотности гласных в тексте косвенно свидетельствуют об ассонансе. Частотный анализ используется в криптографии для выявления наиболее частотных букв того или иного языка.

Частотность слов и букв являлась важнейшим инструментов криптоанализа в эпоху до повсеместного распространения блочных шифров.

Частотность букв русского языка

Статистика частотности букв русского языка (на материале НКРЯ):[1]

См. также

Примечания

  1. О. Н. Ляшевская, С. А. Шаров. Новый частотный словарь русской лексики Архивная копия от 9 мая 2021 на Wayback Machine (Дата обращения: 23 апреля 2017)

Ссылки