Пространство имён страницы (page_namespace ) | 0 |
Название страницы (без пространства имён) (page_title ) | 'Частотность' |
Полное название страницы (page_prefixedtitle ) | 'Частотность' |
Старая модель содержимого (old_content_model ) | 'wikitext' |
Новая модель содержимого (new_content_model ) | 'wikitext' |
Вики-текст старой страницы до правки (old_wikitext ) | ''''Частотность''' — термин [[лексикостатистика|лексикостатистики]], предназначенный для определения наиболее употребительных [[слово|слов]]. Расчёт осуществляется по [[формула|формуле]]:
:<math>Freq_x=\frac{Q_x}{Q_{all}},</math>
где Freq<sub>x</sub> — частотность слова «x», Q<sub>x</sub> — количество [[словоупотребление|словоупотреблений]] слова «x», Q<sub>all</sub> — общее количество словоупотреблений. В большинстве случаев частотность выражается в процентах. В [[словарь|словарях]] частотность слов может отражаться [[помета|пометка]]ми — употребительное, малоупотребительное и т. д.
Аналогичным образом определяется частотность для букв. Бо́льшая частотность [[согласный|согласных]] на данном отрезке текста (например, в стихотворениях) получила название [[аллитерация|аллитерации]]. Высокие показатели частотности [[гласный|гласных]] называются [[ассонанс]]ом. Частотный анализ используется в [[криптография|криптографии]] для выявления наиболее частотных букв того или иного языка.
Частотность слов и букв являлась важнейшим инструментов [[криптоанализ]]а в эпоху до повсеместного распространения [[блочный шифр|блочных шифров]].
Не следует путать термины ''частотность'' и ''[[частота]]''.
__NOTOC__
== Частотность букв русского языка ==
Статистика частотности букв русского языка (на материале [[НКРЯ]]):<ref name="dict">О. Н. Ляшевская, С. А. Шаров. [http://dict.ruslang.ru/freq.php?act=show&dic=freq_letters Новый частотный словарь русской лексики]</ref>
{{Врезка | Выравнивание = right | Фон = #eeeeee | Без разрывов = 1
| Заголовок = Частотность букв [[Русский язык|русского языка]]<ref name="dict"/>
|Содержание=
<timeline>
ImageSize = width:400 height:400
PlotArea = top:20 bottom:50 right:20 left:20
AlignBars = late
Colors =
id:pl value:red legend:Гласные_
id:ao value:brightblue legend:Согласные_
id:gs value:yellow legend:Ни_те,_ни_другие
id:ioao value:rgb(0,1,1)
id:grid value:rgb(0.85,0.85,0.85)
id:grid1 value:rgb(0.75,0.75,0.75)
id:canvas value:rgb(0.95,0.95,0.95)
DateFormat = yyyy
Period = from:0 till:11000
TimeAxis = orientation:horizontal
ScaleMinor = unit:year increment:1000 start:0 gridcolor:grid
BackgroundColors = canvas:white
Legend = columns:3 left:50 top:24 columnwidth:90
BarData =
barset:PM
PlotData=
width:8 align:left fontsize:7 shift:(5,-3) anchor:till
barset:PM
from: 0 till: 7998 color:pl text:"а"
from: 0 till: 1592 color:ao text:"б"
from: 0 till: 4533 color:ao text:"в"
from: 0 till: 1687 color:ao text:"г"
from: 0 till: 2977 color:ao text:"д"
from: 0 till: 8483 color:pl text:"е"
from: 0 till: 13 color:pl text:"ё"
from: 0 till: 940 color:ao text:"ж"
from: 0 till: 1641 color:ao text:"з"
from: 0 till: 7367 color:pl text:"и"
from: 0 till: 1208 color:ao text:"й"
from: 0 till: 3486 color:ao text:"к"
from: 0 till: 4343 color:ao text:"л"
from: 0 till: 3203 color:ao text:"м"
from: 0 till: 6700 color:ao text:"н"
from: 0 till: 10983 color:pl text:"о"
from: 0 till: 2804 color:ao text:"п"
from: 0 till: 4746 color:ao text:"р"
from: 0 till: 5473 color:ao text:"с"
from: 0 till: 6318 color:ao text:"т"
from: 0 till: 2615 color:pl text:"у"
from: 0 till: 267 color:ao text:"ф"
from: 0 till: 966 color:ao text:"х"
from: 0 till: 486 color:ao text:"ц"
from: 0 till: 1450 color:ao text:"ч"
from: 0 till: 718 color:ao text:"ш"
from: 0 till: 361 color:ao text:"щ"
from: 0 till: 37 color:gs text:"ъ"
from: 0 till: 1898 color:pl text:"ы"
from: 0 till: 1735 color:gs text:"ь"
from: 0 till: 331 color:pl text:"э"
from: 0 till: 639 color:pl text:"ю"
from: 0 till: 2001 color:pl text:"я"
TextData=
pos:(340,45) textcolor:black fontsize:6
text:0,1
LineData =
at:1000 color:grid1 width:1
at:2000 color:grid1 width:1
at:3000 color:grid1 width:1
at:4000 color:grid1 width:1
at:5000 color:grid1 width:1
at:6000 color:grid1 width:1
at:7000 color:grid1 width:1
at:8000 color:grid1 width:1
at:9000 color:grid1 width:1
at:10000 color:grid1 width:1
</timeline>}}
{|class="standard sortable"
!ранг ||буква ||употреблений ||частотность
|-
|1 ||о ||52295949 ||0,10983
|-
|2 ||е ||40392978 ||0,08483
|-
|3 ||а ||38081816 ||0,07998
|-
|4 ||и ||35075552 ||0,07367
|-
|5 ||н ||31900994 ||0,067
|-
|6 ||т ||30084462 ||0,06318
|-
|7 ||с ||26058590 ||0,05473
|-
|8 ||р ||22595850 ||0,04746
|-
|9 ||в ||21582499 ||0,04533
|-
|10 ||л ||20678280 ||0,04343
|-
|11 ||к ||16599539 ||0,03486
|-
|12 ||м ||15252377 ||0,03203
|-
|13 ||д ||14173134 ||0,02977
|-
|14 ||п ||13349597 ||0,02804
|-
|15 ||у ||12452612 ||0,02615
|-
|16 ||я ||9528713 ||0,02001
|-
|17 ||ы ||9036813 ||0,01898
|-
|18 ||ь ||8263123 ||0,01735
|-
|19 ||г ||8031521 ||0,01687
|-
|20 ||з ||7811723 ||0,01641
|-
|21 ||б ||7579289 ||0,01592
|-
|22 ||ч ||6904749 ||0,0145
|-
|23 ||й ||5753983 ||0,01208
|-
|24 ||х ||4597146 ||0,00966
|-
|25 ||ж ||4476464 ||0,0094
|-
|26 ||ш ||3420179 ||0,00718
|-
|27 ||ю ||3044673 ||0,00639
|-
|28 ||ц ||2314208 ||0,00486
|-
|29 ||щ ||1719607 ||0,00361
|-
|30 ||э ||1573696 ||0,00331
|-
|31 ||ф ||1268926 ||0,00267
|-
|32 ||ъ ||175908 ||0,00037
|-
|33 ||ё ||63623 ||0,00013
|}
== См. также ==
* [[Частотный словарь]]
* [[Анализ текста]]
* [[Математическая лингвистика]]
* [[Статистика запросов]]
* [[wikt:Категория:Приложения:Списки частотности|Списки частотности в Викисловаре]]
== Примечания ==
{{Примечания}}
== Ссылки ==
{{wiktionary|частотность}}
* [http://www.bckelk.ukfsn.org/words/etaoin.html Самые частотные буквы в различных языках] {{ref-en}}
* {{cite web | url = http://postnauka.ru/video/56829 | author = [[Пиперски, Александр Чедович|Пиперски А.]] | title= Частотность в языке | publisher = [[ПостНаука]] | date = 24.12.2015 }}
* [[:en:Most common words in English]] {{ref-en}}
{{ling-stub}}
[[Категория:Корпусная лингвистика]]' |
Вики-текст новой страницы после правки (new_wikitext ) | 'Бомж вася
== Частотность букв русского языка ==
Статистика частотности букв русского языка (на материале [[НКРЯ]]):<ref name="dict">О. Н. Ляшевская, С. А. Шаров. [http://dict.ruslang.ru/freq.php?act=show&dic=freq_letters Новый частотный словарь русской лексики]</ref>
{{Врезка | Выравнивание = right | Фон = #eeeeee | Без разрывов = 1
| Заголовок = Частотность букв [[Русский язык|русского языка]]<ref name="dict"/>
|Содержание=
<timeline>
ImageSize = width:400 height:400
PlotArea = top:20 bottom:50 right:20 left:20
AlignBars = late
Colors =
id:pl value:red legend:Гласные_
id:ao value:brightblue legend:Согласные_
id:gs value:yellow legend:Ни_те,_ни_другие
id:ioao value:rgb(0,1,1)
id:grid value:rgb(0.85,0.85,0.85)
id:grid1 value:rgb(0.75,0.75,0.75)
id:canvas value:rgb(0.95,0.95,0.95)
DateFormat = yyyy
Period = from:0 till:11000
TimeAxis = orientation:horizontal
ScaleMinor = unit:year increment:1000 start:0 gridcolor:grid
BackgroundColors = canvas:white
Legend = columns:3 left:50 top:24 columnwidth:90
BarData =
barset:PM
PlotData=
width:8 align:left fontsize:7 shift:(5,-3) anchor:till
barset:PM
from: 0 till: 7998 color:pl text:"а"
from: 0 till: 1592 color:ao text:"б"
from: 0 till: 4533 color:ao text:"в"
from: 0 till: 1687 color:ao text:"г"
from: 0 till: 2977 color:ao text:"д"
from: 0 till: 8483 color:pl text:"е"
from: 0 till: 13 color:pl text:"ё"
from: 0 till: 940 color:ao text:"ж"
from: 0 till: 1641 color:ao text:"з"
from: 0 till: 7367 color:pl text:"и"
from: 0 till: 1208 color:ao text:"й"
from: 0 till: 3486 color:ao text:"к"
from: 0 till: 4343 color:ao text:"л"
from: 0 till: 3203 color:ao text:"м"
from: 0 till: 6700 color:ao text:"н"
from: 0 till: 10983 color:pl text:"о"
from: 0 till: 2804 color:ao text:"п"
from: 0 till: 4746 color:ao text:"р"
from: 0 till: 5473 color:ao text:"с"
from: 0 till: 6318 color:ao text:"т"
from: 0 till: 2615 color:pl text:"у"
from: 0 till: 267 color:ao text:"ф"
from: 0 till: 966 color:ao text:"х"
from: 0 till: 486 color:ao text:"ц"
from: 0 till: 1450 color:ao text:"ч"
from: 0 till: 718 color:ao text:"ш"
from: 0 till: 361 color:ao text:"щ"
from: 0 till: 37 color:gs text:"ъ"
from: 0 till: 1898 color:pl text:"ы"
from: 0 till: 1735 color:gs text:"ь"
from: 0 till: 331 color:pl text:"э"
from: 0 till: 639 color:pl text:"ю"
from: 0 till: 2001 color:pl text:"я"
TextData=
pos:(340,45) textcolor:black fontsize:6
text:0,1
LineData =
at:1000 color:grid1 width:1
at:2000 color:grid1 width:1
at:3000 color:grid1 width:1
at:4000 color:grid1 width:1
at:5000 color:grid1 width:1
at:6000 color:grid1 width:1
at:7000 color:grid1 width:1
at:8000 color:grid1 width:1
at:9000 color:grid1 width:1
at:10000 color:grid1 width:1
</timeline>}}
{|class="standard sortable"
!ранг ||буква ||употреблений ||частотность
|-
|1 ||о ||52295949 ||0,10983
|-
|2 ||е ||40392978 ||0,08483
|-
|3 ||а ||38081816 ||0,07998
|-
|4 ||и ||35075552 ||0,07367
|-
|5 ||н ||31900994 ||0,067
|-
|6 ||т ||30084462 ||0,06318
|-
|7 ||с ||26058590 ||0,05473
|-
|8 ||р ||22595850 ||0,04746
|-
|9 ||в ||21582499 ||0,04533
|-
|10 ||л ||20678280 ||0,04343
|-
|11 ||к ||16599539 ||0,03486
|-
|12 ||м ||15252377 ||0,03203
|-
|13 ||д ||14173134 ||0,02977
|-
|14 ||п ||13349597 ||0,02804
|-
|15 ||у ||12452612 ||0,02615
|-
|16 ||я ||9528713 ||0,02001
|-
|17 ||ы ||9036813 ||0,01898
|-
|18 ||ь ||8263123 ||0,01735
|-
|19 ||г ||8031521 ||0,01687
|-
|20 ||з ||7811723 ||0,01641
|-
|21 ||б ||7579289 ||0,01592
|-
|22 ||ч ||6904749 ||0,0145
|-
|23 ||й ||5753983 ||0,01208
|-
|24 ||х ||4597146 ||0,00966
|-
|25 ||ж ||4476464 ||0,0094
|-
|26 ||ш ||3420179 ||0,00718
|-
|27 ||ю ||3044673 ||0,00639
|-
|28 ||ц ||2314208 ||0,00486
|-
|29 ||щ ||1719607 ||0,00361
|-
|30 ||э ||1573696 ||0,00331
|-
|31 ||ф ||1268926 ||0,00267
|-
|32 ||ъ ||175908 ||0,00037
|-
|33 ||ё ||63623 ||0,00013
|}
== См. также ==
* [[Частотный словарь]]
* [[Анализ текста]]
* [[Математическая лингвистика]]
* [[Статистика запросов]]
* [[wikt:Категория:Приложения:Списки частотности|Списки частотности в Викисловаре]]
== Примечания ==
{{Примечания}}
== Ссылки ==
{{wiktionary|частотность}}
* [http://www.bckelk.ukfsn.org/words/etaoin.html Самые частотные буквы в различных языках] {{ref-en}}
* {{cite web | url = http://postnauka.ru/video/56829 | author = [[Пиперски, Александр Чедович|Пиперски А.]] | title= Частотность в языке | publisher = [[ПостНаука]] | date = 24.12.2015 }}
* [[:en:Most common words in English]] {{ref-en}}
{{ling-stub}}
[[Категория:Корпусная лингвистика]]' |