Частотность
Частотность — термин лексикостатистики, предназначенный для определения наиболее употребительных слов. Расчёт осуществляется по формуле:
где Freqx — частотность слова «x», Qx — количество словоупотреблений слова «x», Qall — общее количество словоупотреблений. В большинстве случаев частотность выражается в процентах. В словарях частотность слов может отражаться пометами — употребительное, малоупотребительное и т. д.
Аналогичным образом определяется частотность для букв. Бо́льшая частотность согласных на данном отрезке текста (например, в стихотворениях) получила название аллитерации. Высокие показатели частотности гласных называются ассонансом. Частотный анализ используется в криптографии для выявления наиболее частотных букв того или иного языка.
Не следует путать термины частотность и частота.
Частотность букв русского алфавита
Статистика частотности букв русского алфавита (на материале НКРЯ):[1]
ранг | буква | частота |
---|---|---|
1 | А | 11,06% |
2 | О | 8,41% |
3 | И | 7,92% |
4 | Е | 6,83% |
5 | Н | 6,72% |
6 | Р | 6,18% |
7 | К | 5,33% |
8 | Т | 5,00% |
9 | С | 4,45% |
10 | Л | 4,33% |
11 | В | 3,36% |
12 | П | 3,26% |
13 | Д | 3,05% |
14 | М | 2,81% |
15 | У | 2,80% |
16 | Я | 2,13% |
17 | Б | 1,96% |
18 | Г | 1,92% |
19 | Ь | 1,75% |
20 | Ы | 1,74% |
21 | З | 1,71% |
22 | Й | 1,47% |
23 | Ж | 1,12% |
24 | Ч | 1,05% |
25 | Х | 0,89% |
26 | Ш | 0,81% |
27 | Ё | 0,61% |
28 | Ю | 0,38% |
29 | Ц | 0,37% |
30 | Ф | 0,36% |
31 | Щ | 0,19% |
32 | Э | 0,02% |
33 | Ъ | 0,01% |
См. также
- Частотный словарь
- Списки частотных слов русского языка
- Анализ текста
- Математическая лингвистика
- Статистика запросов
Примечания
- ↑ О. Н. Ляшевская, С. А. Шаров. Новый частотный словарь русской лексики
Ссылки
Это заготовка статьи по лингвистике. Помогите Википедии, дополнив её. |