跳转到内容

频率 (统计学):修订间差异

维基百科,自由的百科全书
删除的内容 添加的内容
第14行: 第14行:


[[假說檢定]]可以用來評估二個頻率分佈的差異和類似性。評估包括量測[[集中趋势]],像是[[平均数]]及[[中位數]],也會評估[[离散程度]],像是[[標準差]]和[[方差]]。
[[假說檢定]]可以用來評估二個頻率分佈的差異和類似性。評估包括量測[[集中趋势]],像是[[平均数]]及[[中位數]],也會評估[[离散程度]],像是[[標準差]]和[[方差]]。
{{transh}}
A frequency distribution is said to be [[Skewness|skewed]] when its mean and median are significantly different, or more generally when it is [[Symmetric distribution|asymmetric]]. The [[kurtosis]] of a frequency distribution is a measure of the proportion of extreme values (outliers), which appear at either end of the [[histogram]]. If the distribution is more outlier-prone than the [[normal distribution]] it is said to be leptokurtic; if less outlier-prone it is said to be platykurtic.


若頻率分佈的平均和中位數有顯著差異,會稱為頻率分佈具有[[偏度]],另一種說法則是非對稱。頻率分佈的[[峰度]]是量測在頻率分佈兩側的量在總量中的比例。若其分佈比常態分佈要分散,則稱為高狹峰(leptokurtic),反之,則為低狹峰(platykurtic)。
[[Letter frequency]] distributions are also used in [[Frequency analysis (cryptanalysis)|frequency analysis]] to crack [[Cipher|ciphers]], and are used to compare the relative frequencies of letters in different languages and other languages are often used like Greek, Latin, etc.

{{transf}}
[[字母频率]]分佈可以用在[[频率分析]]上,用以破解[[密碼]],也可以用來比較不同語言之間(例如希臘文、拉丁文)的字母相對頻率。


==參考資料==
==參考資料==

2024年6月26日 (三) 11:45的版本

统计学裡,一事件频率,可以表示為,是在實驗中觀測到事件的次數,常表示為,也稱為絕對頻率頻次或是次數[1]:12–19。例如在擲骰子100次的隨機實驗中,有16次擲出6點,則在該實驗中,「擲出6點」事件的頻率為16。

實務上,常會將各事件的頻率用圖表或是表格方式表示。

種類

累計頻率(cumulative frequency)是事件經排序後,在特定點以下之事件的絕對頻率總和。[1]:17–19

某事件的實驗機率英语Empirical probability(也稱為相對頻率),是其絕對頻率除以所有事件總數後的正規化結果:

可以將所有事件的實驗頻率繪出,即為頻率分布(frequency distribution)。

應用

處理和操作以表格化的事件頻率資訊,比處理原始資料會簡單多了。有簡單的演算法可以根據表格計算中位數、平均、標準差等。

假說檢定可以用來評估二個頻率分佈的差異和類似性。評估包括量測集中趋势,像是平均数中位數,也會評估离散程度,像是標準差方差

若頻率分佈的平均和中位數有顯著差異,會稱為頻率分佈具有偏度,另一種說法則是非對稱。頻率分佈的峰度是量測在頻率分佈兩側的量在總量中的比例。若其分佈比常態分佈要分散,則稱為高狹峰(leptokurtic),反之,則為低狹峰(platykurtic)。

字母频率分佈可以用在频率分析上,用以破解密碼,也可以用來比較不同語言之間(例如希臘文、拉丁文)的字母相對頻率。

參考資料

  1. ^ 1.0 1.1 Kenney, J. F.; Keeping, E. S. Mathematics of Statistics, Part 1 3rd. Princeton, NJ: Van Nostrand Reinhold. 1962.