跳转到内容

最小二乘法:修订间差异

维基百科,自由的百科全书
删除的内容 添加的内容
Ben Chg留言 | 贡献
top
标签清空章节
 
(未显示33个用户的43个中间版本)
第1行: 第1行:
{{Refimprove|time=2022-01-19T14:48:47+00:00}}
{{noteTA
{{noteTA
|T=zh-hans:最小二乘法;zh-hk:最小二乘法;zh-tw:最小平方法;
|T=zh-hans:最小二乘法;zh-hk:最小二乘法;zh-tw:最小平方法;
|1=zh-hans:最小二乘法;zh-hk:最小二乘法;zh-tw:最小平方法;
|1=zh-hans:最小二乘法;zh-hk:最小二乘法;zh-tw:最小平方法;
|2=zh-hans:迭代;zh-hant:疊代;
|G1=Math
}}
}}
{{回归侧栏}}
{{回归侧栏}}
[[File:Linear least squares2.png|right|thumb|The result of fitting a set of data points with a quadratic function]]
[[File:Linear least squares2.png|right|thumb|使用二次函数拟合一组数据点的结果]]
'''最小二乘法'''({{lang-en|least squares method}}),又称'''-{zh-hans:最小平方法; zh-hk:最小平方法; zh-tw:最小二乘法}-'''是一种[[数学|數學]][[优化建模|優化建模]]方法。它通过最小化[[误差|誤差]]的平方和數據的最佳[[函数|函數]]匹配。
[[File:X33-ellips-1.svg|thumb|Conic fitting a set of points using least-squares approximation]]
'''最小二乘法'''(又称'''-{zh-hans:最小平方法; zh-hk:最小平方法; zh-tw:最小平方法}-'''是一种[[数学]][[优化]]技术。它通过最小化[[误差]]的平方和数据的最佳[[函数]]匹配。


法的哈飞和大海据使得这些求得的数据与实际数据间误差的平方和最小。
用最小二乘可以簡便求得未知的數據使得求得的數據與實際數據間誤差的平方和最小。


'''最小平方法'''”是對過度確定系統,即其中存在比未知數更多的方程組,以[[迴歸分析]]求得近似解的標準方法。在這整個解決方案中,最小平方法演算為每一方程式的結果中,將殘差平方和的總和最小化。
“最小平方法”是對線性方程組,即方程個數比未知數更多的方程組,以[[迴歸分析]]求得近似解的標準方法。在這整個解決方案中,最小平方法演算為每一方程式的結果中,將殘差平方和的總和最小化。


最重要的應用是在[[曲線擬合]]上。最小平方所涵義的最佳擬合,即[[误差|殘差]](殘差為:觀測值與模型提供的擬合值之間的差距)平方總和的最小化。當問題在自變量(''x''變量)有重大不確定性時,那麼使用簡易迴歸和最小平方法會發生問題;在這種情況下,須另外考慮變量-誤差-擬合模型所需的方法,而不是最小平方法。
最重要的應用是在[[曲線擬合]]上。最小平方所涵義的最佳擬合,即[[误差|殘差]](殘差為:觀測值與模型提供的擬合值之間的差距)平方總和的最小化。當問題在自變量(''x''變量)有重大不確定性時,那麼使用簡易迴歸和最小平方法會發生問題;在這種情況下,須另外考慮變量-誤差-擬合模型所需的方法,而不是最小平方法。


最小平方問題分為兩種:線性或普通的最小平方法,和非線性的最小平方法,取決於在所有未知數中的殘差是否為線性。線性的最小平方問題發生在統計迴歸分析中;它有一個[[解析解|封閉形式]]的解決方案。非線性的問題通常經由迭代細緻化來解決;在每次迭代中,系統由線性近似,因此在這兩種情況下核心演算是相同的。
最小平方問題分為兩種:線性或普通的最小平方法,和[[非线性最小二乘法|非線性的最小平方法]],取決於在所有未知數中的殘差是否為線性。線性的最小平方問題發生在統計迴歸分析中;它有一個[[解析解|封閉形式]]的解決方案。非線性的問題通常經由迭代細緻化來解決;在每次迭代中,系統由線性近似,因此在這兩種情況下核心演算是相同的。


最小平方法所得出的多項式,即以擬合曲線的函數來描述自變量與預計應變量的[[方差|變異數]]關係。
最小平方法所得出的多項式,即以擬合曲線的函數來描述自變量與預計應變量的[[方差|變異數]]關係。


當觀測值來自指數族且滿足輕度條件時,最小平方估計和[[最大似然估]]是相同的。最小平方法也能從[[矩估计|動差法]]得出。
當觀測值來自指數族且滿足輕度條件時,最小平方估計和[[最大似然估]]是相同的。最小平方法也能從[[矩估计|動差法]]得出。


以下討論大多是以線性函數形式來表示,但對於更廣泛的函數族,最小平方法也是有效和實用的。此外,迭代地將局部的二次近似應用於或然性(藉由[[费希尔信息|費雪信息]]),最小平方法可用於擬合[[廣義線性模型]]。
以下討論大多是以線性函數形式來表示,但對於更廣泛的函數族,最小平方法也是有效和實用的。此外,迭代地將局部的二次近似應用於或然性(藉由[[费希尔信息|費雪信息]]),最小平方法可用於擬合[[廣義線性模型]]。

其它依據平方距離的目標加總函數作為逼近函數的主題,請參見最小平方法(函數近似)。


最小平方法通常歸功於[[卡爾·弗里德里希·高斯|高斯]](Carl Friedrich Gauss,1795),但最小平方法是由[[阿德里安-马里·勒让德]](Adrien-Marie Legendre)首先發表的。
最小平方法通常歸功於[[卡爾·弗里德里希·高斯|高斯]](Carl Friedrich Gauss,1795),但最小平方法是由[[阿德里安-马里·勒让德]](Adrien-Marie Legendre)首先發表的。

===歷史背景===
最小平方法發展於[[天文學]]和[[大地测量学|大地測量學]]領域,科學家和數學家嘗試為[[地理大发现|大航海探索時期]]的海洋航行挑戰提供解決方案。準確描述天體的行為是船艦在大海洋上航行的關鍵,水手不能再依靠陸上目標導航作航行。

這個方法是在十八世紀期間一些進步的集大成:
*不同觀測值的組合是真實值的最佳估計;多次觀測會減少誤差而不是增加,也許在1722年由Roger Cotes首先闡明。

*在相同條件下採取的不同觀察結果,與只嘗試記錄一次最精確的觀察結果是對立的。這個方法被稱為平均值方法。托馬斯·馬耶爾(Tobias Mayer)在1750年研究月球的[[天平動]]時,特別使用這種方法,而[[皮埃尔-西蒙·拉普拉斯|拉普拉斯]](Pierre-Simon Laplace)在1788年他的工作成果中以此解釋[[木星]]和[[土星]]的運動差異。

*在不同條件下進行的不同觀測值組合。該方法被稱為最小絕對偏差法,出現在Roger Joseph Boscovich在1757年他對地球形體的著名作品,而拉普拉斯在1799年也表示了同樣的問題。

*評定對誤差達到最小的解決方案標準,拉普拉斯指明了誤差的[[概率]]密度的數學形式,並定義了誤差最小化的估計方法。為此,拉普拉斯使用了一雙邊對稱的指數分佈,現在稱為[[拉普拉斯分布|拉普拉斯分佈]]作為誤差分佈的模型,並將絕對偏差之和作為估計誤差。他認為這是他最簡單的假設,他期待得出算術平均值而成為最佳的估計。可相反地,他的估計是後驗中位數。

=== 最小平方法 ===
[[File:Carl Friedrich Gauss.jpg|200px|thumb|高斯]]

1801年,意大利天文家[[朱普·皮亚齐|朱塞普·皮亞齊]]發現了第一小行星[[谷神星]]。经过40天的追蹤觀測後,由谷神星行至太,使得皮亞齊失去了谷神星的位置。隨後全世界的科家利用皮亞齊觀測數據開找谷神星,但是根大多数人算的结果来找谷神星都有结果。年24的[[卡尔·弗里德里希·高斯|高斯]]也算了谷神星的道。奥地利天文家[[海因里希·奥伯斯]]根高斯算出来的道重新發現了谷神星。

[[高斯]]使用的最小平方法的方法1809年他的著作《天體運動論》中,而法家[[阿德里安-马里·勒让德|勒壤得]]于1806年發現“最小平方法”,但因不世人所知而默默無聞。兩人曾為誰最早立最小平方法原理發生爭執

1829年,[[高斯]]提供了最小平方法的化效果強於其他方法的明,見[[高斯-马尔可夫定理]]。


== 示例 ==
== 示例 ==
[[Image:Linear least squares example2.svg|right|thumb|数据点(红色)、使用最小二乘法求得的最佳解(蓝色)、误差(绿色)。]]
[[Image:Linear least squares example2.svg|right|thumb|数据点(红色)、使用最小二乘法求得的最佳解(蓝色)、误差(绿色)。]]


某次实验得到了四个数据点 <math>(x, y)</math>:<math>(1, 6)</math>、<math>(2, 5)</math>、<math>(3, 7)</math>、<math>(4, 10)</math>(右图中红色的)。我希望找出一个点最匹配的直线 <math>y=\beta_1+\beta_2 x</math>,即找出在某「最佳情况」下能大致符合如下超定线性方程组的 <math>\beta_1</math> 和 <math>\beta_2</math>:
某次實驗得到了四個數據點 <math>(x, y)</math>:<math>(1, 6)</math>、<math>(2, 5)</math>、<math>(3, 7)</math>、<math>(4, 10)</math>(右圖紅色的)。我希望找出一個點最匹配的直 <math>y=\beta_2 x+\beta_1</math>,即找出在某「最佳情况」下能大致符合如下超定性方程组的 <math>\beta_1</math> 和 <math>\beta_2</math>:
:<math>\begin{alignat}{4}
:<math>\begin{alignat}{4}
\beta_1 + 1\beta_2 &&\; = \;&& 6 & \\
\beta_1 + 1\beta_2 &&\; = \;&& 6 & \\
第37行: 第58行:
\end{alignat}</math>
\end{alignat}</math>


最小二乘用的手段量使得等号两边的方最小,也就是找出这个的最小值:
最小平方用的方法量使得等號兩邊差方最小,也就是找出這個的最小值:


: <math>\begin{align}
: <math>\begin{align}
第45行: 第66行:
\end{align}</math>
\end{align}</math>


最小值可以通过对 <math>S(\beta_1, \beta_2)</math> 分别求 <math>\beta_1</math> 和 <math>\beta_2</math> 的[[偏导数]],然使它们零得到。
最小值可以通过对 <math>S(\beta_1, \beta_2)</math> 分别求 <math>\beta_1</math> 和 <math>\beta_2</math> 的[[偏导数|偏導數]],然使他們零得到。


:<math>\frac{\partial S}{\partial \beta_1}=0=8\beta_1 + 20\beta_2 -56</math>
:<math>\frac{\partial S}{\partial \beta_1}=0=8\beta_1 + 20\beta_2 -56</math>
第56行: 第77行:


也就是说直线 <math>y=3.5+1.4x</math> 是最佳的。
也就是说直线 <math>y=3.5+1.4x</math> 是最佳的。

== 简介 ==
===歷史背景===
最小平方法發展於[[天文學]]和[[大地测量学]]領域,科學家和數學家嘗試為[[地理大发现|大航海探索時期]]的海洋航行挑戰提供解決方案。準確描述天體的行為是船艦在大海洋上航行的關鍵,水手不能再依靠陸上目標導航作航行。

這個方法是在十八世紀期間一些進步的集大成:
*不同觀測值的組合是真實值的最佳估計;多次觀測會減少誤差而不是增加,也許在1722年由Roger Cotes首先闡明。

*在相同條件下採取的不同觀察結果,與只嘗試記錄一次最精確的觀察結果是對立的。這個方法被稱為平均值方法。托馬斯·馬耶爾(Tobias Mayer)在1750年研究月球的[[天平動]]時,特別使用這種方法,而[[皮埃尔-西蒙·拉普拉斯|拉普拉斯]](Pierre-Simon Laplace)在1788年他的工作成果中以此解釋[[木星]]和[[土星]]的運動差異。

*在不同條件下進行的不同觀測值組合。該方法被稱為最小絕對偏差法,出現在Roger Joseph Boscovich在1757年他對地球形體的著名作品,而拉普拉斯在1799年也表示了同樣的問題。

*評定對誤差達到最小的解決方案標準,拉普拉斯指明了誤差的[[概率]]密度的數學形式,並定義了誤差最小化的估計方法。為此,拉普拉斯使用了一雙邊對稱的指數分佈,現在稱為[[拉普拉斯分布|拉普拉斯分佈]]作為誤差分佈的模型,並將絕對偏差之和作為估計誤差。他認為這是他最簡單的假設,他期待得出算術平均值而成為最佳的估計。可相反地,他的估計是後驗中位數。

=== 最小平方法 ===
[[File:Carl Friedrich Gauss.jpg|250px|thumb|高斯]]

1801年,意大利天文家[[朱普·皮亚齐]]发现了第一小行星[[谷神星]]。经过40天的跟踪观测后,由谷神星行至太,使得皮亚齐失去了谷神星的位置。随后全世界的科家利用皮亚齐观测数据开找谷神星,但是根大多数人算的结果来找谷神星都有结果。年24的[[卡尔·弗里德里希·高斯|高斯]]也算了谷神星的道。奥地利天文家[[海因里希·奥伯斯]]根高斯算出来的道重新发现了谷神星。

[[高斯]]使用的最小二乘法的方法1809年他的著作《天体运动论》中,而法家[[勒让德]]于1806年发现“最小二乘法”,但因不世人所知而默默无闻。兩人曾为谁最早立最小二乘法原理發生争执

1829年,[[高斯]]提供了最小二乘法的化效果强于其他方法的明,見[[高斯-马尔可夫定理]]。


== 方法 ==
== 方法 ==
第96行: 第95行:
用[[欧几里得度量]]表达为:
用[[欧几里得度量]]表达为:


<math> \min_{ \vec{b} } \| \vec{y}_{m} ( \vec{b} ) - \vec{y} \|_{2} \ .</math>
<math> \min_{ \vec{b} } \| \vec{y}_{m} ( \vec{b} ) - \vec{y} \|^2_{2} \ .</math>

又因为<math> \| \vec{y}_{m} ( \vec{b} ) - \vec{y} \|_{2} </math> ≥0,

所以也可以表示为<math> \min_{ \vec{b} } \| \vec{y}_{m} ( \vec{b} ) - \vec{y} \|_{2} \ .</math>


最小化问题的精度,依赖于所选择的函数模型。
最小化问题的精度,依赖于所选择的函数模型。
第337行: 第340行:
== 参考文献 ==<!--
== 参考文献 ==<!--
=== 引用 ===
=== 引用 ===
{{Reflist}} -->
{{Reflist}}


=== 书籍 ===
=== 来源 === -->
{{ReflistH}}
*{{cite book |author= Wang Guorong
; 书籍
* {{cite book
|author1 = Wang Guorong
|author2= Wei Yimin
|author2= Wei Yimin
|author3= Qiao SanZheng
|author3= Qiao SanZheng
|title= Generalized Inverses:Theory and Computations
|title= Generalized Inverses: Theory and Computations
|url = https://archive.org/details/generalizedinver0000wang
|year= 2004
|year= 2004
|publisher= Science Press
|publisher= Science Press
|location= Beijing
|location= Beijing
|language= en
|language= en
|page = [https://archive.org/details/generalizedinver0000wang/page/6 6]
|pages= 第6页
|chapter= Equation Solving Generalized Inverses
|chapter= Equation Solving Generalized Inverses
|isbn= 7-03-012437-5}}
|isbn = 7-03-012437-5
}}
* {{cite book
|author1 = Mansfield Merriman
|title= "A List of Writings Relating to the Method of Least Squares"
}}


{{ReflistF}}


== 外部链接 ==
== 外部链接 ==
* [http://molecular-service-science.com/2012/06/30/statistical-estimation/ 3種統計學點估計的理論推演:動差法,最小平方法,最大概似估計法]
* [http://molecular-service-science.com/2012/06/30/statistical-estimation/ 3種統計學點估計的理論推演:動差法,最小平方法,最大概似估計法] {{Wayback|url=http://molecular-service-science.com/2012/06/30/statistical-estimation/ |date=20210208061312 }}
* http://www.physics.csbsju.edu/stats/least_squares.html {{Wayback|url=http://www.physics.csbsju.edu/stats/least_squares.html |date=20201208204050 }}
* [http://libai.math.ncu.edu.tw/libai/about.html 中央大學數學系教材-最小平方法]
* https://web.archive.org/web/20200218162523/http://www.zunzun.com/
* http://www.physics.csbsju.edu/stats/least_squares.html
* http://www.orbitals.com/self/least/least.htm {{Wayback|url=http://www.orbitals.com/self/least/least.htm |date=20210101040557 }}
* http://www.zunzun.com
* http://www.orbitals.com/self/least/least.htm
* {{planetmath reference|id=1195|title=最小二乘法}}
* {{planetmath reference|id=1195|title=最小二乘法}}


{{Authority control}}
{{Authority control}}
[[Category:最化|Z]]
[[Category:數學化|Z]]
[[Category:统计学|Z]]
[[Category:统计学|Z]]
[[Category:误差理论|Z]]
[[Category:误差理论|Z]]

2024年3月7日 (四) 15:31的最新版本

使用二次函数拟合一组数据点的结果

最小二乘法(英語:least squares method),又称最小平方法,是一种數學優化建模方法。它通过最小化誤差的平方和尋找數據的最佳函數匹配。

利用最小二乘法可以簡便的求得未知的數據,並使得求得的數據與實際數據之間誤差的平方和為最小。

“最小平方法”是對線性方程組,即方程個數比未知數更多的方程組,以迴歸分析求得近似解的標準方法。在這整個解決方案中,最小平方法演算為每一方程式的結果中,將殘差平方和的總和最小化。

最重要的應用是在曲線擬合上。最小平方所涵義的最佳擬合,即殘差(殘差為:觀測值與模型提供的擬合值之間的差距)平方總和的最小化。當問題在自變量(x變量)有重大不確定性時,那麼使用簡易迴歸和最小平方法會發生問題;在這種情況下,須另外考慮變量-誤差-擬合模型所需的方法,而不是最小平方法。

最小平方問題分為兩種:線性或普通的最小平方法,和非線性的最小平方法,取決於在所有未知數中的殘差是否為線性。線性的最小平方問題發生在統計迴歸分析中;它有一個封閉形式的解決方案。非線性的問題通常經由迭代細緻化來解決;在每次迭代中,系統由線性近似,因此在這兩種情況下核心演算是相同的。

最小平方法所得出的多項式,即以擬合曲線的函數來描述自變量與預計應變量的變異數關係。

當觀測值來自指數族且滿足輕度條件時,最小平方估計和最大似然估計是相同的。最小平方法也能從動差法得出。

以下討論大多是以線性函數形式來表示,但對於更廣泛的函數族,最小平方法也是有效和實用的。此外,迭代地將局部的二次近似應用於或然性(藉由費雪信息),最小平方法可用於擬合廣義線性模型

最小平方法通常歸功於高斯(Carl Friedrich Gauss,1795),但最小平方法是由阿德里安-马里·勒让德(Adrien-Marie Legendre)首先發表的。

歷史背景

[编辑]

最小平方法發展於天文學大地測量學領域,科學家和數學家嘗試為大航海探索時期的海洋航行挑戰提供解決方案。準確描述天體的行為是船艦在大海洋上航行的關鍵,水手不能再依靠陸上目標導航作航行。

這個方法是在十八世紀期間一些進步的集大成:

  • 不同觀測值的組合是真實值的最佳估計;多次觀測會減少誤差而不是增加,也許在1722年由Roger Cotes首先闡明。
  • 在相同條件下採取的不同觀察結果,與只嘗試記錄一次最精確的觀察結果是對立的。這個方法被稱為平均值方法。托馬斯·馬耶爾(Tobias Mayer)在1750年研究月球的天平動時,特別使用這種方法,而拉普拉斯(Pierre-Simon Laplace)在1788年他的工作成果中以此解釋木星土星的運動差異。
  • 在不同條件下進行的不同觀測值組合。該方法被稱為最小絕對偏差法,出現在Roger Joseph Boscovich在1757年他對地球形體的著名作品,而拉普拉斯在1799年也表示了同樣的問題。
  • 評定對誤差達到最小的解決方案標準,拉普拉斯指明了誤差的概率密度的數學形式,並定義了誤差最小化的估計方法。為此,拉普拉斯使用了一雙邊對稱的指數分佈,現在稱為拉普拉斯分佈作為誤差分佈的模型,並將絕對偏差之和作為估計誤差。他認為這是他最簡單的假設,他期待得出算術平均值而成為最佳的估計。可相反地,他的估計是後驗中位數。

最小平方法

[编辑]
高斯

1801年,意大利天文學家朱塞普·皮亞齊發現了第一顆小行星谷神星。经过40天的追蹤觀測後,由於谷神星運行至太陽背後,使得皮亞齊失去了谷神星的位置。隨後全世界的科學家利用皮亞齊的觀測數據開始尋找谷神星,但是根據大多数人計算的结果来尋找谷神星都沒有结果。當年24歲的高斯也計算了谷神星的軌道。奥地利天文學家海因里希·奥伯斯根據高斯計算出来的軌道重新發現了谷神星。

高斯使用的最小平方法的方法發表於1809年他的著作《天體運動論》中,而法國科學家勒壤得于1806年獨立發現“最小平方法”,但因不為世人所知而默默無聞。兩人曾為誰最早創立最小平方法原理發生爭執。

1829年,高斯提供了最小平方法的優化效果強於其他方法的證明,見高斯-马尔可夫定理

示例

[编辑]
数据点(红色)、使用最小二乘法求得的最佳解(蓝色)、误差(绿色)。

某次實驗得到了四個數據點 (右圖紅色的點)。我們希望找出一條和這四個點最匹配的直線 ,即找出在某種「最佳情况」下能夠大致符合如下超定線性方程组的

最小平方法採用的方法是盡量使得等號兩邊差的平方最小,也就是找出這個函數的最小值:

最小值可以通过对 分别求 偏導數,然後使他們等於零得到。

如此就得到了一个只有两个未知数的方程组,很容易就可以解出:

也就是说直线 是最佳的。

方法

[编辑]

人们对由某一变量 或多个变量…… 构成的相关变量感兴趣。如弹簧形变与所用的力相关,一个企业的盈利与其营业额投资收益原始资本有关。为了得到这些变量同之间的关系,便用不相关变量去构建,使用如下函数模型

,

个獨立变量或个係數去拟合。

通常人们将一个可能的、对不相关变量t的构成都无困难的函数类型称作函数模型(如抛物线函数或指数函数)。参数b是为了使所选择的函数模型同观测值y相匹配。(如在测量弹簧形变时,必须将所用的力与弹簧的膨胀系数联系起来)。其目标是合适地选择参数,使函数模型最好的拟合观测值。一般情况下,观测值远多於所选择的参数。

其次的问题是怎样判断不同拟合的质量。高斯勒让德的方法是,假设测量误差的平均值为0。令每一个测量误差对应一个变量并与其它测量误差不相关(随机无关)。人们假设,在测量误差中绝对不含系统误差,它们应该是偶然误差(有固定的變異數),围绕真值波动。除此之外,测量误差符合正态分布,这保证了偏差值在最后的结果y上忽略不计。

确定拟合的标准应该被重视,并小心选择,较大误差的测量值应被赋予较小的。并建立如下规则:被选择的参数,应该使算出的函数曲线与观测值之差的平方和最小。用函数表示为:

欧几里得度量表达为:

又因为 ≥0,

所以也可以表示为

最小化问题的精度,依赖于所选择的函数模型。

线性函数模型

[编辑]

典型的一类函数模型是线性函数模型。最简单的线性式是,写成矩陣式,为

直接给出该式的参数解:

其中,为t值的算术平均值。也可解得如下形式:

简单线性模型 y = b0 + b1t 的例子

[编辑]

随机选定10艘战舰,并分析它们的长度与宽度,寻找它们长度与宽度之间的关系。由下面的描点图可以直观地看出,一艘战舰的长度(t)与宽度(y)基本呈线性关系。散点图如下: 散点图

以下图表列出了各战舰的数据,随后步骤是采用最小二乘法确定两变量间的线性关系。

编号 长度 (m) 宽度 (m) ti - t yi - y
i ti yi ti* yi* ti*yi* ti*ti* yi*yi*
1 208 21.6 40.2 3.19 128.238 1616.04 10.1761
2 152 15.5 -15.8 -2.91 45.978 249.64 8.4681
3 113 10.4 -54.8 -8.01 438.948 3003.04 64.1601
4 227 31.0 59.2 12.59 745.328 3504.64 158.5081
5 137 13.0 -30.8 -5.41 166.628 948.64 29.2681
6 238 32.4 70.2 13.99 982.098 4928.04 195.7201
7 178 19.0 10.2 0.59 6.018 104.04 0.3481
8 104 10.4 -63.8 -8.01 511.038 4070.44 64.1601
9 191 19.0 23.2 0.59 13.688 538.24 0.3481
10 130 11.8 -37.8 -6.61 249.858 1428.84 43.6921
总和(Σ) 1678 184.1 0.0 0.00 3287.820 20391.60 574.8490


仿照上面给出的例子

并得到相应的.

然后确定b1

可以看出,战舰的长度每变化1m,相对应的宽度便要变化16cm。并由下式得到常数项b0

在这里随机理论不加阐述。可以看出点的拟合非常好,长度宽度的相关性大约为96.03%。 利用Matlab得到拟合直线: 最小二乘法Matlab拟合

一般线性情况

[编辑]

若含有更多不相关模型变量,可如组成线性函数的形式

线性方程组

通常人们将tij记作数据矩阵 A,参数bj记做参数向量b,观测值yi记作Y,则线性方程组又可写成:

上述方程运用最小二乘法导出为线性平方差计算的形式为:

最小二乘法的解

[编辑]

的特解为A广义逆矩阵Y的乘积,这同时也是二范数极小的解,其通解为特解加上A零空间。证明如下:

先将Y拆成A的值域及其正交补两部分

所以,可得

故当且仅当解时,即为最小二乘解,即

又因为

的通解为

因为

所以又是二范数极小的最小二乘解。

参考文献

[编辑]
书籍


外部链接

[编辑]