归纳推理

归纳法或归纳推理（Inductive reasoning），有时叫做归纳逻辑，是论证的前提支持结论但不确保结论的推理过程。它基于对特殊的代表（token）的有限观察，把性质或关系归结到类型；或基于对反复再现的现象的模式（pattern）的有限观察，公式表达规律。例如，使用归纳法在如下特殊的命题中：

冰是冷的。
弹子球在击打球杆的时候移动。

推断出普遍的命题如：

所有冰都是冷的。
所有弹子球都在击打球杆的时候移动。

例子

强归纳：

所有观察到的乌鸦都是黑的。

所以所有乌鸦都是黑的。

这例示了归纳的本质：从特殊归纳出普遍。结论明显不是确定的。除非我们见过所有的乌鸦 - 我们怎能都知道呢? - 可能还有些罕见的蓝(乌)鸦或是白(乌)鸦。

弱归纳：

我总是把画像挂在钉子上。

所以所有画像都是挂在钉子上的。

在这个例子中，前提建立在确定事物之上： “我总是把画像挂在钉子上”，但是不是所有的人都把画像挂在钉子上，而那些确实使用钉子的人也可能只是有时使用。有很多物体可以用来挂画像，包括但不限于：螺丝钉、螺栓和夹子。我做的结论是过度普遍化，并在某些情况下是错的。

少年们得到了许多超速罚单。

所以所有少年都超速。

在这个例子中，基础前提不是建立在确定事物之上：不是所有我发现超速的少年得到了罚单。这可能在于少年要超速的普遍本质 - 同乌鸦是黑的一样 - 但是前提所基于的更像痴心妄想而不是直接的观察。

有效性

多数人学习的形式逻辑是演绎的而不是归纳的。一些哲学家声称要建立归纳逻辑的系统，但是对归纳的逻辑是否可能是有争议的。相对于演绎推理，归纳推理达成的结论并非必然与最初的假定有相同的确定程度。例如，所有天鹅都是白色的结论明显是错的，但在殖民于澳大利亚之前在欧洲一直被认为是正确的。归纳论证从来就不是有约束力的但它们可以是有说服力的。归纳推理在演绎上是无效的。（在形式逻辑中的论证是有效的，当且仅当论证的前提为真而结论却为假是不可能的。）

在归纳法中，总是有很多结论可以合理的关联于特定前提。归纳是开放的；而演绎是封闭的。

归纳问题的经典哲学处理，意味着为归纳推理找到了正当理由，是苏格兰人大卫·休谟完成的。休谟突出了依据重复经验的模式的我们的日常推理，而不是演绎上的有效论证。比如我们相信面包对我们有益，因为过去一直如此，但是面包将来对我们有害至少是可以想象的。

休谟说对所有事情都坚持可靠的演绎上的正当有理的人会饿死的。替代激进怀疑论关于所有事物的无所作为，他提倡基于常识的实用怀疑论，这里接受归纳法是必然的。

二十世纪的开发者很不同的为归纳问题加了外框。胜过选择对将来做什么预测，它可以被看作是选择适合于观察的概念（参见条目蓝绿色）或适合于观测数据点的曲线图。

归纳法有时被加边框为关于从过去做关于将来的推理，但是在最广泛的意义上它涵盖了在已观察的事物的基础上达成对未观察的事物的结论。从现在的证据推论过去（比如考古）也算做归纳法。归纳法也可以跨越空间而不是时间，比如从在我们的星系得出关于整个宇宙的结论，基于本地经济业绩得出关于国家经济政策的结论。

归纳推理的类型

普遍化: 普遍化或归纳普遍化，是从关于样本的前提到关于总体的结论的过程。

比例为Q的样本有性质A。
结论：比例为Q的全体有性质A。

前提提供给结论的支持依赖于样本群体中的个体数目可比较于全体中的成员的数目，和样本的随机性。草率普遍化和抽样偏差（以偏概全）是与普遍化有关的谬误。

统计三段论: 统计三段论是从一个普遍化到关于一个个体的结论的过程。

比例为Q的总体P有性质A。
个体I是P的成员。
结论：个体I有性质A的概率相当于Q。

在前提1中比例可以是像'3/5'、'所有的'或'一些'这样的词。两个dicto simpliciter谬论可以出现在统计三段论中。它们是"意外"和"反意外"。

简单归纳: 简单归纳是从关于一个样本群体到关于另一个个体的结论的过程。

全体P的比例为Q的已知实例有性质A。
个体I是P的另一个成员。
结论：个体I有性质A的概率相当于Q。

这实际上是普遍化和统计三段论的组合，这里的普遍化的结论也是统计三段论的第一个前提。

类推论证: (归纳的)类推是从已知的在两个事物之间的类似性到关于在这两个事物之间公共的一个额外性质的结论的过程:

事物P类似于事物Q。
事物P有性质A。
结论：事物Q有性质A。

类推依赖于已知共享的性质（类似性）蕴涵A也是共享的性质的推论。前提提供给结论的支持依赖于相干性和在P和Q的类似性。

因果推论（英语：Causal inference）: 因果推论基于效果发生的条件得出关于因果关联的结论。

关于两个事物的相关性的前提可以指示在它们之间的因果联系，但是必须巩固上额外的因素来建立因果联系的精确形式。

预测：预测从过去的样本得出关于将来的个体的结论。

群体G的比例为Q的观测过的成员有性质A。
群体G的下一个观测的成员有性质A的概率相当于Q。

诉诸权威（典据论证）: 引经据典论证基于来源说真命题的比例得出关于一个陈述的真实性的结论。它与推测有相同的形式。

权威A的比例为Q的主张是对的。
权威A的这个主张是对的概率相当于Q。

例子：

来自关于逻辑的网站的所有的评述都是对的。

这个信息来自关于逻辑的网站。

所以，这个信息（可能）是对的。

似真推理

贝叶斯推理

归纳逻辑的候选系统中，最有影响的是贝叶斯主义，它使用概率论作为归纳的框架。贝叶斯定理被用于在给定某些证据时计算你对一个假设的信任的强度应当改变多少。

关于从何得知最初的可信度是有争议的。客观贝叶斯主义者寻求对于假设为正确的概率的客观评估，而因此不能幸免于客观主义的哲学批判。主观贝叶斯主义者坚持表示主观可信度的先验概率，但是贝叶斯定理的反复应用导致了同后验概率的高度一致性。因此它们不能为在冲突的假设间做出选择提供客观标准。可以用这种理论理性的证明对某些假设的相信是正当的，但是要付出拒绝客观主义的代价。比如，不能使用这种方案在冲突的科学范例之间做客观决定。^{[来源请求]}

Edwin Jaynes是率直的物理学家和贝叶斯主义者，他声称'主观'因素在所有推理中都存在（比如为演绎推理选择公理，选择最初的可信度或先验概率，选择可能度），并为来自定性知识的事物指派概率提出一系列的原理。最大熵（不关心原理的推广）和变换群组是他建立的两个结果工具；二者都尝试通过把知识比如条件的对称性转换成对概率分布的明确选择，减轻在特定条件下概率指派的主观性。

贝叶斯主义者感觉有资格称它们的系统为归纳逻辑，由于Cox定理可以从在归纳推理系统上的约束推导出概率。

基本的贝叶斯推理可以作如下理解：

假设 α 为"法官判断案件的正确性"，其值可以是0至1的有理数

α ∈ {0..1} = "Correctness of Judgment",  where
→ < 0.5 代表判斷不正確
→ > 0.5 代表判斷正確
→ = 1 代表判斷完全正確
→ = 0 代表判斷完全錯誤

假设 β¹ 为"法官的安全性"，其值可以是0至1的有理数

β¹ ∈ {0..1} = "Safty of Justice",  where
→ < 0.5 代表不安全
→ > 0.5 代表安全
→ = 1 代表判斷完全安全
→ = 0 代表判斷完全危險

设 A 为 α > 0.75 的事件, B 为 β¹ = 0 的事件

那么"法官在危险状态下判断大致正确"的机会率就是 P(A|B)

Probability of In-danger-fair-correct-judgment of justice
= P(A|B) = P(α > 0.75 | β¹ =0)

使用贝叶斯推理，机会率 P(A|B) 可以以如下方法求解：

 $P(A|B)={\frac {P(B|A)\times P(A)}{P(B)}}$

如果在判决当时，地方局势非常危险，P(B) = P(β¹ = 0) 会大过 0.8

P(B) = 0.8

而根据以往判决，经裁决后，10个案件中有6.5个案件败方认为裁决不公平，而选择上诉

邏輯： 
      案件判決正確 ⇒ 就不會上訴
所以：
      選擇上訴 ⇒ 判決不正確
      P(A) = 0.65

因为地方局势不安全，法官如果判决正确，而身陷险境的机会率超过 30% (主观)

P(B|A) = 0.3

所以 "法官在危险状态下判断大致正确"的机会率就是

Probability of In-danger-fair-correct-judgment of justice
 $=P(A|B)={\frac {0.3\times 0.65}{0.8}}=0.24375$

所以，根据贝纳斯推论，如果地方局势非常危险，法官的裁决只有 24.375% 大致正确。

再想深一层，

设 γ 为案件停留的日子

γ ∈ {1,2,3,...}

再设 C 为案件停留超过18个月的事件 ≈ C = γ > 545 的事件

已知案件通常审判 6个月，较多情况在150日至210日中间，在过往十年1000个C类案件中只有20件

γ ~ Gaussian Distribution with mean=180, variance=30
γ ~ N(180,30)

所以，可以相信，P(C) = P(γ > 545) < 0.005

without loss of generality, we can assume:
  P(C) = 0.005

设 β² 为"地方局势的危险性"，其值可以是0至1的有理数

β² ∈ {0..1} = "Country Safty",  where
→ < 0.5 代表不安全
→ > 0.5 代表安全
→ = 1 代表判斷完全安全
→ = 0 代表判斷完全危險

再设 D 为 β² > 0.8的事件

而以现在的局势来看，失业率维持在3%

可以相信，P(D) > 97%

without loss of generality, we can assume:
  P(D) = 0.97

那么，在地方局势安全的情况下，案件停留超过 545日的机会率是多少呢？

这也可以用贝纳斯推论求解：

 $P(C|D)={\frac {P(D|C)\times P(C)}{P(D)}}$

根据常识统计，我们知道案件停留超过545日又地方局势很危险的情况 20单案件里面有 10件案件

邏輯： 
      案件通常審判 6個月，較多情況在 150日至210日中間
      γ ~ N(180,30)
      裁決正常 ⇒ 案件不會停留超過545日
所以，可以相信：
      P(D|C) = 0.5

所以，

 $=P(C|D)={\frac {0.5\times 0.005}{0.97}}=0.00258$

根据贝纳斯推论，在地方局势安全的情况下，案件停留超过 545日的机会率只有 0.258%

⇒ 所以，如果案件真的停留超过 545日，而失业率维持在3% (代表地方局势安全)，这代表 "裁决无理" Irrational Judgement 的机会率是 93.75%

⇒ 经推论，裁决很大机会是无理 Irrational

⇒ 或者，有可能，你会争议裁决真的不是无理，有40%以上是合理。但根据贝纳斯理论，要 P(C|D) = 0.4，除非"地方局势安全性"在 0.0025/0.4 = 0.00625，失业率高过99%。这是没有可能的，所以根据逆反式，裁决不可能有40%以上是合理。

而贝纳斯的理论中，有一个连环规则(Chain Rule)的

P(T|s,c) = P(s|T) P(T|c)

假设，现在我们想知道 P(A|C,D) = 想知道 P(C|A) P(A|D)

P(A|D) = P(D|A) x P(A) / P(D) = P(D|A) 0.65 / 0.97  
P(C|A) = P(A|C) x P(C) / P(A) = P(A|C) 0.005 / 0.65

P(A|C,D) = P(D|A) x P(A|C) x 0.005 / 0.97

设

 因為根據現實，地方安全基本上和裁決無太大關係，而現在地方大致安全。所以，without loss of generality，可設：
    P(D|A) = 0.9 
 而停留超過 545日而有裁決正確的案件的機會率只是一半一半。所以，without loss of generality，可設：
    P(C|A) = 0.5

所以

 P(A|C,D) = 0.9 x 0.5 x 0.005 / 0.97 = 0.00232

换句话说,

⇒ 在安全的情况下，案件停留超过 545日，而裁判正确的机会率是 0.232% (p-value)

⇒ 几乎是没有可能

实际例子

一件由A和B同时发生才能确立的事件C，明显地你会观察到：事件C成立则B必定发生。但绝对不能贸然将结论误解为"只要B发生则事件C一定发生"（而应该是要由A和B同时发生才能确定C的产生）。而且你也不能擅自扩充成为"只要C事件不发生则事件B一定没有发生"，同样的关键点仍旧是"当A不成立时，C就一定不成立"而B是否成立就不一定也无从得知了。

事实上你只能由现有实验结果推论，尤其是生物体的实验更不易有完美相同条件的控制组，及顾及全方面的对照组，你也无从判定究竟一共要有几个因素加起来才会导致你在观察的结果。更常见的情况是，你因为总是同时观察到了C跟D现象，就因此加以归纳为A+B会导致C+D，或是A+B+D会导致C的结论。在你做更进一步的实验来确认你的假设之前，你都无法排除这些不确定性，更夸张的就是C跟D说不定根本就没有关系，或是更复杂的要有D+E才有A，又要同时有B，才有C这个结果。所以，在科学实验中，演绎法才是比较不容易被质疑的一种判断法，但是也不一定保证这样做出的结论就是对的。

参见

外部链接