Обсуждение:Парадокс Симпсона
eto prosto esli vziat alkogol 20% i 80 %
i vdruguiu stornu 30% i 90%
is pervovo nabora moWno poluchit bolee visoki gradus chem s 2-go
glavnoe kakie proporciami vazmiom egzempliari
Имхо более интуитивно понятный пример: 1/1>1/2 1/1000>0/1 но 2/1001<1/3 В статью, наверное, не вставить (типа "орисс") потому хоть сюда. 109.171.33.20 10:57, 12 июня 2011 (UTC)
Качественное (не в смысле "хорошее", а в смысле "без цифр") объяснение примера с мужчинами, женщинами и лекарством (см. статью): По данным можно заметить, что мужчины вообще тяжелее женщин переносят болезнь и реже выздоравливают (хоть давай им лекарство, хоть нет). Также можно посчитать, что среди принимавших лекарство больше мужчин, а среди не принимавших - женщин. То есть в объединенной группе принимавших лекарство выздоровевших меньше, потому что эффект мужчин в ней перевешивает эффект лекарства. 138.48.203.169 16:52, 18 декабря 2015 (UTC)
полный бред
[править код]единица и пятнадцать стосемнадцатых больше чем единица и одинадцать стодвадцатьшестых. Кто вас учил дроби складывать? По-вашему одна вторая плюс одна вторая равно две четвертых?
общий знаменатель
[править код]удалите эту статью. Данный парадокс существует лишь в голове автора. Дроби необходимо приводить к общему знаменателю прежде чем выполнять их сложение.
А действительно ли корректно усреднено?
[править код]В примерах, в статье усреднено соотношение принимавших к непринимавшим по обеим группам. Но сами то выборки не нормированы. То есть у нас есть k = (всего_мужчин_принимавших / всего_мужчин_не_принимавших)/(всего_женщин_принимавших / всего_женщин_не_принимавших) = ((700+800)/(80+130))/((150+70)/(400+280)) ~= 22.078; и дальше мы выравниваем отношение всего_мужчин_принимавших к всего_мужчин_не_принимавших путем домонжения каждого слагаемого из всего_мужчин_не_принимавших на этот самый k. Давайте теперь оценим эффективность лекарства(E) по обеим группам(с учотом коэффециентов выборок): E = (всего_принимавших_выздоровевших / всего_принимавших_не_выздоровевших) / (всего_не_принимавших_выздоровевших / всего_не_принимавших_не_выздоровевших) = {в случае данного усреднения} = ((700+150)/(800+70))/((80*k+400)/(130*k+280)) = 1.42
НО ведь мы могли тем же способом выровнить и отношение всего_женщин_принимавших к всего_женщин_не_принимавших путём домножения каждого из слагаемого в всего_женщин_принимавших на k. тогда E = ((700+150*k)/(800+70*k))/((80+400)/(130+280)) = 1.46. не сходится!
Если же мы всё пронормируем к размеру каждой выборки например 1500, то получим: k_m = 1500 /(700+800); k_w = 1500/(150+70); k_m_not = 1500/(80+130); k_w_not = 1500/(400+280); и дальше E = ((700*k_m+150*k_w)/(800*k_m+70*k_w))/((80*k_m_not+400*k_w_not)/(130*k_m_not+280*k_w_not)) = 1.4345 -- ни одному из предыдущих (между ними). Но однако тут все выборки вносят одинаковый вклад в конечную информацию об эффективности приема по сравнению с отсутствием приема.
В частности, к аругменту о том что предложенный на данный момент в статье способ не валиден: зависимость результатов эффективности лекартсва от того в какой из выборок(М или Ж) мы выравниваем соотношение групп(экспериментальной и контрольной).