Парадокс на Симпсън

Съдържание:

Парадокс на Симпсън
Парадокс на Симпсън

Видео: Парадокс на Симпсън

Видео: Парадокс на Симпсън
Видео: Парадоксът на Симпсън 2023, Септември
Anonim

Навигация за влизане

  • Съдържание за участие
  • библиография
  • Академични инструменти
  • Friends PDF Preview
  • Информация за автора и цитирането
  • Върнете се в началото

Парадокс на Симпсън

Публикувана за първи път от 2 февруари 2004 г. съществена ревизия Пет април 1, 2016

Обмислете следната история:

Етикетът на всеки пакет FIXIT-Y-капсули от (въображаемата) Globalfixit Pharmaceuticals Ltd. носи следната препоръчителна употреба:

Препоръчва се за мъже и жени със състояние Y, но не се препоръчва за хора със състояние Y.

Тъй като финият шрифт на етикета продължава да обяснява:

клиничните изпитвания, използващи FIXIT-Y, показват по-висок процент възстановявания от Y, когато мъжете го приемат в сравнение с мъжете, които са приемали плацебо, и подобно при жените. Но групата, приемаща плацебо в общото население, има по-високи проценти на възстановяване. Можете да се доверите на FIXIT за предоставяне на фармакология, основана на доказателства.

Компанията предлага и FIXIT-Z-капсули. Етикетът върху тях носи съвета, че Z-капсулите се препоръчват за хора, които страдат от Z, но не за мъже и не за жени. Тъй като финият шрифт на етикета продължава да обяснява:

Клиничните изпитвания, използващи FIXIT-Z, показват, че хората, които го приемат, имат по-високи проценти на възстановяване в сравнение с тези, които приемат плацебо. Но и мъжете, и жените, които приемат плацебо, имат по-висок процент на възстановяване в сравнение с мъжете и жените, които приемат FIXIT-Z. Можете да се доверите на FIXIT за предоставяне на фармакология, основана на доказателства.

Въпреки че никоя капсула не може да бъде добра за мъже и жени, но лоша за хората или добра за хората, докато е лоша за мъже и жени, въображаемите данни (вижте по-долу), на които FIXIT основава своите препоръки, показват модели, които са аритметично възможни и се обръщат в действителни набори от данни. Въпреки че няма нищо парадоксално в съществуването на такива данни от гледна точка на аритметиката, те създават проблеми за практическото вземане на решения (например, бихте ли искали да се лекувате с капсулите на Fixit в светлината на докладваните клинични изпитвания?), За използваната евристика в интуитивно разсъждение за вероятностите, за изводи от данни към причинно-следствените отношения и по-общо, за философски програми, които имат за цел да премахнат или да намалят причинно-следствената връзка до закономерности и отношения между вероятностите.

Аритметиката, на която се основават примери като неправилните преценки на FIXIT, е непроблемна. В обобщение той се основава на факта, че

Асоциацията между двойка променливи може последователно да бъде инвертирана във всяка субпопулация на популация, когато популацията е разделена, и обратно, асоциациите във всяка субпопулация могат да бъдат обърнати, когато данните се агрегират.

Наричайте този принцип Обръщане на неравенствата на Симпсън. Непознаването на такива обрати може да доведе до гореспоменатите клопки за това какво да се прави, какво да се вярва, какво да се прави извода и какво причинява. Дори когато действителните и възможни промени се разпознаят, клопки остават. Като положителна бележка, след като се разпознаят възможностите на Обръщанията на Симпсън, те предоставят богат ресурс за изграждане на причинно-следствени модели, които помагат да се обяснят много факти, които в началото изглеждат аномолни. Освен това има тест, наречен „критерий за задните врати“(Pearl 1993), който може да бъде използван за решаване на въпроса дали трябва да се основава на статистическото решение от съвкупното население или от разделените подгрупи.

Раздел 1 предоставя кратка история на Парадокса на Симпсън, изявление и диагноза на аритметичните структури, които го пораждат, и граничните условия за възникването му. Раздел 2 разглежда моделите на невалидни разсъждения, които имат своите източници в Парадокса на Симпсън и възможните начини за противодействие на неговите ефекти. Особено важен случай, в който Парадоксът на Симпсън е бил недействително използван, е разгледан в раздел 3. Налага се аргумент, че парадоксалните данни предоставят противоположни примери на принципа на сигурното нещо в теориите за рационален избор. Защо се появяват такива данни, които дават противоположни примери на принципа Sure Thing, е обяснено, а видът, който правят, се разсейва. Раздел 4 разглежда ролите и последиците от парадоксалните данни за теориите на причинно-следствените изводи и за анализи на причинно-следствените връзки по отношение на вероятностите. Въпреки че заключенията на този раздел са до голяма степен отрицателни, раздел 5 илюстрира как очевидно парадоксалните данни могат да подкрепят причинно-следствените модели за развитието на черти, които в началото изглеждат несъвместими с обстановка, в която естественият подбор е в неизгодно положение от индивидите, които проявяват чертите.

  • 1. Парадоксът на Симпсън: неговата история, диагноза и гранични условия

    • 1.1 История
    • 1.2 Какво е Парадоксът на Симпсън: Диагноза
    • 1.3 Гранични условия за обръщане на Симпсън
  • 2. Обръщане на неравенствата на Симпсън като източници на невалидна причина
  • 3. Предоставят ли парадоксални данни контра-примери на принципа на сигурното нещо?
  • 4. Обръщане на Симпсън на неравенствата, корелациите и причинителя
  • 5. Обръщане на Симпсън на неравенствата в еволюционните настройки
  • библиография
  • Академични инструменти
  • Други интернет ресурси
  • Свързани записи

1. Парадоксът на Симпсън: неговата история, диагноза и гранични условия

1.1 История

В семинарен документ, публикуван през 1951 г., Е. Х. Симпсън обърна внимание на един прост факт за фракциите, който има голямо разнообразие от изненадващи приложения (Simpson 1951). Приложенията произтичат от тесните връзки между пропорции, проценти, вероятности и тяхното представяне като дроби. Докато статистиците в началото на 20-ти век са знаели за проблемите на статистиката, на които Симпсън обърна внимание, именно остроумните му и изненадващи илюстрации към тях ги печелят като парадоксални (срв. Yule 1903). През 1934 г. Морис Коен и Ернст Нагел запознават философите с един аспект на проблемите, породени от парадоксални данни. Те цитират действителната смъртност през 1910 г. от туберкулоза в Ричмънд, Вирджиния и Ню Йорк, Ню Йорк, които потвърждават следните предложения (Cohen & Nagel 1934): [1]

Смъртността на афро-американците е по-ниска в Ричмънд, отколкото в Ню Йорк.

Смъртността при кавказците е по-ниска в Ричмънд, отколкото в Ню Йорк.

Смъртността за общото комбинирано население на афро-американците и кавказците е по-висока в Ричмънд, отколкото в Ню Йорк.

След това те зададоха два въпроса относно данните относно смъртността: „Следва ли това, че туберкулозата е причинила [курсив добавен] по-голяма смъртност в Ричмънд, отколкото в Ню Йорк …“и „… са двете популации, които се сравняват наистина сравним, т.е. хомогенна? " (Cohen & Nagel 1934). След като поставиха въпросите, те го оставиха като упражнение за читателя да им отговори. След публикуването на доклада на Симпсън статистиците започнаха оживен дебат за значението на факти като тези, които са проверени от цитираните таблици Коен и Нагел. Дебатът търсеше ограничения в статистическата практика, които биха избегнали главоблъскания, произтичащи от действителни и възможни парадоксални данни. Този дебат обаче не засегна първия въпрос, поставен от Коен и Нагел относно причинно-следственото заключение. Както отбелязва Джудея Пърл в своето проучване на статистическата литература за парадокса на Симпсън, статистиците изпитваха отвращение да говорят за причинно-следствените връзки и причинно-следствените заключения, които се основаваха на убеждението, че концепцията за причинно-следствената връзка е неподходяща и ненужна за научните методи на изследване и теория строителство (Pearl 2000, 173–181).

Философският интерес към парадокса на Симпсън беше подбуден от използването на Нанси Картрайт в подкрепа на твърденията й, че обжалването на причинно-следствените закони и причинно-следствения капацитет се изисква от научното проучване и от теориите за рационален избор (Cartwright 1979). Тя искаше да покаже, че уповаването на закономерностите и честотите, на които могат да се основават преценките за вероятността, не са достатъчни за представяне на причинно-следствените връзки. По-специално, тестове на научни теории и философски анализи на причинно-следствената връзка и причинно-следственото заключение трябва да дадат отговори на въпроси като тези, поставени от Коен и Нагел: напр. Възможно ли е туберкулозата да е причинила по-голяма смъртност в Ричмънд от Ню Йорк, дори ако степента на смъртност за изглежда, че всяка подгрупа, класифицирана по раса, предполага друго? Ако причинно-следствените отношения проследяват закономерностите,каква система от причинно-следствени отношения може да постигне такива ефекти? След като представите на причинно-следствените връзки, които дават отговори на въпроси като тези, поставени от Коен и Нагел, са под ръка, представителствата се оказват интерпретации, които предоставят причинно-следствени модели за редица интересни и озадачаващи явления. Те включват причинно-следствени модели за еволюцията на алтруизма като стабилна черта в популацията, въпреки че алтруистичните актове са в неизгодно положение за онези, които ги изпълняват, и дават предимство на своите конкуренти. (Виж Sober 1993 и Sober & Wilson 1998, които разработват подробно тези теми в областта на биологията на населението и социобиологията.) Примери за такива модели са формулирани и обсъдени в раздел 5.представянията се оказват интерпретации, които предоставят причинно-следствени модели за редица интересни и озадачаващи явления. Те включват причинно-следствени модели за еволюцията на алтруизма като стабилна черта в популацията, въпреки че алтруистичните актове са в неизгодно положение за онези, които ги изпълняват, и дават предимство на своите конкуренти. (Виж Sober 1993 и Sober & Wilson 1998, които разработват подробно тези теми в областта на биологията на населението и социобиологията.) Примери за такива модели са формулирани и обсъдени в раздел 5.представянията се оказват интерпретации, които предоставят причинно-следствени модели за редица интересни и озадачаващи явления. Те включват причинно-следствени модели за еволюцията на алтруизма като стабилна черта в популацията, въпреки че алтруистичните актове са в неизгодно положение за онези, които ги изпълняват, и дават предимство на своите конкуренти. (Виж Sober 1993 и Sober & Wilson 1998, които разработват подробно тези теми в областта на биологията на населението и социобиологията.) Примери за такива модели са формулирани и обсъдени в раздел 5.и Sober & Wilson 1998, които разработват подробно тези теми в областите на биологията на населението и социобиологията.) Примери за такива модели са формулирани и обсъдени в раздел 5.и Sober & Wilson 1998, които разработват подробно тези теми в областите на биологията на населението и социобиологията.) Примери за такива модели са формулирани и обсъдени в раздел 5.

1.2 Какво е Парадоксът на Симпсън: Диагноза

За някои цели числа може да имаме:

) начало {подреждане} a / b & / lt A / B, \\ c / d & / lt C / D, / текст {и} (a + c) / (b + d) & / gt (A + C) / (B + D). / Край {подравняване})

Наричайте това Обръщане на неравенствата на Симпсън. По-долу е поучителна илюстрация. Аритметичните неравенства, на които се основава, са:

) начало {подреждане} 1/5 & / lt 2/8 \\ 6/8 & / lt 4/5 \\ 7/13 & / gt 6/13. / Край {подравняване})

Следното тълкуване на структурата илюстрира защо тя може да породи недоумение. Примерът е слабо базиран на дело за дискриминация, заведено срещу Калифорнийския университет в Бъркли (виж Bickle et al., 1975).

Да предположим, че университетът се опитва да дискриминира в полза на жените, когато наема персонал. Тя рекламира позиции в катедрата по история и в катедрата по география и само тези катедри. Петима мъже кандидатстват за позициите в История и един е нает, осем жени кандидатстват и две са наети. Коефициентът на успех при мъжете е двадесет процента, а успеваемостта при жените е двадесет и пет процента. Отделът по история предпочита жените пред мъжете. В отдела по география кандидатстват осем мъже и шестима са наети, пет жени кандидатстват и четирима са наети. Степента на успех при мъжете е седемдесет и пет процента, а при жените - осемдесет процента. Отделът по география е предпочитал жените пред мъжете. Въпреки това в целия университет 13 мъже и 13 жени кандидатстваха за работа, а 7 мъже и 6 жени бяха наети. Коефициентът на успех за кандидатите за мъже е по-голям от степента на успеваемост за жените кандидатки.

хора Жени
история 1/5 (LT) 2/8
география 6/8 (LT) 4/5
университет 7/13 (GT) 6/13

Как може да се окаже, че всеки отдел предпочита жените кандидатки, а мъжете като цяло се справят по-добре от жените? Има „пристрастие в извадката“, но не е лесно да се види къде точно възниква това пристрастие. Имаше 13 кандидати за мъже и 13 жени: равни размери на извадката за двете групи. География и история има 13 кандидати: отново равни размери на извадката. Проблемът не се крие и във факта, че пробите са малки: умножете всички числа по 1000 и пъзелът остава. Тогава обръщането на неравенствата става доста стабилно: можете да добавите или извадите доста от всяка от тези хиляди, без да нарушавате обратното на Симпсън.

Ключът към този озадачаващ пример се крие във факта, че повече жени кандидатстват за трудни за получаване работни места. По-трудно е да си проправите път в Историята, отколкото в География. (За да влезеш в География, просто трябва да се родиш; за да влезеш в Историята, трябва да направиш нещо запомнящо се.) От жените, кандидатстващи за работа, повече кандидатстват за работа по история, отколкото за география, а обратното е вярно за мъжете. Историята нае само 3 от 13 кандидати, докато География нае 10 от 13 кандидати. Следователно степента на успех е много по-висока в География, където има повече кандидати за мъже.

1.3 Гранични условия за обръщане на Симпсън

Обръщането на неравенствата на Симпсън се случва за широк диапазон от стойности, които могат да бъдат заменени с (a), (b), (c), (d), (A), (B), (C), (D) в горната схема. Стойностите попадат в широка ивица, която се намира между две крайности:

От една страна, малко повече жени кандидатстват за работа, която е много по-трудна за получаване.

хора Жени
история 1/45 (LT) 5/55
география 50/55 (LT) 45/45
университет 51/100 (GT) 50/100

От друга страна, много повече жени кандидатстват за работа, която е малко по-трудна за получаване.

хора Жени
история 4/5 (LT) 90/95
география 94/95 (LT) 5/5
университет 98/100 (GT) 95/100

Освен това, числителите и знаменателите на дроби, които създават схематичния модел, могат да бъдат умножени равномерно с всяко положително число, без да се нарушават отношенията между дроби. Фракциите, които проявяват тези модели, съответстват на проценти и вероятности. В своята вероятностна форма Колин Блайт предоставя следните гранични условия за обръщане на Симпсън (Blyth 1972). Нека '(P)' представлява функция на вероятността и приемете условните вероятности като съотношения на безусловни вероятности в съответствие с тяхната ортодоксална дефиниция; т.е. четене на "/" в контекста (P (- / mid / ldots)) като "предвид това",

[P (A / mid B) = P (A / amp B) / P (B), / text {при условие, че} P (B) text {е положителен.})

Блайт отбелязва, че от математическа гледна точка, при спазване на условията

) начало {подравняване} P (A / средата B / amp C) & / ge / delta / cdot P (A / mid { sim} B / amp C) / P (A / средата на B / amp { sim} C) & / ge / delta / cdot P (A / mid { sim} B / amp { sim} C) end {align})

с (delta / ge 1) е възможно да има

[P (A / средата B) приблизително 0 / текст {и} P (A / средата { sim} B) приблизително 1 / / делта.)

При предположението, че предложенията за аритметика са необходими, тези възможности са равностойни на условията на съществуване в аритметиката. Схемата:

[Ако е възможно (A) е необходимо, тогава (A)]

е валидно в голямо семейство от модални логики. Граничните условия за обръщане на Симпсън позволяват всяка вероятностна връзка между (A) и (B) да бъде обърната в някакъв допълнителен дял на (B). От гледна точка на аритметиката има дял ({) C, ({ sim}) C (}), в рамките на който асоциациите между (A) и (B) са обърнати. Важно свързано следствие е, че математически винаги е възможно да се предостави някакво условие или фактор (C), който прави (A) вероятностно независим от (B), когато (C) е свързан с (B) като условие на (A) и с ({ sim} B) като условие на (A). Тези аритметични факти нямат емпирично значение сами по себе си. Въпреки това,те имат методологическо значение, доколкото са необходими съществени емпирични предположения за идентифициране на очевидни дялове за извършване на изводи от статистически и вероятностни връзки.

Необходимостта от съществени емпирични предположения възниква в настройки, където има случаи на аритметични възможности, които са маркирани от Reversals на Симпсън в модели на урни и във възможни и действителни емпирични настройки. Например, помислете за модел на урна за нашата история за степента на успех за кандидатите за работа. Моделът се състои от двадесет и шест топки. Всяка топка е обозначена с един от елементите от множествата ({M, { sim} M }, {H, { sim} H }) и ({S, { sim } S }), напр. Дадена топка може да бъде обозначена ([{ sim} M, H, { sim} S]) Да приемем, че етикетите се разпределят, за да съответстват на разпределенията на кандидатите за работа. В опити за изчертаване на топки от урната със замяна, асоциациите между (M) 's, (H)' и (S) в подпопулациите и обратната връзка между (M) и (S) в общото население,са устойчиви. Устойчивите асоциации се дължат само на структурата на модела и нямат никакво причинно значение. За разлика от това, са необходими съществени предположения, за да се правят изводи в други случаи.

Моделите в данните, които попадат в граничните условия за отмяна на неравенствата на Симпсън, могат да създадат проблеми за тестване и оценка на емпирични хипотези, например тестване на ефективността и безопасността на медицинските процедури. Курс на лечение на заболяване, което засяга персонала по история и география, може да бъде свързан с по-ниска смъртност за лекувани в сравнение с нелекувани пациенти в историята и по-ниска смъртност за лекувани в сравнение с нелекувани пациенти в географията; въпреки това курсът на лечение въпреки това може да корелира с по-висока смъртност, когато лекуваните пациенти се сравняват като цяло с нелекуваните пациенти. Обратно, лечението може да бъде свързано с по-високи нива на смъртност при всяка подгрупа, докато то е свързано с по-ниска смъртност в общата популация. В такива случаи далеч не е ясно какво,ако не друго, да заключим от корелациите за ефективността и безопасността на лечението.[2]Освен това, при модели като тези, представени за този пример, различните начини за разделяне на едни и същи данни могат да доведат до различни корелации, които изглежда са несъвместими с корелациите при първоначалния начин на разделяне на данните. Например, при разделение по академична дисциплина пациентите изглежда по-лоши, когато се лекуват, въпреки че може да има положителна зависимост в общата популация между леченията и възстановяванията. Това е в съответствие с положителната връзка между леченията и възстановяванията, когато популацията е разделена по пол. Докато историците и географите всеки път се влошават по отношение на лечението, мъжете и жените от двете катедри могат да се справят по-добре с лечението и тези факти са в съответствие с комбинираното население, което се развива далеч по-добре, или с комбинираното население, което се развива далеч по-лошо.[3]

Посочените по-горе възможности се дължат на факта, че следните формули са колективно последователни. Вземете '(P)' за функция на вероятността. Могат да бъдат предоставени вероятностни модели, които проверяват последователността на множеството, състоящо се от следните формули:

) начало {подравняване} P (A / средата B) & / gt P (A / средата { sim} B) / P (A / средата на B / amp C) & / lt P (A / средата { sim} B / amp C) / P (A / mid B / amp { sim} C) & / lt P (A / mid { sim} B / amp { sim} C) / P (A / средата B / amp D) & / gt P (A / mid { sim} B / amp D) / P (A / mid B / amp { sim} D) & / gt P (A / mid { sim } B / amp { sim} D) / \ край {подравняване})

Подобни неравенства са възможни с обърнати признаци, а равенствата, които представляват вероятностна независимост, са в съответствие с положителните и / или отрицателните асоциации в разделения на популациите. Тези факти не са парадоксални от аритметична гледна точка. Въпреки това, закономерностите, които могат да бъдат представени от тях, не могат да получат причинно-следствена значимост, а вероятностните равенства, достатъчни за вероятностната независимост, не могат да се приемат за представяне на причинно-следствена независимост.

Стандартните статистически методи за тестване на значимостта не предлагат застраховка срещу противоречиви резултати, когато данните са разделени или консолидирани. В обстановка, в която ефективността на ново медицинско лечение се тества, следните данни поддържат отхвърляне на нулевата хипотеза на ниво.05, че лечението (T) няма разлика за възстановяването (R), където алтернатива на нулевата хипотеза е, че лечението е благоприятно за възстановяване. [4]

(R) ({ SIM} R)
(T) 369 340
({ SIM} Т) 152 176

Въпреки това, в този модел, когато популацията е допълнително разделена по пол, обратната препоръка за мъжете и за жените се подкрепя на ниво.05.

(RM) ({ SIM} RM) (R { SIM} М) ({ SIM} R { SIM} М)
(T) 48 152 321 188
({ SIM} Т) 73 145 79 31

Вземете нулевата хипотеза, че няма връзка между леченията и възстановяванията, и алтернативата на нулевата хипотеза, че лечението е по-неблагоприятно за възстановяване, отколкото няма лечение. Отхвърлянето на нулевата хипотеза попада в.05 ниво на значимост както за таблиците (M) - така и за ({ sim} M) - таблиците. Така че, когато се вземат предвид консолидираните данни, лечението е благоприятно, но когато популацията е разделена по пол, не се предпочита лечение както за мъже, така и за жени. Друг дял, например дял по възрастови групи, може да обърне асоциациите в дяловете по пол. Така че лечението може да бъде положително свързано с възстановяванията в общото население, отрицателно корелирано с възстановяванията, когато населението е разделено по пол, т.е.и е в положителна връзка с възстановяванията, когато популацията е разпределена по възраст. Общата граница на условията за отмяна на неравенствата на Симпсън гарантира, че винаги има модели в аритметика, които съдържат данни и подкрепят противоречиви препоръки. Аритметиката мълчи, кои дялове да се вземат за основа за оценка на конфликти между дадени данни от хипотези и начините, по които данните могат да бъдат разделени.

2. Обръщане на неравенствата на Симпсън като източници на невалидна причина

Интуитивното разсъждение за процентите и вероятностните отношения е несъмнено предразположено към злополука. Примерът, който се базираше на иска срещу Беркли, илюстрира как пристрастието към наемане на практики във всеки отдел на университета може да бъде обърнато, когато данните се обединят. Но много хора поне първоначално смятат, че е невъзможно по-висок процент мъже да са успешни в обстановка, при която жените имат по-голям успеваемост във всеки отдел, в който са назначени назначения. Един от начините за разглеждане на недостатъка в интуитивното разсъждение, който възниква от Reversals на Симпсън, е като се отбележи, че представянето на данни от дялове на популация като фракции и употребите, към които се поставят дробовете, когато се обединят данни, за да се получат статистически данни за общото население, не е гарантирано поддържане на връзките между фракциите в преградите. Правилните фракции имат безкрайно много еквивалентни представи. Например 1 / (2 = 2/4 = 4/8 = / ldots). Сега припомнете формата на отношенията между дроби, по отношение на които бяха илюстрирани Обръщанията на Симпсън, т.е.

) начало {подреждане} a / b & / lt A / B, \\ c / d & / lt C / D, / текст {и} (a + c) / (b + d) & / gt (A + C) / (B + D). / Край {подравняване})

Сега, третирайки термини като правилни дроби, можем да имаме (a / b = 2a / 2b), и (A / B = 5A / 5B); (c / d = 3c / 3d) и (C / D = 4C / 4D). Когато обаче тези еквивалентни представи са обединени, получените отношения между дроби често се различават от първоначалните отношения. Например, ((2a + 3c) / (2b + 3d)) може да бъде повече или по-малко от ((a + c) / (b + d)). Следователно е невалидно да се заключи, че отношенията между проценти или съотношения, когато данните се обединяват, ще съответстват на закономерностите, които се показват от множествата, които съдържат дялове на данните. Еквивалентното представяне на съотношенията има различен принос при обединяването на данните.

Един от начините за аритметично противодействие на тази трудност е чрез „нормализиране“на представянията на данни от подгрупи и само обединяване на нормализираните представи на данните. Нормализирането на данните отчита ефектите от изкривяването чрез предоставяне на постоянни знаменатели за фракциите, които представляват данните, и чрез представяне на подгрупите, които се сравняват, сякаш са с еднакви размери в съответните аспекти, по отношение на които се сравняват. Обръщанията на Симпсън обаче показват, че има много начини за разделяне на население, които са в съответствие с асоциациите в общото население. Разделянето по пол може да показва, че както мъжете, така и жените понасят по-лошо състояние при ново лечение, докато дял на една и съща популация според възрастта показва, че пациентите под петдесет, т.е.а пациентите на петдесет и повече години се справят по-добре, като се има предвид новото лечение. Нормализирането на данни от различни начини на разделяне на една и съща популация ще даде несъвместими изводи за асоциациите, които притежават в общото население.

Свързана точка се появява още по-ярко, когато дроби се интерпретират като вероятности. По-горе беше отбелязано, че обратът на Симпсън може да приеме следната вероятностна форма: Възможно е да има

) начало {подравняване} P (A / средата B) & / gt P (A / средата { sim} B), / текст {където} (A / средата на B / amp C) & / lt P (A / mid { sim} B / amp C) text {и} / P (A / mid B / amp { sim} C) & / lt P ({ sim} B / amp { sim} C). / Край {подравняване})

Един от начините за интуитивно разсъждение да се пренебрегне тази възможност е чрез пренебрегване на така наречения закон за пълна вероятност и неговото значение за тази настройка. От изчислението на вероятността имаме следните еквиваленти, които представляват вероятностите като средно претеглени.

) начало {подравняване} P (A / средата B) & = P (A / средата B / amp C) P (B / средата C) + P (A / средата на B / amp { sim} C) P (B / mid { sim} C) / P (A / mid { sim} B) & = P (A / mid { sim} B / amp C) P ({ sim} B / mid C) + P (A / mid { sim} B / amp { sim} C) P ({ sim} B / mid { sim} C) end {align})

Наклонени тежести за (P (B / средата C)), (P (B / средата { sim} C)), (P ({ sim} B / средата C)) и (P ({ sim} B / mid { sim} C)) създават диапазона от възможности, които се маркират от граничните условия за преобръщане на Симпсън. Например, нека

) начало {подравняване} P (A / средата на B) & =.54 / текст {и} / P (A / средата { sim} B) & =.44 / край {подравняване})

И така, (B) е положително свързан с (A). Нека теглата, които се представят при представянето на тези вероятности по отношение на фактор (C), са както следва:

) начало {подравняване} P (B / средата на C) & =.28, \\ P ({ sim} B / средата на C) & =.72, \\ P (B / средата { sim} C) & =.66, / текст {и} / P ({ sim} B / средата { sim} C) & =.34 / край {подравняване})

Като се имат предвид тези коефициенти, (B) ще има положително отношение към (A), но ще има отрицателно значение за (A) във всяка от клетките, предоставени от дяла ({C, { sim }° С}). Т.е., [5]

) начало {подравняване} P (A / средата B / amp C) & =.27, \\ P (A / средата на B / усилвателя { sim} C) & =.33, \\ P (A / средата { sim} B / amp C) & =.64, / text {и} / P (A / mid { sim} B / amp { sim} C) & =.66 / end {align})

Ако интуитивните разузнавачи обикновено пренебрегват ролите, които тежестите играят или не успяват да изиграят в разсъжденията си за вероятността, те са склонни да бъдат объркани, когато Обръщанията на Симпсън се появят в действителни или възможни данни. Нагласата да се игнорира претеглянето в интуитивното разсъждение може да възникне от невежество, навик или като опровержима евристика при разсъждения за вероятностните отношения. Разбира се, е емпиричен въпрос дали подобен надзор е източникът на невалидни разсъждения или дали друга хипотеза обяснява по-добре защо много хора намират Обръщането на Симпсън за невъзможно в началото и защо обръщанията продължават да бъдат изненадващи дори след като източникът им е обяснен. на тях.

3. Предоставят ли парадоксални данни контра-примери на принципа на сигурното нещо?

Така нареченият принцип за сигурно нещо (наричан по-долу STP) е основен за теориите за рационално решение. LJ Savage предоставя следната формулировка на него:

Ако определено бихте предпочели (g) пред (f), или знаейки, че събитието (C) получено, или знаете, че събитието (C) не се е получило, тогава определено предпочитате (g) до (f) (Savage 1954, 21–2).

В теориите за рационален избор, в които предпочитанията са подредени от правилото за максимално увеличаване на очакваната полезност, STP е следствие от факта, че очакваната полезност на дадена опция може да бъде представена като вероятностно претеглена средна стойност на очакваните полезни програми на взаимно изключващи се и колективно изчерпателни начините, по които светът би могъл да бъде предположен, че е избрана опцията. Например, като „EU“представлява функция, която присвоява очакваните комунални услуги, и „P“вероятностна функция, [EU (A) = EU (A / amp B) P (B) + EU (A / amp { sim} B) P ({ sim} B).)

Когато знаете, че (B) е валидно, той се превръща в параметър за очакваната полезност на (A) и по подобен начин, когато знаете, че ({ sim} B) е валиден. Така че, ако очакваната стойност, която е присвоена на (C), е по-малка от (A) при предположението, че знаете, че (B) получава, и подобна на предположението, че (B) не получава, тогава очакваната стойност на (C) е безусловно по-малка от очакваната стойност на (A).

А сега предположим, че в примера за двата отдела се предлагат залози на кандидати, които получават работа. Вашите опции са да заложите на случайно изтегления успешен кандидат за мъже или да заложите на случайно изтегления успешен кандидат да бъде жена. Нека (C) е събитието за кандидатстване за работа в историята, а ({ sim} C) е събитието за кандидатстване за работа по география. (Всеки човек от съответния домейн кандидатства за точно една позиция.) Като се има предвид, че степента на успех при жените е била по-голяма от тази за мъжете в двата отдела, препоръчва ли STP да върнете жените като избор на залагащия? Една от причините (невалидно) може да бъде следната: като се има предвид, че жените имат по-голям шанс за успех в своите приложения, дадени (C) и дадени ({ sim} C),STP препоръчва предпочитание за залози на жени в лотария, в която залагате на пола на успелите кандидати. Разбира се, това би бил лош съвет при настройката на примера, тъй като като цяло процентът на успеваемост при мъжете беше по-голям. Предвид подходящо голям брой залози, умен букмейкър може да бъде гарантиран за красива печалба, ако залагащите подкрепят жени в състезанията за работа. Техният успех беше по-нисък от общия коефициент на успех на техните конкуренти, въпреки че е по-висок във всеки отдел. Техният успех беше по-нисък от общия коефициент на успех на техните конкуренти, въпреки че е по-висок във всеки отдел. Техният успех беше по-нисък от общия коефициент на успех на техните конкуренти, въпреки че е по-висок във всеки отдел.

За да видите какво се е объркало в опита за прилагане на STP в тази настройка, достатъчно е да се отбележи, че се прави случаен теглене от успешни кандидати от сместа, която съдържа мъже и жени, и има повече мъже в сместа. (Спомнете си, че жените кандидатстват в по-голям брой за трудни задачи.) Не е достатъчно за приложимостта на Принципа вероятностите да се подреждат с жени, които имат по-голям шанс за успех във всеки отдел. Принципът се прилага за предпочитания, взети като средно претеглени комунални услуги с вероятности, доставящи тежестите. Представените опции са

  • (1) Случайно изтегленият кандидат е жена.
  • (2) Случайно изтегленият успешен кандидат е мъж.

Трябва да се каже, че избран кандидат е кандидатствал за позиция в История (С) или в География (({ sim}) В) не влияе на вероятностите за успех в сместа. Това е очевидно, когато очакваните полезни програми на опциите са изрично представени като средно претеглени. Използване на 'M' за мъже, '({ sim}) M' за женски, 'S' за успешни и 'C' и '({ sim}) C' по-горе, очакваните помощни програми за вариантите са следните.

) начало {подравняване *} маркер {1} ЕС ({ sim} M / amp S) & = ЕС ({ sim} M / amp S / amp C) P (C / mid S / amp { sim} M) & / quad + EU ({ sim} M / amp S / amp { sim} C) P ({ sim} C / mid S / amp { sim} M) / \ tag {2} EU (M / amp S) & = EU (M / amp S / amp C) P (C / mid S / amp M) & / quad + EU (M / amp S / amp { sim} C) P ({ sim} C / mid S / amp M) end {align *})

Като се имат предвид цифрите, използвани в примера, вероятностните отношения между коефициентите са както следва:

) начало {подравняване} P (C / mid S / amp { sim} M) & / gt P (C / mid S / amp M) текст {и} / P ({ sim} C / mid S / amp { sim} M) & / gt P ({ sim} C / mid S / amp M). / Край {подравняване})

Именно тези връзки са източникът на илюзията, че STP избира Вариант 1. Вероятността жена, кандидат за успех, да кандидатства за позиция в Историята, е по-голяма от тази на нейния конкурент за мъже сред кандидатите в „История“и подобно на жените в География. Ако кандидатите са били сортирани по заявленията им в съответните отдели, където жените имат по-голям успех, а тегленето е направено от произволно избран отдел (с многократни тегления и подмяна, докато не бъде изтеглен успешен кандидат), а не от сместа от успешни кандидати, тогава най-добрият избор би бил за пола с по-високия процент на успех в съответните отдели, т.е. жени. Подобна уредба няма да бъде повлияна от факта, че повече жени кандидатстват за трудни задачи. Но това не е уговорката, която е уговорена за залозите, при които се извършва подбор от обединените успели кандидати. Шансовете за избор на мъж (или жена) от тази смес са независими от отдела, в който са кандидатствали успешните кандидати. Съответно, рационалните залагащи ще намерят STP за неприложим в обстановката, тъй като те няма да имат предпочитанията, които прилагането му изисква, т.е. предпочитание за жени, като се има предвид, че те кандидатстват за работа в History (C), и предпочитание за жени, като се има предвид, че са кандидатствали за работа по география (({ sim} C)). За рационалните залагащи,Шансовете за избор на мъж (или жена) от тази смес са независими от отдела, в който са кандидатствали успешните кандидати. Съответно, рационалните залагащи ще намерят STP за неприложим в обстановката, тъй като те няма да имат предпочитанията, които прилагането му изисква, т.е. предпочитание за жени, като се има предвид, че те кандидатстват за работа в History (C), и предпочитание за жени, като се има предвид, че са кандидатствали за работа по география (({ sim} C)). За рационалните залагащи,Шансовете за избор на мъж (или жена) от тази смес са независими от отдела, в който са кандидатствали успешните кандидати. Съответно, рационалните залагащи ще намерят STP за неприложим в обстановката, тъй като те няма да имат предпочитанията, които прилагането му изисква, т.е. предпочитание за жени, като се има предвид, че те кандидатстват за работа в History (C), и предпочитание за жени, като се има предвид, че са кандидатствали за работа по география (({ sim} C)). За рационалните залагащи,За рационалните залагащи,За рационалните залагащи,) начало {подреждане} EU ({ sim} M / amp S) & = EU ({ sim} M / amp S / amp C) & = EU ({ sim} M / amp S / amp { sim} В), / край {подравняване})

и подобно на (M) 's, докато на фигурите, дадени в примера, [EU ({ sim} M / amp S) lt EU (M / amp S).)

Въпреки че обръщанията на Симпсън не подкрепят решения, които са в противоречие с принципа на сигурната вещ, те създават проблеми с практическо значение, когато трябва да се вземат решения за това какво да се прави. Трябва ли асоциациите в общото население на хората да ръководят вземането на решения в опит като този, проведен от Fixit? Или асоциациите в подпопулациите на мъже и жени трябва да ръководят решения дали да се приемат лекарствата? Спомнете си, че различен дял от общото население, например по възраст, може да проявява асоциации като тези в общото население и обратната страна на тези в дяла въз основа на пол. Няма априорни методи, които дават отговор на въпросите дали асоциациите в обобщените данни или асоциациите в дялове на обобщени данни,са добри основи за извод от причини до последици или за вземане на решения какво да се прави. Условните хипотези за логическата и причинно-следствената структура на конкретни практически проблеми най-добре служат като ръководство за вземане на решения. Като се има предвид подходящата основна информация, връзките между, напр. Лечения и възстановявания в общото население, могат да бъдат указаната основа за вземане на решения за лечение. Като се има предвид различна основна информация, връзките между леченията и възстановяванията в забележима част от населението могат да бъдат идентифицирани, за разлика от асоциациите в общото население. При липсата на някои условни предположения за логически и причинно-следствени структури в определени случаи, обикновените асоциации не са полезни при вземането на решение какво да се прави. Така че, макар че обръщанията на Симпсън не са парадоксални от логическа гледна точка,те сочат конфликтни асоциации, които стават истински парадоксални, ако всички имат причинно значение.

4. Обръщане на Симпсън на неравенствата, корелациите и причинителя

Често срещано е, че корелациите между променливите не водят до това, че те стоят в причинно-следствените отношения. Докато някои корелации са чисто случайни, други могат да бъдат законни, дори когато не се установява причинно-следствена връзка между корелираните променливи - например, връзката между падащи барометри и дъжд е законна, тъй като те са съвместни ефекти от обща причина, т.е. падащо въздушно налягане. Контролираните експерименти се стремят да разкрият корелации, които са просто случайни. Какво тогава на стабилните корелации между променливи, които не взаимодействат причинно? Ханс Райхенбах предложи, че стабилната корелация между променливите е фалшива [акауза], когато има фактор, който "изключва" корелацията и служи като обща причина за свързаните променливи (Reichenbach 1971, Ch. 4). Кажете, че (A) се свързва с B, ако и само ако те не са вероятностно независими, т.е. (P (A / средата B) ne P (A)). Райхенбах предложи подобна асоциация да е фалшива, при условие че има фактор (C) такъв, че (P (A / средата B / amp C) = P (A / средата C)).

Обръщане на неравенствата на Симпсън илюстрира, че от аритметична гледна точка, винаги има фактор или предложение (C), които „скрийн“всяка корелация. Наличието на такъв фактор не може да бъде достатъчно, за да може корелацията да бъде фалшива. Например, да предположим, че вероятността на зададения (A) (B) е по-голяма, отколкото без (B). Следващата диаграма илюстрира тази възможност с вероятности, съответстващи на пропорционалните размери на затворените пространства с всички (A), представени от затворения правоъгълник, който се пресича от деленето на линия (B) от ({ sim} B).

липсващ текст, моля информирайте
липсващ текст, моля информирайте

Фигура 1. (P (A / средата B) gt P (A / средата { sim} B))

Граничните условия за обръщане на Симпсън гарантират, че има (C), която пресича равни части от (A / amp B) и (A / amp { sim} B). В раздел 1 беше отбелязано, че аритметичните възможности са равностойни на условията за съществуване на аритметични факти. При условие, че извадковото пространство може да бъде разпределено достатъчно фино, вероятностната релевантност между (A) и (B) може да бъде "измита" от някакъв произволен фактор (C), в рамките на който вероятностите на (A / усилватели B) и (A / amp { sim} B) са равни. Следващата схема илюстрира тази аритметична възможност:

липсващ текст, моля информирайте
липсващ текст, моля информирайте

Фигура 2. (P (A / средата B / amp C) = P (A / mid { sim} B / amp C))

където (C) е представен от паралелограма, който се разделя от границата между (B) и ({ sim} B) и съдържа равни части от (A / amp B) и (A / amp { sim} B). (C) е произволно предложение или фактор. Тъй като затворените пространства съответстват на вероятностите, (P (A / mid B / amp C) = P (A / mid { sim} B / amp C)). И така, (C) 'екрани изключени' (A) от (B); обаче съществуването му очевидно е недостатъчно, за да покаже, че корелацията между (A) и (B) е фалшива. Докато „изключването на скрининга“може да осигури необходимо условие за показване, че корелацията между променливи се дължи на обща причина, това необходимо условие е гарантирано, че е изпълнено от основната аритметика на вероятното смятане. Трябва да се осигурят допълнителни съществени условия над и вероятностните отношения между (A), (B),и (C), за да се идентифицира (C) като обща причина за (A) и (B).

Изводът, че правно корелираните променливи са причинно независими една от друга, ако корелацията се дължи на обща причина, е специален случай на по-общ изглед, който причинява увеличаване на шансовете за тяхното въздействие. [6] Когато има обща причина (C) на корелация между променливи (B) и (A), (B) не причинява (A); повишаването на шансовете на (A) се дължи на (C), и докато (B) може да е симптом на (A), това е така по силата на отделен ефект от (C), която предхожда (A). Следващата диаграма илюстрира тези взаимоотношения. (Стрелките представляват посоките на причинно-следствените връзки.)

липсващ текст, моля информирайте
липсващ текст, моля информирайте

Фигура 3. (B) предхожда (A) и (C) е често срещана причина за (B) и (A)

Предвид (C), (B) не повишава шансовете на (A). Основната идея на анализите на причинно-следствената връзка по отношение на увеличаването на шансовете е, че причините насърчават техните ефекти. В детерминираните настройки шансовете приемат само крайни стойности и причините не „повишават“шансовете за настъпване на ефекта, освен в изроден смисъл, че те повишават шансовете за техните ефекти от нула без тях до едно с тях (с изключение на случаите на детерминистично предетерминиране). Все пак е условен въпрос дали светът, който обитаваме, е детерминиран или недетерминиран и понятията за причинно-следствената връзка трябва да съобразяват последната възможност, както и първата. Тогава представянията на детерминистичната причинно-следствена връзка могат да се разглеждат като специален случай на вероятностна причинно-следствена връзка, в който причините са достатъчни и необходими за тяхното въздействие.

С оглед на Reversals of Inequalities на Симпсън, вероятностните отношения между променливите ще варират значително в различните дялове на популации или пространства на състоянието. Този факт относно вероятностните отношения осигурява безценен ресурс за представяне в вероятностно отношение на сложните отношения, които имат между мрежите от причини и техните последици. Причините не само могат да насърчават ефектите, но могат да насърчават отсъствието или да инхибират ефекти, които могат да се появят при тяхното отсъствие. Например, редовните упражнения инхибират или намаляват шансовете за сърдечно-съдови нарушения. Съответно, каквото и да насърчава редовното физическо натоварване, също така насърчава сърдечно-съдовото здраве, дори ако също така насърчава сърдечно-съдови заболявания. Cartwright дава следния пример. Тютюнопушенето причинява сърдечни заболявания,но това също може да накара пушачите да поемат упражнения в по-голям брой от непушачите. В този случай тютюнопушенето може косвено да причини сърдечно-съдово здраве, като същевременно пряко причинява заболяване. Със знаци плюс и минус, показващи дали дадена причина насърчава или инхибира ефект, следващата диаграма представлява причинно-следствена настройка, при която тютюнопушенето може да насърчи сърдечно-съдовото здраве, като същевременно пряко насърчава заболяването.

липсващ текст, моля информирайте
липсващ текст, моля информирайте

Фигура 4.

Например, ако тютюнопушенето увеличава шансовете за сърдечни заболявания с 25%, но също така увеличава шансовете за редовно физическо натоварване с 40%, докато упражнението намалява шансовете за заболяване с 70%, пушачите ще балансират ползите от навика си по отношение на сърдечно-съдовото здраве. В тази настройка може да има обръщане на Симпсън, при което пушачите, които тренират по-лошо от непушачите, които спортуват, и подобно на пушачите, които не спортуват в сравнение с непушачите, докато степента на заболяване на пушачите като цяло е по-ниска. Нетният причинно-следствен ефект на тютюнопушенето върху здравето е положителен в примера поради приноса на трета променлива, упражняваща, това е ефект от тютюнопушенето. Причинно-следствените приноси на други променливи са източниците на Reversals на Симпсън в други причинно-следствени настройки, при които ефектите на преките причинно-следствени връзки се променят от приносите на допълнителните променливи. Те включват случаи, когато директните ефекти се обезсилват чрез инхибиращи ефекти на придружаващ фактор, например вещества, които са отделно отровни, кисели и алкални, могат да взаимодействат, без да имат вредно въздействие, когато се приемат заедно. Всяка действа като антидот за другия.[7] По-нататъшните заплитания включват случаи, когато причината, която стимулира ефект, е придружена от инхибираща причина за ефекта и те са едновременно последици от обща причина. Например,

липсващ текст, моля информирайте
липсващ текст, моля информирайте

Фигура 5. Шансът на (E) е необезпокояван от (CC), често срещана причина.

Тълкуване на тази диаграма: тромбозата може да бъде ефект от бременността и може да бъде и ефект на някои от съставките на противозачатъчните хапчета. Както бременността, така и хапчетата увеличават шансовете за тромбоза. Въпреки това хапчетата намаляват шансовете за бременност и нетният ефект върху популациите от жени, които приемат хапчетата, не може да покаже промяна в честотата на тромбозата. Примери като тези, които са нанесени на платното, показват, че нито е необходимо, нито достатъчно за причинно-следствената връзка между две променливи, които едната повишава шансовете на другата. Cartwright (2001, 271) поставя въпроса по следния начин: „Причините могат да увеличат вероятността от тяхното въздействие; но няма нужда. И за обратното: увеличаване на вероятността може да се дължи на причинно-следствена връзка; но много други неща също могат да бъдат отговорни."

Дали наблюдението на Картрайт е причина за песимизъм относно програмата за анализ на причинно-следствената връзка и причинно-следствената значимост във вероятностен план? Не е задължително. Той поставя проблем относно причинно-следствените заплитания, които не се проследяват от вероятностни отношения и вероятностни заплитания, които не се дължат на причинно-следствените отношения. Програмата за предоставяне на вероятностни представи за причинно-следствените отношения трябва да осигури условия, които разединяват причинно-следствените мрежи. Изисква се начин за локализиране на правилните дялове на популации, където правилните са тези, чиито вероятностни връзки проследяват причинно-следствените връзки, като поддържат съответните фонови фактори. В литературата са представени редица различни предложения за вероятностната причинно-следствена връзка, които имат за цел да осигурят критерии за локализиране на правилните дялове на данни с цел идентифициране на причинно-следствените връзки.

Предложенията попадат в две широки категории: (1) Редукционни предложения: те не се харесват на причинно-следствените понятия и имат за цел да осигурят филтър за корелациите, които идентифицират кои корелации са фалшиви. Корелациите, които не са фалшиви, имат за цел да съответстват на интуициите за причинно-следствените отношения и да изпълняват ролите, които интуитивно се приписват на причинно-следствените отношения. [8](2) Не-редукционни предложения: те са необезпокоявани относно използването на причинно-следствените понятия за разграничаване на лъжливи и причинно-следствени връзки. Предложенията от тази втора група по принцип са скептично настроени към програмата Humean, която мотивира редуктивните предложения, а настройките, които са примери на Reversals на Симпсън, са един от основните им критични скалпели (Cartwright 1979, и особено Dupre & Cartwright 1988). Независимо от това, те също се сблъскват с проблема да осигурят филтър за корелациите, които да отбележат кои от тях са фалшиви, но не се чувстват ограничени, за да избегнат позоваване на причинно-следствените връзки при предоставянето на критерии за избор на дялове, които предоставят надеждни данни за каузални изводи. Накратко, както редукционистите, така и антиредукционистите, които одобряват програмата за представяне на причинно-следствените отношения по отношение на вероятностните отношения предлагат

(C) причинява (E), ако и само ако вероятността на (E) е по-голяма дадена (C), отколкото дадена (C), при условие че (ldots X / ldots).

Условието е необходимо за филтриране на случаи, при които вероятностните отношения между събития от тип (C) и (E) не проследяват причинно-следствените връзки. Техните мнения се разделят дали причинно-следствените понятия трябва да се използват или могат да се използват без порочна циркулярност при изписването на съдържанието на уговорката (ldots X / ldots). Редукционистите търсят начини за формулиране на уговорката по отношение на хомогенни референтни класове, при които хомогенността е изписана по отношение на стабилни корелации, обусловени от набор от фактори, които се поддържат фиксирани. Антиредукционистите бързо питат: кои фактори? Приемането на всички възможни фактори е релевантно не само епистемологично невъзможно, но може да доведе до глупави заключения, доколкото всички, но абсолютно фундаментални причинно-следствени процеси могат да бъдат манипулирани чрез въвеждане на някои интервенционни фактори. Например,вероятността от смърт, причинена от сърдечен удар, е по-голяма, отколкото без инфаркт, но приносът на сърдечния удар се „проверява“в случаите, когато сърдечният удар съвпада с пропускането на камион. В този пример шансовете за смърт са предопределени. Случаите на причинно-преопределянето са крайни примери за причинно-следствени мрежи, в които вероятностната значимост се измива или обръща от причинно-следствените приноси на екзогенна променлива. В експерименталните науки опитите за изолиране на взаимодействията между факторите от интервенционните променливи са стандартна процедура. Обаче това, което е постижимо дори в най-добрите лабораторни условия, ще бъде недостатъчно от идеала да се покаже, че няма интервенционни фактори, от които зависи зависимостта. За да се покаже последното, би било необходимо да се покаже, че отрицателното екзистенциално предложение е вярно.

Антиредукционистите имат готов отговор на въпроса кои фактори трябва да бъдат фиксирани при оценка на вероятностните зависимости и вероятностната независимост. Те искат всички потенциално причиняващи фактори, които представляват интерес, да бъдат фиксирани с цел идентифициране на вероятностните отношения между С и Е, които се дължат и са подходящи за представяне на причинно-следствените връзки. Според този подход референтните класове, които са причинно хомогенни, осигуряват подходящата основа за оценка на вероятностните отношения. След това се обръща внимание на научните теории и други знания за причинно-следствените връзки, за да се определи дали референтните класове са причинно хомогенни. [9]В много случаи обаче любопитството ни към причинно-следствените отношения надминава настоящите ни познания за причинно-следствените променливи, които трябва да бъдат фиксирани. Тогава изводите за причинно-следствените отношения от статистически данни, които винаги могат да се противопоставят с обърнати закономерности в различни дялове на данните, могат да доведат до несъответстващи твърдения относно причинно-следствените връзки.

Това каза, че се случват обрати в данните, изследователите са изправени пред въпроса дали асоциациите в обобщените данни са фалшиви или дали асоциациите в разделените данни са фалшиви. Различните причинно-следствени модели (представени от различни насочени ациклични графики) ще бъдат подходящи за представяне на различни отговори в различни случаи (вижте записа на вероятностната причинно-следствена връзка). Тези модели могат да бъдат тествани чрез интервенции, които изолират и контролират стойностите, взети от променливи, които са очевидни причини за ефекти, които представляват интерес за изследователя. Правилно проведените експерименти ще изолират променливи, които трябва да бъдат манипулирани, и след това да се прочетат ефектите от манипулациите (вижте записа за причинно-следствената връзка и манипулируемостта). Така нареченият „критерий за задната врата“(Pearl 1993) уточнява точно какво е необходимо за дадена променлива, за да бъде подходящо изолирана за манипулиране. И така, проблемите, възникнали от преобръщанията на Симпсън, могат да бъдат решени чрез тестване на различни причинно-следствени хипотези, които са в съответствие с наблюдаваните данни, при които тестовете чрез интервенции дават основа, над и над обикновени наблюдения, за приемането на някои причинно-следствени модели като правилни представи на причинно-следствените връзки и за отхвърляне на други, които имат просто фалшиви асоциации. По този начин „парадоксът“на Симпсън е решен в смисъл, че е възможно да се тестват различни причинно-следствени хипотези, които разкриват кои асоциации са фалшиви. (За повече информация относно този метод вижте Pearl 2014.)проблемите, породени от обръщане на Симпсън, могат да бъдат решени чрез тестване на различни причинно-следствени хипотези, които са в съответствие с наблюдаваните данни, при които тестовете чрез интервенции дават основа, над и над обикновени наблюдения, за приемане на някои причинно-следствени модели като правилни представи на причинно-следствените връзки и за отхвърляне други, които имат просто фалшиви асоциации. По този начин „парадоксът“на Симпсън е решен в смисъл, че е възможно да се тестват различни причинно-следствени хипотези, които разкриват кои асоциации са фалшиви. (За повече информация относно този метод вижте Pearl 2014.)проблемите, породени от обръщане на Симпсън, могат да бъдат решени чрез тестване на различни причинно-следствени хипотези, които са в съответствие с наблюдаваните данни, при които тестовете чрез интервенции дават основа, над и над обикновени наблюдения, за приемане на някои причинно-следствени модели като правилни представи на причинно-следствените връзки и за отхвърляне други, които имат просто фалшиви асоциации. По този начин „парадоксът“на Симпсън е решен в смисъл, че е възможно да се тестват различни причинно-следствени хипотези, които разкриват кои асоциации са фалшиви. (За повече информация относно този метод вижте Pearl 2014.)По този начин „парадоксът“на Симпсън е решен в смисъл, че е възможно да се тестват различни причинно-следствени хипотези, които разкриват кои асоциации са фалшиви. (За повече информация относно този метод вижте Pearl 2014.)По този начин „парадоксът“на Симпсън е решен в смисъл, че е възможно да се тестват различни причинно-следствени хипотези, които разкриват кои асоциации са фалшиви. (За повече информация относно този метод вижте Pearl 2014.)

5. Обръщане на Симпсън на неравенствата в еволюционните настройки

Обръщането на неравенствата на Симпсън има приложения в икономическата теория и популационната генетика, особено в случаите, свързани с конкуренция между бизнеса или организмите. В горния пример за диференциално наемане на мъже и жени, представете си, че трябва да картографираме жените върху, да речем, „леминги“, а мъжете - да речем, „плъхове“. Представете си, че лемингите са алтруистични и саможертви, или алтернативно си представете, че са ирационални, неефективни или мързеливи, по един или друг начин, представете си, че се държат по начини, които са от полза за съседите за тяхна сметка. Представете си плъховете да бъдат егоистични, рационални и ефективни и редовно да получават ползи за сметка на своите съседи.

На следващо място, картографирайте отдела по история в Норвегия по време на много тежка зима в Норвегия и да предположим, че в Норвегия има повече плъхове, отколкото леминги. Тогава животът е труден за всички в Норвегия и е още по-труден за лемингите, отколкото за плъховете. Направете карта на географския отдел върху Швеция, която е сред много мека зима, и предполагайте, че в Швеция има повече леминги от плъхове. Тогава животът е по-лесен за всички в Швеция, макар че е по-лесен за свободно яздещи и опортюнистични плъхове, отколкото за лемингите. И накрая, помислете за коефициента на възпроизводство на плъхове и леминги в общата поземлена маса на двете страни. (Или ако тези „плъхове“и „леминги“са фирми, помислете за относителните им проценти на фалит.) След това числата могат да показват същия модел, който описахме при процентите за наемане на мъже и жени в Калифорнийския университет:

Lemmings плъхове
Норвегия ((1 / пъти 10 ^ 9) / (5 / пъти 10 ^ 9)) (LT) ((2 / пъти 10 ^ 9) / (8 / пъти 10 ^ 9))
Швеция ((6 / пъти 10 ^ 9) / (8 / пъти 10 ^ 9)) (LT) ((4 / пъти 10 ^ 9) / (5 / пъти 10 ^ 9))
Скандинавия ((7 / пъти 10 ^ 9) / (13 / пъти 10 ^ 9)) (GT) ((6 / пъти 10 ^ 9) / (13 / пъти 10 ^ 9))

Лемингите губят място в Норвегия, а в Швеция губят почва; все пак те набират позиции в комбинирани области, които съставляват двете държави.

Причината, че лемингите набират място в комбинираната зона на двете страни, е, че повече от лемингите живеят там, където процентът на оцеляване е по-висок. Обърнете внимание, че процентът на оцеляване е по-висок именно там, защото там живеят повече леминги. По този начин, ако плъховете се събират заедно, егоистичната ефективност на всеки плъх ще бъде лоша не само за лошите леминги в квартала, но и за други плъхове. Дори само ако малко повече от плъховете живеят в един регион, а не в друг, ако ползите, които те получават за сметка на своите съседи, стават твърде екстремни, това ще намали процента на оцеляване на всички в този квартал, включително и плъхове; това ще утаи обръщане на Симпсън и броят на плъховете ще започне да намалява в световен мащаб в сравнение с лемингите.

Както в еволюционната теория на Дарвин, така и в голяма част от икономическата теория, е трудно да се разбере как „алтруизмът“(или, по този въпрос, систематичната неефективност) може да се развие или да се поддържа в дългосрочен план. Тоест, трудно е да се види как населението би могло да поддържа наследствени модели на поведение, които са от полза за конкурентите на отделен бизнес или организми за сметка на дългосрочните шансове за оцеляване или репродуктивен успех за тези индивиди и други със същите разпореждания, Поради тази причина е от голямо теоретично значение да се проучат приложенията на Парадокса на Симпсън, за да се разбере дали това може да помогне да се обясни не само алтруизма, но и ирационалността, неефективността, мързела и други пороци, които могат да преобладават сред населението,и това може да доведе до отслабване на населението от идеала на икономическия рационалист или дарвинист за безмилостното ефективно преследване от всеки индивид на собствените си печалби или дългосрочен репродуктивен успех. В баланс това вероятно е весела новина.

библиография

  • Axelrod, R., 1984, Еволюцията на сътрудничеството, Ню Йорк: Основни книги.
  • Bickel, PJ, Hjammel, EA и O'Connell, JW, 1975 г., „Секс пристрастия при завършване на студенти: данни от Бъркли“, Science, 187: 398–404.
  • Blyth, CR, 1972, „За парадокса на Симпсън и принципа на сигурното нещо“, сп. Американска статистическа асоциация, 67: 364–366.
  • Cartwright, N., 1979, “Причинно-следствени закони и ефективни стратегии”, Noûs, 13 (4): 419–437.
  • –––, 2001, „Какво не е наред с Байес Нетс?“, Монист, 84 (2): 242–265. Препечатано в „Вероятност“е самото ръководство на живота, Н. Пр. Кибург, младши и М. Талос (ред.), Чикаго и Ла Сале, IL: Отворен съд, 2003, 253-275.
  • Cohen, MR, и Nagel, E., 1934, Въведение в логиката и научния метод, Ню Йорк: Harcourt, Brace and Co.
  • Dawid, AP, 1979, “Условна независимост в статистическата теория”, списание на Кралското статистическо общество (серия B), 41: 1–15.
  • Dupre, J. и Cartwright, N., 1988, „Вероятност и причинно-следствена връзка: Защо Хюмът и индетерминизмът не се смесват“, Noûs, 22: 521–536.
  • Ейлс, Е., 1987, „Картрайт и Оте за Парадокса на Симпсън“, Философия на науката, 54: 233–243.
  • Glymour, C. and Meek, C., 1994, “Conditioning and Intervening”, Британско списание за философия на науката, 45: 1001–1021.
  • Hardcastle, VG, 1991, „Раздели, вероятностни причинно-следствени закони и Парадокс на Симпсън“, Synthese, 86: 209–228.
  • Хеслоу, Г., 1976, „Дискусия: Две бележки за вероятностния подход към причинно-следствената връзка“, Философия на науката, 43: 290–292.
  • Lindly, DV, и Novick, MR, 1981, „Ролята на обменяемостта в извода“, списание на Американската статистическа асоциация, 9: 45–58.
  • Malinas, G., 1997, „Парадоксът на Симпсън и изследователят на пътя“, Australasian Journal of Philosophy, 75: 343–359.
  • –––, 2001, „Парадоксът на Симпсън: Логично доброкачествена, емпирично коварна хидра“, Монист, 84 (2): 265–284. Препечатано в „Вероятността е самото ръководство на живота“, Хенри Е. Кибург, младши и Мариам Талос (ред.), Чикаго и Ла Сале, IL: Отворен съд, 2003, 165–182
  • Mittal, Y., 1991, „Хомогенност на субпопулациите и парадокс на Симпсън“, сп. Американска статистическа асоциация, 86: 167–172.
  • Otte, R., 1985, „Вероятна причинност и парадокс на Симпсън“, Философия на науката, 52: 110–125.
  • Pearl, J., 1988, Вероятни разсъждения в интелигентните системи, Сан Матео, Калифорния: Морган Кауфман.
  • –––, 1993, „Коментар: Графични модели, причинност и интервенция“, Статистическа наука, 8: 266–269.
  • –––, 2000, Причинно-следствена връзка: Модели, разсъждения и заключения, Ню Йорк, Кеймбридж: Cambridge University Press. [Второ издание, 2009.]
  • –––, 2014, „Коментар: Разбиране на парадокса на Симпсън“, Американският статистик, 68: 8–13.
  • Рейхенбах, Х., 1971, Посоката на времето, Бъркли: Университет на Калифорния прес.
  • Savage, LJ, 1954, Основите на статистиката, Ню Йорк: Джон Уайли и синове.
  • Simpson, EH, 1951, „Интерпретацията на взаимодействието в таблиците за непредвидени ситуации“, списание на Кралското статистическо общество (серия B), 13: 238–241.
  • Skyrms, B., 1980, Причинно-следствена необходимост, Ню Хейвън; Yale University Press.
  • Sober, E., 1993, The Nature of Selection, Chicago: University of Chicago Press.
  • –––, 1993, Философия на биологията, Оксфорд: Oxford University Press.
  • Sober, E. и DS Wilson, 1998, Unto Other: The Evolution and Psychology of Besself поведение, Cambridge, MA: Harvard University Press.
  • Spohn, W., 2001, „Байесовските мрежи са всичко, което има до причинно-следствената връзка“, в „Стохастична зависимост и причинност“, D. Constantini, MC Galavotti и P. Suppes (ред.), Stanford: CSLI Publications.
  • Съндър, С., 1983, „Парадокс за обръщане на Симпсън и разпределение на разходите“, Journal of Accounting Research, 21: 222–233.
  • Suppes, P., 1970, Вероятна теория за причинността, Амстердам; North-Holland Publishing Co..
  • Талос, М., 2003, „Намаляването на причинно-следствената връзка“, в Х. Кибург и М. Талос (ред.), Вероятността е самото ръководство на живота: Философските употреби на късмета, Чикаго: Отворен съд.
  • Thornton, RJ и Innes, JT, 1985, „За парадокса на Симпсън в икономическата статистика“, Оксфордски бюлетин по икономика и статистика, 47: 387–394.
  • Van Frassen, BC, 1989, Закони и симетрия, Оксфорд: Клерънд.
  • Yule, GH, 1903, „Бележки за теорията за асоцииране на атрибутите в статистиката“, Biometrika, 2: 121–134.

Академични инструменти

сеп човек икона
сеп човек икона
Как да цитирам този запис.
сеп човек икона
сеп човек икона
Вижте PDF версията на този запис в Дружеството на приятелите на SEP.
inpho икона
inpho икона
Разгледайте тази тема за вписване в интернет философския онтологичен проект (InPhO).
Фил хартия икона
Фил хартия икона
Подобрена библиография за този запис в PhilPapers, с връзки към неговата база данни.

Други интернет ресурси

  • Парадокс на Симпсън, от уебсайта на Exploring Data на образованието Queensland (Австралия) (архивиран в интернет архива)
  • Парадокс на Симпсън, от Алън Кроу (архивиран в Интернет архива)
  • Парадоксът на Симпсън - Когато големите набори от данни се развалят, в невероятни приложения за вероятност и статистика на www.intuitor.com.
  • Онлайн хартия на Ник Чатър, Иво Влаев и Морис Гринберг, „Ново следствие от Парадокса на Симпсън: Стабилно сътрудничество в дилемата на затворника от един изстрел от популации от индивидуалистични обучителни агенти“, University College London / New Bulgarian University.

Препоръчано: