Теория на решенията

Съдържание:

Теория на решенията
Теория на решенията

Видео: Теория на решенията

Видео: Теория на решенията
Видео: Приложна теория на еластичността Лекция 8 2023, Септември
Anonim

Навигация за влизане

  • Съдържание за участие
  • библиография
  • Академични инструменти
  • Friends PDF Preview
  • Информация за автора и цитирането
  • Върнете се в началото

Теория на решенията

Публикувана за първи път сря 16 декември 2015 г.

Теорията на решенията се занимава с разсъжденията, които са в основата на избора на агент, независимо дали това е светски избор между качването на автобуса или получаването на такси, или по-обширният избор дали да продължите взискателна политическа кариера. (Обърнете внимание, че тук „агент“означава субект, обикновено индивидуален човек, който е способен на обсъждане и действие.) Стандартното мислене е, че това, което агент прави по даден повод, се определя изцяло от нейните убеждения и желания / ценности, но това не е непротиворечиво, както ще бъде отбелязано по-долу. Във всеки случай теорията за решения е толкова теория на вярванията, желанията и други относими нагласи, колкото е теория на избора; важното е как тези различни нагласи (наричайте ги „предпочитания на поведение“) се съчетават заедно.

Фокусът на този запис е теорията на нормативните решения. Тоест, основният интересен въпрос е на какви критерии трябва да отговарят предпочитанията на агента при всякакви общи обстоятелства. Това представлява минимална сметка за рационалност, тази, която поставя по-съществени въпроси относно подходящи ценности и предпочитания и разумни убеждения, като се има предвид ситуацията в момента. Ключовият въпрос в това отношение е третирането на несигурността. Теорията на ортодоксалните нормативни решения, теорията на очакваната полезност (ЕС) по същество казва, че в ситуации на несигурност трябва да се предпочита вариантът с най-голяма очаквана желаност или стойност. Тази проста максима ще бъде в центъра на голяма част от нашата дискусия.

Структурата на този запис е следната: Раздел 1 разглежда основната концепция за „предпочитания пред перспективите“, която лежи в основата на теорията за решения. Раздел 2 описва развитието на теорията за нормативно решение по отношение на все по-мощни и гъвкави мерки за предпочитания. В раздел 3 са разгледани двете най-известни версии на теорията на ЕС. Раздел 4 разглежда по-широкото значение на теорията на ЕС за практически действия, изводи и оценяване. Раздел 5 се обръща към най-важните предизвикателства пред теорията на ЕС, докато в раздел 6 се разглеждат последователни решения и как тази по-богата настройка води до дебатите за рационалните предпочитания.

  • 1. Какви са предпочитанията пред перспективите?
  • 2. Полезни мерки за предпочитане

    • 2.1 Обикновени комунални услуги
    • 2.2 Помощ за кардинализиране
    • 2.3 Теорема за представяне на фон Нойман и Моргенстерн (vNM)
  • 3. Вземане на реални решения

    • 3.1 Теорията на Савидж
    • 3.2 Теория на Джефри
  • 4. По-широко значение на теорията за очакваната полезност (ЕС)

    • 4.1 Граници на теорията на ЕС
    • 4.2 относно рационалната вяра
    • 4.3 Относно рационалното желание
  • 5. Предизвикателства пред теорията на ЕС

    • 5.1 Причинно-следствени аномалии
    • 5.2 Отделимост: риск и съжаление
    • 5.3 За пълнота: Неясни вярвания и желания
  • 6. Последователни решения

    • 6.1 Рационален ли беше Улис?
    • 6.2 Аксиомите на ЕС бяха преразгледани
  • 7. Заключителни бележки
  • библиография
  • Академични инструменти
  • Други интернет ресурси
  • Свързани записи

1. Какви са предпочитанията пред перспективите?

Двете централни концепции в теорията на решенията са предпочитания и перспективи (или еквивалентно, варианти). Грубо казано, казваме, че агент "предпочита" опцията (A) над (B) за всеки случай, за въпросния агент първият е по-желан или по-достоен за избор от втория. Тази груба дефиниция изяснява, че предпочитанието е сравнително отношение; това е един от сравняването на опции по отношение на това колко желани / достойни са за избор. Отвъд това има място за спор за това какви предпочитания пред опциите всъщност представляват, или с други думи, какво става въпрос за агент (може би за себе си), който ни засяга, когато говорим за неговите предпочитания пред опциите. Този раздел разглежда някои елементарни въпроси на тълкуването, които поставят основата за въвеждане (в следващия раздел) таблиците за решение и правилото за очакваната полезност, което за мнозина е познатият предмет на теорията на решенията. По-нататъшни въпроси, свързани с предпочитанията и перспективите, ще бъдат разгледани по-късно, когато възникнат.

Нека все пак да продължим, като първо представим основни свойства на кандидата за (рационално) предпочитание пред опциите и едва след това се обърнем към въпросите на интерпретацията. Както бе отбелязано по-горе, предпочитанието се отнася до сравнението на опциите; това е отношение между опциите. За домейн от опции говорим за подреждане на предпочитанията на агента, като това е подреждането на опции, което се генерира от предпочитанието на агента между всяка две опции в този домейн.

По-нататък, (precedq) представлява слабо предпочитано отношение, т.е. отношението „… не се предпочита пред…“. Така че (A / precedq B) представлява, че агентът, от който се интересуваме, счита опция (B) поне за толкова предпочитана като опция (A). От слабото отношение на предпочитание можем да определим стриктното отношение на предпочитания, (prec), както следва: (A / prec B / Leftrightarrow A / precedq B & / \ neg (B / precedq A)), където (neg X) означава „не е така (X)“. Отношението безразличие (sim) се дефинира като: (A / sim B / Leftrightarrow A / precedq B & / B / precedq A). Това означава, че агентът, от който се интересуваме, счита (A) и (B) за еднакво предпочитани.

Казваме, че (precedq) слабо нарежда набор (S) опции, когато отговаря на следните две условия:

Аксиома 1 (пълнота)

За всеки (A, B / в S): или (A / precedq B), или (B / precedq A).

Аксиома 2 (Транзитивност)

За всеки (A, B, C / в S): ако (A / precedq B) и (B / precedq C), тогава (A / precedq C).

Горното може да се приеме като предварителна характеристика на рационалното предпочитание пред опциите. Дори тази ограничена характеристика обаче е спорна и сочи различими интерпретации на „предпочитания пред перспективи / опции“.

Започнете с аксиомата за пълнота, която казва, че агентът може да сравнява по отношение на слабото отношение на предпочитания всички двойки опции в (S). Дали пълнотата или не е правдоподобно ограничение за рационалност, зависи както от това какви опции се разглеждат, така и от това как интерпретираме предпочитанията пред тези опции. Ако наборът от опции включва всички видове състояния, тогава пълнотата не е незабавно задължителна. Например, съмнително е дали един агент трябва да може да сравни опцията, при която двама души в света стават грамотни с опцията, при която двама души достигат шестдесет години. Ако, от друга страна, всички опции в набора са доста сходни помежду си, да речем, всички опции са инвестиционни портфейли, тогава пълнотата е по-завладяваща. Но дори и да не ограничаваме разглежданите видове опции, въпросът за това дали пълнотата трябва да бъде удовлетворен или не, се превръща в смисъла на предпочитанието. Например, ако предпочитанията само представляват изборно поведение или диспозиции на избор, както правят според „разкритата теория на предпочитанията“, популярна сред икономистите (виж Sen 1973), тогава пълнотата се удовлетворява автоматично, при условие че неизбежно трябва да се направи избор. За разлика от това, ако предпочитанията се разбират по-скоро като психични нагласи, т.е. се считат за преценки дали дадена опция е по-добра или по-желана от друга, тогава съмненията за пълнота, за които се говори по-горе, са уместни (за по-нататъшно обсъждане, вижте Mandler 2001).въпросът дали пълнотата трябва да бъде удовлетворена или не, се превръща в значението на предпочитанието. Например, ако предпочитанията само представляват изборно поведение или диспозиции на избор, както правят според „разкритата теория на предпочитанията“, популярна сред икономистите (виж Sen 1973), тогава пълнотата се удовлетворява автоматично, при условие че неизбежно трябва да се направи избор. За разлика от това, ако предпочитанията се разбират по-скоро като психични нагласи, т.е. се считат за преценки дали дадена опция е по-добра или по-желана от друга, тогава съмненията за пълнота, за които се говори по-горе, са уместни (за по-нататъшно обсъждане, вижте Mandler 2001).въпросът дали пълнотата трябва да бъде удовлетворена или не, се превръща в смисъла на предпочитанието. Например, ако предпочитанията само представляват изборно поведение или диспозиции на избор, както правят според „разкритата теория на предпочитанията“, популярна сред икономистите (виж Sen 1973), тогава пълнотата се удовлетворява автоматично, при условие че неизбежно трябва да се направи избор. За разлика от това, ако предпочитанията се разбират по-скоро като психични нагласи, т.е. се считат за преценки дали дадена опция е по-добра или по-желана от друга, тогава съмненията за пълнота, за които се говори по-горе, са уместни (за по-нататъшно обсъждане, вижте Mandler 2001).тогава пълнотата се удовлетворява автоматично, при условие че неизбежно трябва да се направи избор. За разлика от това, ако предпочитанията се разбират по-скоро като психични нагласи, т.е. се считат за преценки дали дадена опция е по-добра или по-желана от друга, тогава съмненията за пълнота, за които се говори по-горе, са уместни (за по-нататъшно обсъждане, вижте Mandler 2001).тогава пълнотата се удовлетворява автоматично, при условие че неизбежно трябва да се направи избор. За разлика от това, ако предпочитанията се разбират по-скоро като психични нагласи, т.е. се считат за преценки дали дадена опция е по-добра или по-желана от друга, тогава съмненията за пълнота, за които се говори по-горе, са уместни (за по-нататъшно обсъждане, вижте Mandler 2001).

Повечето философи и теоретици на решения се съгласяват с последната интерпретация на предпочитанията като вид преценка, която обяснява, за разлика от идентичността с диспозициите на избора и поведението на изборен резултат (виж, например, Dietrich и List, 2015). Освен това мнозина считат, че пълнотата не се изисква рационално; че рационалността отправя искания само към преценките, които агентът действително притежава, но не казва нищо за това дали решението трябва да бъде взето на първо място. Въпреки това, след Ричард Джефри (1983), повечето теоретици на решения предполагат, че рационалността изисква предпочитанията да бъдат последователно разширяващи се. Това означава, че дори и вашите предпочитания да не са пълни, би трябвало да е възможно да ги изпълните, без да се нарушават никое от условията, които се изискват рационално, по-специално Транзитивност.

Това ни отвежда към аксиомата на Транзитивността, която казва, че ако опция (B) е поне толкова предпочитана като (A), а (C) е поне толкова предпочитана, колкото (B), тогава (A) не може да бъде строго предпочитан пред (C). Неотдавнашно предизвикателство към Транзитивността се превръща в разнородни набори от опции, както е обсъдено по-горе в пълнотата. Но тук различното тълкуване на предпочитанията се налага при сравнението на вариантите. Идеята е, че предпочитанията или преценките за желание могат да отговарят на условието за забележимост. Да предположим, например, че най-забележимата характеристика при сравняване на автомобили (A) и (B) е колко бързо могат да бъдат шофирани и (B) не е по-лоша от (A) в това отношение, все пак най-забележимата характеристика при сравняване на автомобили (B) и (C) е колко са безопасни и това (C) не е по-лошо от (B) в това отношение. Освен това,при сравняване на (A) и (C), най-забележимата черта е тяхната красота. В такъв случай някои твърдят (напр. Temkin 2012), че няма причина Транзитивността да бъде удовлетворена по отношение на предпочитанията относно (A), (B) и (C). Други (напр. Брум 1991а) твърдят, че Транзитивността е част от самото значение на връзката за доброта (или обективна сравнителна желателност); ако рационалното предпочитание е преценка за по-добра или желателна, тогава Транзитивността не може да се договаря. По отношение на примера с автомобила, Брум ще твърди, че желанието на напълно определен вариант не трябва да варира, просто по силата на какви други опции се сравнява. Или контекстът за избор влияе върху начина, по който агентът възприема разглежданата опция и в този случай описанието на опцията трябва да отразява това,иначе контекстът за избор не влияе върху опцията. Така или иначе, Транзитивността трябва да бъде удовлетворена.

Има по-пряма защита на Транзитивността в предпочитанията; защита, която зависи от сигурните загуби, които могат да настъпят на всеки, който наруши аксиомата. Това е така нареченият аргумент на паричната помпа (за скорошното обсъждане и преразглеждане на този аргумент, вижте Gustafsson 2010 & 2013). Тя се основава на предположението, че ако намерите (X) поне толкова желателно, колкото (Y), тогава трябва да се радвате да търгувате с последното за първото. Да предположим, че нарушавате Транзитивността, т.е. за вас: (A / precedq B), (B / precedq C), но (C / prec A). Освен това, да предположим, че в момента имате (A). Тогава трябва да сте готови да търгувате (A) за (B). Същото важи и за (B) и (C): трябва да сте готови да търгувате (B) за (C). Вие строго предпочитате (A) пред (C), така че трябва да сте готови да търгувате с (C) плюс някаква сума ($ x) за (A). Но сега сте в същата ситуация, в която сте започнали, като имате (A), но нито (B), нито (C), с изключение на това, че сте загубили ($ x)! Така в няколко стъпки, всяка от които е съобразена с вашите предпочитания, се оказвате в ситуация, която е очевидно по-лоша, от вашите собствени светлини, отколкото от първоначалната ви ситуация. Картината става по-драматична, ако си представим, че процесът би могъл да се повтори, превръщайки ви в „помпа за пари“. Следователно, аргументът продължава, има нещо (инструментално) ирационално във вашите нечувствителни предпочитания. Ако предпочитанията ви бяха преходни, тогава нямаше да сте уязвими от избора на доминиран вариант и да служи като парична помпа. Следователно вашите предпочитания трябва да бъдат преходни.всяко от които е в съответствие с вашите предпочитания, вие се оказвате в ситуация, която е очевидно по-лоша, от вашите собствени светлини, отколкото от първоначалната ви ситуация. Картината става по-драматична, ако си представим, че процесът би могъл да се повтори, превръщайки ви в „помпа за пари“. Следователно, аргументът продължава, има нещо (инструментално) ирационално във вашите нечувствителни предпочитания. Ако предпочитанията ви бяха преходни, тогава нямаше да сте уязвими от избора на доминиран вариант и да служи като парична помпа. Следователно вашите предпочитания трябва да бъдат преходни.всяко от които е в съответствие с вашите предпочитания, вие се оказвате в ситуация, която е очевидно по-лоша, от вашите собствени светлини, отколкото от първоначалната ви ситуация. Картината става по-драматична, ако си представим, че процесът би могъл да се повтори, превръщайки ви в „помпа за пари“. Следователно, аргументът продължава, има нещо (инструментално) ирационално във вашите нечувствителни предпочитания. Ако предпочитанията ви бяха преходни, тогава нямаше да сте уязвими от избора на доминиран вариант и да служи като парична помпа. Следователно вашите предпочитания трябва да бъдат преходни.има нещо (инструментално) ирационално във вашите нечувствителни предпочитания. Ако предпочитанията ви бяха преходни, тогава нямаше да сте уязвими от избора на доминиран вариант и да служи като парична помпа. Следователно вашите предпочитания трябва да бъдат преходни.има нещо (инструментално) ирационално във вашите нечувствителни предпочитания. Ако предпочитанията ви бяха преходни, тогава нямаше да сте уязвими от избора на доминиран вариант и да служи като парична помпа. Следователно вашите предпочитания трябва да бъдат преходни.

Въпреки че гореспоменатите противоречия не са уредени, в останалата част от този запис ще бъдат направени следните предположения: i) обектите на предпочитание могат да бъдат разнородни перспективи, включващи богата и разнообразна област от свойства, ii) предпочитанието между опциите е преценка на сравнителна желателност или целесъобразност на избора и iii) предпочитанията отговарят както на транзитивност, така и на пълнота (въпреки че последното условие ще бъде преразгледано в раздел 5). Въпросът, който сега възниква, е дали има допълнителни общи ограничения за рационално предпочитание пред опциите.

2. Полезни мерки за предпочитане

В нашето непрекъснато проучване на рационалните предпочитания пред перспективите ще стане важно числовото представяне (или измерване) на подредбите на предпочитанията. Въпросните числови мерки са известни като полезни функции. Двата основни типа полезни функции, които ще играят роля, са функцията на обикновената полезност и по-богатата на информация (или кардинална) полезна функция.

2.1 Обикновени комунални услуги

Оказва се, че докато наборът от перспективи / опции (S) е краен, всеки слаб ред на опциите в (S) може да бъде представен чрез функция на обикновената полезност. За да бъдем точни, нека кажем, че (u) е полезна функция с домейн (S). Казваме, че функцията (u) представлява предпочитанието (precedq) между опциите в (S) за всеки случай:

) етикет {1} текст {За всеки} A, B / в S: u (A) leq u (B) ляво триъгълник A / predeq B)

Друг начин да се добави това е, че когато горното важи, връзката на предпочитанията може да бъде представена като максимална полезност, тъй като тя винаги предпочита опцията с най-висока полезност.

Единствената информация, съдържаща се в обикновеното представяне на полезност, е как агентът, чиито предпочитания са представени опции за поръчки, от най-малко до най-предпочитаните. Това означава, че ако (u) е порядъчна функция на полезност, която представлява подреждането (precedq), тогава всяка функция на полезност (u '), която е порядъчна трансформация на (u) - т.е. всяко преобразуване на (u), което също удовлетворява двустранното в (1) -представлява (predeq), също както и (u). Следователно ние казваме, че функцията на обикновената полезност е уникална само до порядъчните трансформации.

Резултатът, посочен по-горе, може да бъде обобщен, както следва:

Теорема 1 (Обикновено представяне). Нека (S) е краен набор, а (precedq) слабо отношение за предпочитания на (S). Тогава има функция на обикновената полезност, която представлява (precedq) само в случай, че (precedq) е пълна и преходна.

Тази теорема не трябва да бъде твърде изненадваща. Ако (precedq) е пълно и преходно над (S), тогава опциите в (S) могат да бъдат поставени в ред, от най-малко до най-малко предпочитаните, където някои опции могат да попаднат в същото позиция (ако те се считат за еднакво желани), но където няма цикли или контури. Теорема 1 просто казва, че можем да зададем числа на опциите в (S) по начин, който представя този ред. (За просто доказателство за теорема 1, с изключение на строго, а не слабо отношение към предпочитания, консултирайте се с Peterson 2009: 95.)

Обърнете внимание, че обикновените комунални услуги не са много математически „мощни“, така да се каже. Няма смисъл например да се сравняват вероятностните очаквания за различни групи от обикновени комунални услуги. Например, помислете за следните две двойки перспективи: на елементите на първата двойка са назначени порядъчни комунални програми от 2 и 4, докато на втората двойка са назначени обикновени комунални програми от 0 и 5. Нека определим „плоско“разпределение на вероятностите във всеки случай, така че всеки елемент в двете двойки съответства на вероятност 0,5. Сравнително с тази вероятностна задача, очакването на първата двойка обикновени комунални услуги е 3, което е по-голямо от 2,5, очакването на втората двойка. Но когато преобразуваме обикновените комунални услуги по допустим начин - например чрез увеличаване на най-високата полезност във втората двойка от 5 на 10 - подреждането на очакванията се обръща; сега сравнението е между 3 и 5. Значението на тази точка ще стане по-ясно в следващото, когато се обърнем към сравнителната оценка на лотарии и рискован избор. Необходима е интервално оценена или кардинална полезна функция за последователна оценка на лотарии / рискови перспективи. По същия начин, за да се конструира или концептуализира функция на кардинална полезност, човек обикновено се обръща към предпочитания пред лотарии. Необходима е интервално оценена или кардинална полезна функция за последователна оценка на лотарии / рискови перспективи. По същия начин, за да се конструира или концептуализира функция на кардинална полезност, човек обикновено се обръща към предпочитания пред лотарии. Необходима е интервално оценена или кардинална полезна функция за последователна оценка на лотарии / рискови перспективи. По същия начин, за да се конструира или концептуализира функция на кардинална полезност, човек обикновено се обръща към предпочитания пред лотарии.

2.2 Помощ за кардинализиране

За да получим кардинално (интервално) полезно представяне на предпочитание за поръчка - т.е. мярка, която представя не само как агент нарежда опциите, но и казва нещо за желанието за „разстояние“между опциите - имаме нужда от по-богата настройка; наборът от опции и съответното подреждане на предпочитания ще трябва да имат по-голяма структура, отколкото за обикновена полезна мярка. Един такъв акаунт, благодарение на Джон фон Нойман и Оскар Моргенстерн (1944 г.), ще бъде детайлизиран подробно по-долу. Засега е полезно да се съсредоточим върху вида опция, която е ключова за разбирането и изграждането на основна полезна функция: лотарии. [1]

Помислете първо за поръчка на три редовни опции, например, трите дестинации за почивка Амстердам, Банкок и Кардиф, обозначени съответно (A), (B) и (C). Да предположим, че предпочитанието ви е (A / prec B / prec C). Тази информация е достатъчна, за да представи обикновено вашата преценка; припомнете, че всяко присвояване на помощни програми е приемливо, стига (C) да получи по-висока стойност от (B), която получава по-висока стойност от (A). Но може би искаме да знаем повече, отколкото може да се изведе от такава функция на полезността - искаме да знаем колко (C) е предпочитано над (B), в сравнение с колко (B) е предпочитано над (А). Например, може да се окаже, че Бангкок се смята почти толкова желан, колкото Кардиф, но Амстердам е доста далеч зад Банкок, сравнително казано. Или иначе може би Бангкок е само незначително по-добър от Амстердам,в сравнение с това доколко Кардиф е по-добър от Банкок. Този вид информация за относителното разстояние между опциите, по отношение на силата на предпочитание или желание, е точно това, което се дава чрез интервално оценена полезна функция. Проблемът е как да се установи тази информация.

За да разрешат този проблем, Ramsey (1926) и по-късно фон Neumann и Morgenstern (оттук нататък vNM) направиха следното предложение: конструираме нова опция, лотария (L), която има (A) и (C) като възможни „награди“и ние решаваме какъв шанс лотарията трябва да даде (C), за да бъдете безразлични между тази лотария и почивка в Банкок. Основната идея е, че преценката ви за Банкок, в сравнение с Кардиф от една страна и Амстердам от друга, може да се измери с рисковете на лотарията (L), включваща Кардиф и Амстердам, която считате за еднакво желана като Бангкок. Например, ако сте безразлични между Банкок и лотария, която предоставя много малък шанс да спечелите пътуване до Кардиф, тогава очевидно не смятате Бангкок за много по-добър от Амстердам спрямо Кардиф; за теб,дори едно малко подобрение на Амстердам, т.е. лотария с малък шанс на Кардиф, а не Амстердам, е достатъчна, за да съвпадне с Банкок.

Горният анализ предполага, че лотариите се оценяват от гледна точка на тяхната очаквана стойност или желание за избор. Тоест, желанието на лотарията е на практика сумата от шансовете на всяка награда, умножена по желанието на тази награда. Помислете следния пример: Да предположим, че сте безразлични между лотарията, (L) и празника в Банкок, (B), когато шансът на лотарията да доведе до почивка в Кардиф е (3/4). Обадете се на тази конкретна лотария (L '). Идеята е, че Бангкок е на три четвърти от пътя нагоре по скалата на желанието, която има Амстердам в долната част и Кардиф в горната част. Ако предвидим, че (u (A) = 0) и (u (C) = 1), тогава (u (B) = u (L ') = 3/4). Това съответства на очакваната желателност или, както обикновено се нарича, на очакваната полезност на лотарията, тъй като (u (L ') = 1/4 / cdot 0 + 3/4 / cdot 1 = 3/4). Тоест стойността на лотарията е вероятностно претеглена сума от полезните услуги на нейните награди, където теглото на всяка награда се определя от вероятността лотарията да доведе до тази награда.

Следователно виждаме, че чрез въвеждането на опции за лотария може да се изгради интервал-стойностна полезна мярка над опции. Както подсказва името, полезната мярка за полезна стойност предава информация за относителните размери на интервалите между опциите според някаква скала за желание. Тоест, помощните програми са уникални, след като сме фиксирали началната точка на нашето измерване и единичната скала на желание. В горния пример бихме могли например да присвоим стойност на полезност от 1 до (A) и 5 до (C), в този случай би трябвало да присвоим стойност на полезност от 4 до (B), тъй като 4 е 3/4 от пътя между 1 и 5. С други думи, след като сме присвоили стойностите на полезността на (A) и (C), полезността на (L ') и по този начин (B) е определен. Нека да наречем тази втора полезна функция (u '). Тя е свързана с нашата първоначална функция, както следва: (u '= 4 / cdot u +1). Тази връзка винаги е между две такива функции: Ако (u) е интервално оценена полезна функция, която представя подреждането на предпочитанията, (precedq), а (u ') е друга функция на полезност, която също представлява това подреждане, тогава има константи (a) и (b), където (a) трябва да бъде положително, така че (u '= a / cdot u + b). Това означава, че полезните полезни функции са уникални само до положителна линейна трансформация.тогава има константи (a) и (b), където (a) трябва да са положителни, така че (u '= a / cdot u + b). Това означава, че полезните полезни функции са уникални само до положителна линейна трансформация.тогава има константи (a) и (b), където (a) трябва да са положителни, така че (u '= a / cdot u + b). Това означава, че полезните полезни функции са уникални само до положителна линейна трансформация.

Преди да приключим с това обсъждане на измерването на полезността, трябва да се споменат две свързани ограничения по отношение на информацията, която тези мерки предават. Първо, тъй като полезността на опциите, независимо дали е порядъчна или интервална, може да бъде определена само по отношение на полезността на други опции, няма такова нещо като абсолютната полезност на опцията, поне не и без допълнителни предположения. [2]Второ, по същите съображения нито мерките за оценка на интервалите, нито обикновените полезни мерки, както са разгледани тук, не са междулично съизмерими по отношение на нивата и единиците на полезност. Като бърза илюстрация, да предположим, че и вие, и аз имаме описания по-горе предпочитания ред за ваканционните опции: (A / prec B / prec C). Да предположим също, че според горното, и двамата сме безразлични между (B) и лотарията (L '), която има (3/4) шанс да даде печалба (C) и a (1/4) шанс за добив (A). Тогава можем ли да кажем, че предоставянето на мен на Кардиф и на вас в Банкок би представлявало същата сума на „общото желание“, както и на Кардиф и мен на Банкок? Нямаме право да казваме това. Нашата поръчка за споделяне на предпочитания е например,съобразено с мен намирането на почивка в Кардиф сбъдната мечта, докато вие просто го намирате за най-доброто от лошото. Освен това ние дори нямаме право да казваме, че разликата в желанието между Банкок и Амстердам е еднаква за вас, както и за мен. Според мен желанието на трите варианта може да варира от живия ад до сбъдната мечта, докато според вас - от лоша до доста лоша; и двете оценки са в съответствие с горния ред за предпочитания. Всъщност, същото може да се отнася за нашите предпочитания пред всички възможни опции, включително лотарии: дори ако споделихме една и съща обща поръчка на предпочитания, може да се окаже, че вие сте просто с отрицателно разпореждане - не намирам опция, която да е голяма, докато аз много екстремно намирам някои опции за отлични, но други - чисто мъчение. Следователно, полезни функции,дали интервално или порядъчно, не позволяват смислени междуличностни сравнения. (Elster and Roemer 1993 съдържа редица документи, обсъждащи тези проблеми; вж. Също статията за SEP за Теория на социалния избор.

2.3 Теорема за представяне на фон Нойман и Моргенстерн (vNM)

Последният раздел предостави интервално оценено полезно представяне на предпочитанията на човек пред лотарии, при условие, че лотариите се оценяват по отношение на очакваната полезност. Някои може да намерят това малко бързо. Защо трябва да приемаме, че хората оценяват лотарии по отношение на очакваните от тях услуги? VNM теоремата ефективно преодолява пропуските в разсъжденията, като пренасочва вниманието към предпочитанието. В допълнение към транзитивността и пълнотата, vNM въвежда допълнителни принципи, управляващи рационалните предпочитания пред лотариите, и показва, че предпочитанията на агента могат да бъдат представени като максимизиране на очакваната полезност, винаги когато нейните предпочитания удовлетворяват тези принципи.

Нека първо определим във формално отношение очакваната полезност на лотарията: Нека (L_i) е лотария от множеството (bL) на лотарии и (O_ {ik}) резултата, или награда, от лотария (L_i), която възниква с вероятност (p_ {ik}). Очакваната полезност на (L_i) след това се определя като:

VNM уравнение

[EU (L_i) dot = / sum_k u (O_ {ik}) cdot p_ {ik})

Предположението, направено по-рано, вече може да бъде официално заявено:

започнем {уравнение} маркер {2} текст {За всеки} L_i, L_j / в / bL: L_i / precedq L_j / Leftrightarrow EU (L_i) leq EU (L_j) край {уравнение}

Когато горното е валидно, казваме, че има очаквана полезна функция, която представлява предпочитанията на агента; с други думи, агентът може да бъде представен като максимизиране на очакваната полезност.

Въпросът, който vNM адресът е: Какви предпочитания могат да бъдат представени по този начин? За да отговорим на този въпрос, трябва да се върнем към основното отношение на предпочитания (precedq) над множеството опции, в случая включващи лотарии. VNM теоремата изисква множеството (bL) от лотарии да е доста обширно: тя е затворена под „вероятностна смес“, тоест, ако (L_i, L_j / в / bL), тогава сложни лотарии, които имат (L_i) и (L_j) като възможни награди също са в (bL). (Друго техническо предположение, което няма да бъде обсъждано подробно, е, че сложните лотарии винаги могат да бъдат сведени, в съответствие със законите на вероятността, до прости лотарии, които включват само основни награди.)

Вече бе обсъдено основно ограничение за рационалност по отношение на предпочитанието - то слабо подрежда опциите (т.е. задоволява транзитивност и пълнота). Следните обозначения ще бъдат използвани за въвеждане на две допълнителни аксиоми на vNM с предпочитание: ({pA, (1-p) B }) обозначава лотария, която води до (A), с вероятност (p) или (B) с вероятност (1-p).

Аксиома 3 (непрекъснатост)

Да предположим, (A / precedq B / precedq C). Тогава има (p / в [0,1]) такова, че:

) {pA, (1-p) C } sim B)

Аксиома 4 (Независимост)

Да предположим, (A / precedq B). Тогава за всеки (C) и всеки (p / в [0,1]):

) {pA, (1-p) C } precedq {pB, (1-p) C })

Непрекъснатостта предполага, че нито един резултат не е толкова лош, че не бихте били готови да вземете някаква хазартна игра, която би могла да доведе до край на този резултат, но в противен случай би могла да доведе до по-благоприятен резултат от сегашните ви светлини, при условие че шансовете за по-добър резултат са достатъчно добри. Интуитивно, непрекъснатостта гарантира, че оценките на агентите на лотарии са подходящо чувствителни към вероятността от наградите на лотариите. Освен това гарантира, както подсказва името, че достатъчно богата поръчка на предпочитания над лотарии може да бъде представена от непрекъсната функция на кардинала.

Независимостта предполага, че когато две алтернативи имат еднаква вероятност за някакъв конкретен резултат, нашата оценка на двете алтернативи трябва да бъде независима от нашето мнение за този конкретен резултат. Интуитивно това означава, че предпочитанията между лотариите трябва да се управляват само от характеристиките на лотариите, които се различават; общите между лотариите трябва да бъдат ефективно игнорирани. Подреждането на предпочитания трябва да отговаря на някаква версия на аксиомата за независимост, за да може да се представи като максимизиране на това, което се нарича адитивно разделима функция; по-специално функция, според която стойността (т.е. очакваната полезност) на дадена опция е (вероятностно претеглена) сума от стойностите на нейните възможни резултати.

Някои хора намират аксиомата за непрекъснатост неразумно ограничение за рационално предпочитание. Има ли вероятност (p) такава, че да сте готови да приемете хазарт, който има тази вероятност да загубите живота и вероятността си ((1-p)) да спечелите $ 10? Много хора смятат, че няма. Въпреки това, същите тези хора вероятно биха прекосили улицата, за да вдигнат сметката от 10 долара, която са отпаднали. Но това е просто вземане на хазарт, който има много малка вероятност да бъде убит от кола, но много по-голяма вероятност да спечелите 10 долара! В по-общ план, въпреки че хората рядко го мислят по този начин, те постоянно взимат хазарт, който има незначителни шансове да доведе до постоянна смърт и съответно много висок шанс за някаква скромна награда. Всеки път, когато отидем на разходка, караме колата си, летим някъде и т.н.има някакъв шанс да имаме фатален инцидент. Но тъй като вероятностите от тези произшествия са достатъчно малки, решаваме да вземем своя шанс.

Независимостта изглежда задължително изискване за рационалност, когато се разглежда абстрактно. Въпреки това има известни примери, при които хората често нарушават Независимостта, без да изглеждат ирационални. Тези примери включват допълване между възможните резултати от лотарията. Особено известен такъв пример е така нареченият Парадокс на Алаис, който френският икономист Морис Алай (1953 г.) за пръв път въведе в началото на 50-те години. Парадоксът се състои в сравняване на предпочитанията на хората пред два чифта лотарии, подобни на тези, дадени в таблица 1. Лотариите са описани по отношение на наградите, свързани с конкретни номерирани билети, където един билет ще бъде изтеглен на случаен принцип (например, (L_1) води до награда от $ 2500, ако е изтеглен един от билетите с номер 2–34).

1 2-34 35-100
(L_1) $ 0 $ 2500 $ 2400
(L_2) $ 2400 $ 2400 $ 2400
1 2-34 35-100
(L_3) $ 0 $ 2500 $ 0
(L_4) $ 2400 $ 2400 $ 0

Таблица 1. Парадокс на Алайс

В тази ситуация много хора предпочитат (L_2) над (L_1), но и (L_3) над (L_4) (както се вижда от поведението на избора им, както и от показанията им), двойка предпочитания, които ще бъдат наричани предпочитания на Алайс. [3] Често срещан начин за рационализиране на предпочитанията на Алайс е, че при ситуация на първи избор рискът да се свърши с нищо, когато човек може да има 2400 долара със сигурност, не оправдава увеличения шанс за по-висока награда. При ситуация на втори избор обаче минималният размер, който трябва да спечелите, е 0 долара, независимо кой избор прави. Следователно в този случай много хора смятат, че лекият допълнителен риск от $ 0 си струва шанса за по-добра награда.

Въпреки че горните разсъждения могат да изглеждат убедителни, предпочитанията на Алайс противоречат на аксиомата за независимост. Следното важи за двете ситуации на избор: какъвто и избор да направите, ще получите същата награда, ако бъде изтеглен един от билетите в последната колона. Следователно независимостта предполага, че както предпочитанията ви между (L_1) и (L_2), така и предпочитанията ви между (L_3) и (L_4) трябва да са независими от наградите в тази колона. Но когато пренебрегнете последната колона, (L_1) става идентична с (L_3) и (L_2) до (L_4). Следователно, ако предпочитате (L_2) над (L_1), но (L_3) над (L_4), изглежда, че има несъответствие в подреждането на предпочитанията ви. И определено има нарушение на Независимостта. В резултат на това двойката предпочитания, които се обсъждат, не може да бъде представена като максимизиране на очакваната полезност. (По този начин „парадоксът“:много хора смятат, че независимостта е изискване за рационалност, но въпреки това също искат да твърдят, че няма нищо ирационално в предпочитанията на Алайс.)

Теоретиците на решения реагираха по различни начини на парадокса на Алайс. Този въпрос ще бъде разгледан в раздел 5.2, когато ще бъдат обсъдени предизвикателствата пред теорията на ЕС. Настоящата цел е просто да покаже, че приемствеността и независимостта са непреодолими ограничения за рационално предпочитание, макар и не без техните възпиращи фактори. Резултатът, доказан vNM, може да се обобщи така:

Теорема 2 (фон Нойман-Моргенстерн)

Нека (bO) е краен набор от резултати, (bL) набор от съответните лотарии, който е затворен при вероятностна смес и (precedq) слабо отношение на предпочитания на (bL). Тогава (precedq) удовлетворява аксиоми 1–4, ако и само ако съществува функция (u), от (bO) в множеството реални числа, което е уникално до положителното линейно преобразуване, и по отношение на които (precedq) може да се представи като максимизиране на очакваната полезност.

Дейвид Крепс (1988) дава достъпна илюстрация на доказателството на тази теорема. Доказателството протича на два етапа: първо се доказва наличието на интервално оценена полезна функция, удовлетворяваща аксиомите за предпочитане (това е функция на полезност, която оценява лотарии по отношение на очакваната им полезност, както е описано по-горе). Тогава се доказва уникалността на тази полезна мярка (до положителна линейна трансформация).

3. Вземане на реални решения

VNM теоремата е много важен резултат за измерване на силата на предпочитанията на рационалния агент спрямо сигурни опции (лотариите ефективно улесняват кардинална мярка над сигурни варианти). Но това не ни стига до взимането на рационални решения в реалния свят; все още всъщност нямаме теория за решения. Теоремата е ограничена до оценяване на варианти, които идват с обективно разпределение на вероятността върху резултатите - теоретиците на ситуацията и икономистите често описват като „избор с риск“(Knight 1921).

В повечето обикновени ситуации на избор обектите на избор, над които трябва да имаме или да формираме предпочитания, не са такива. По-скоро лицата, които вземат решения, трябва да се консултират със собствените си убеждения относно вероятността един или друг резултат да бъде резултат от определена опция. Решенията при такива обстоятелства често се описват като „избор в несигурност“(Knight 1921). Например, помислете за затруднението на алпинист, който решава дали да се опита или не опасно изкачване на върха, където ключовият фактор за нея е времето. Ако има късмет, тя може да има достъп до изчерпателна метеорологична статистика за региона. Независимо от това, статистиката за времето се различава от организацията на лотарията по това, че те не определят вероятността от възможните резултати от опит за опит, а не за опит за срещата на върха в определен ден. Не на последно място,алпинистът трябва да прецени колко е уверен в alt ="

Фигура 1. Проблемът с решението на Улис

Казват ни, че преди да се впусне, Улис най-много би предпочел свободно да чуе сирените и да се върне у дома в Итака. Проблемът е, че Улис прогнозира, че бъдещият му Аз няма да се съобрази: ако плава неограничено, по-късно ще бъде съблазнен от сирените и всъщност няма да продължи у дома в Итака, а по-скоро ще остане на острова за неопределено време. Следователно Улис мотивира, че би било по-добре да бъде вързан към мачтата, защото той би предпочел срама и дискомфорта да бъде вързан за мачтата и да го направи у дома, за да остане завинаги на острова на сирените.

Не може да се отрече, че Улис прави мъдър избор да бъде вързан за мачтата. Някои считат обаче, че Улис едва ли е примерен агент - в края на краищата той трябва да играе срещу бъдещото си аз, което неволно ще бъде съблазнено от сирените. Въпреки че Ulysses е рационален от стандартите за статично решение, можем да го считаме за ирационален чрез последователни стандарти за решение. За да бъде рационален в последователен или динамичен смисъл, Улис ще трябва да демонстрира непрекъсната рационалност през удължения период от време: той ще трябва, да речем, да действа като максимизатор на ЕС във всички точки на избор и освен това да не претърпява нередовни промени в вяра или желание, т. е. промени, които не съответстват на стандартното правило за учене на байесовската условност (което гласи, че след като научат някакво предложение, убежденията се актуализират до съответните условни вероятности). С други думи, може да се приеме, че моделът на последователното решение се занимава с проблемите на рационалността във времето.

Докато рационалността с течение на времето може да има някакъв внос (да речем, като ни позволява да идентифицираме серийно поведение), това, което наистина има значение, е как агент трябва да действа в даден момент от време. За тази цел моделът на последователното решение по-плодотворно се разглежда като инструмент за подпомагане на определянето на рационалния избор в определен момент, точно както модела за статично решение. Последователното дърво на решения е ефективно начин за визуализиране на времевата серия от избори и учебни събития, с които агентът вярва, че ще се сблъска в бъдеще, в зависимост от това в коя част от дървото на решения ще се озове той. Ключовият въпрос е: Как агент трябва да избере сред първоначалните си опции в светлината на своето проектирано дърво за решения? Този въпрос породи изненадващо количество полемика. В литературата се появяват три основни подхода за договаряне на дървета с последователни решения. Това са наивният или късогледството, сложният подход и решителният подход. Те ще бъдат обсъдени на свой ред и ще се предположи, че споровете може да не са съществени, а по-скоро да показват фини различия в тълкуването на последователни модели на решения.

Така нареченият наивен подход при договаряне на последователни решения служи като полезен контраст с другите два подхода. Наивният агент приема, че всеки път през дървото на решения е възможен и затова тръгва по който и да е път, който е оптимален, като се имат предвид сегашните му нагласи. Например, наивен Улис просто би предположил, че има три цялостни стратегии за избор: или да нареди на екипажа да го завърже за мачтата, или да не издаде такава заповед и по-късно да спре на острова на сирените, или да не издаде такава заповед и по-късно се придържа към курса си. Ulysses предпочита резултата, свързан с последната комбинация, и затова той инициира тази стратегия, като не нарежда на екипажа да го ограничава. Таблица 5 представя статичния аналог на наивния проблем на Улис. В сила,този модел на решение не отчита настоящите познания на Улис за бъдещите му предпочитания и следователно съветва той да следва вариант, който се очаква да бъде невъзможен.

акт изход
поръчка обвързване с мачта стигнете до дома, някакво унижение
плавайте без ограничения, след което останете със сирени живот със сирени
отплавайте без ограничения, след което се приберете към Итака стигнете до дома, без унижение

Таблица 5. Проблемът с решението на наивния Улис

Не е необходимо да се работи, че наивният подход към последователния избор е подходящо наречен. От друга страна, отличителният белег на усъвършенствания подход е неговият акцент върху задното планиране: сложният избирател не предполага, че ще бъдат възможни всички пътища през дървото на решенията или с други думи, всички възможни комбинации от възможности за избор на различни възли за избор, Агентът обмисля по-скоро това, което той / тя ще бъде склонен да избере при по-късни възли за избор, когато стигне до въпросната временна позиция. Сложният Улис би отчел факта, че ако стигне неограничено до острова на сирените, той ще иска да спре там за неопределено време, поради трансформативния ефект на песента на сирените върху неговите предпочитания. Това се отразява в статичното представяне на проблема с решението, както е показано в таблица 6. Държавите тук се отнасят до бъдещите предпочитания на Улис, щом стигне до острова. Тъй като второто състояние има нулева вероятност, актовете се решават въз основа на първото състояние, така че Улис разумно избира да бъде вързан към мачтата.

акт по-късно изберете сирени ((p = 1)) по-късно изберете Итака ((p = 0))
поръчка обвързване с мачта дом, някакво унижение дом, някакво унижение
плавайте неограничено живот със сирени дом, без унижение

Таблица 6. Проблемът с решението на сложен Улис

Решителният избор се отклонява от сложния избор само при определени условия, които не са изпълнени от Улис, предвид необяснимата му промяна в нагласите. Защитниците на решителния избор обикновено защитават теориите за решения, които нарушават аксиомата на независимостта / принципа на сигурността (по-специално McClennen 1990 и Machina 1989; вж. Също Rabinowicz 1995 за обсъждане), и апелират към решителния избор, за да направят теорията си за решение по-приятна в последователния контекст, Според решителния избор, в подходящ контекст (включващ стабилни предпочитания, но които нарушават независимостта), агентът трябва да разчита просто да се придържа към стратегията, която първоначално се е смятала за най-добра във всички бъдещи възли за избор. Въпросът е дали решителният подход има смисъл предвид стандартното тълкуване на модел за последователно решение. Може ли агент наистина да разчита на избора си спрямо нейните предпочитания в даден момент, за да изпълни стар план? Това би изглеждало случай на попадане в заблуждението на потъналите разходи. Разбира се, агент може да постави значително значение за спазването на предишни ангажименти. Всяка такава загриженост за интегритета, обаче, трябва да бъде отразена в реалните предпочитания на агента към въпросния момент. Това е доста по-различно от избора извън стъпка с нечии съображения за всички неща в даден момент.във въпросния момент. Това е доста по-различно от избора извън стъпка с нечии съображения за всички неща в даден момент.във въпросния момент. Това е доста по-различно от избора извън стъпка с нечии съображения за всички неща в даден момент.

Може би защитниците на решителния избор всъщност имат предвид различното тълкуване на последователни модели на решения, при което бъдещите „точки на избор“всъщност не са точки, в които даден агент е свободен да избира според предпочитанията си по това време. Ако това е правилно, това означава промяна на въпроса или проблема на интереса. По-нататък ще се приеме стандартното тълкуване на модели на последователни решения и освен това се предполага, че рационалните агенти разсъждават за такива решения по сложен начин (както Леви 1991, Махер 1992, Сейденфелд 1994, между другото).

6.2 Аксиомите на ЕС бяха преразгледани

Виждахме, че дърветата с последователни решения могат да помогнат на агент като Улис да направи преглед на последствията от настоящия си избор, така че той да може по-добре да разсъждава какво да прави сега. Литературата за последователния избор обаче се занимава предимно с по-амбициозни въпроси. Всъщност последователната настройка ефективно предлага нови начини за „тестване“на теории за рационално предпочитание, както и рационална промяна на убеждението / желанието. Това са контролирани тестове с това, че се предполага, че агентът прогнозира стабилни предпочитания във времето, т.е. тя не очаква нейното разпореждане на предпочитанията за крайните резултати да се промени, освен по начини, които съответстват на нейното правило за промяна на убеждението / желанието. Строго погледнато, това, което е поставено на изпитание, е целият пакет от правила за решение плюс правило за учене. На практика двете се третират отделно:различни правила за вземане на решения се сравняват при предположението, че обучението е чрез байесова условност или иначе се сравняват различни правила за учене, при условие че агентът максимизира очакваната полезност. Въпросът е дали решението или правилото за учене на агента се показват като самоубиващи се (или с други думи динамично непоследователни), в някакъв смисъл, в последователната настройка.

Нека първо разгледаме аргумента за последователно решение за учене в отговор на нови доказателства чрез байесовската кондиционизация, тъй като той служи като полезно сравнение за други последователни аргументи. Skyrms (1993) представя такъв аргумент; той може би е най-сложната версия на аргумента на така наречената „диахронична холандска книга“, като условието е единственото правило за рационално обучение. Предполага се, че агентът е очакван максимизатор на полезност, който предприема сложен подход (обратно разсъждение) към последователни проблеми с решения. Skyrms показва, че всеки такъв агент, който планира да се научи по начин, който противоречи на условното усвояване, ще направи самоубеждаващ избор в някои специално измислени ситуации на последователни решения. За разлика от това, добрият кондициониращ агент никога няма да направи избор, който се самоубива по този начин. Тук става въпрос за „самоубиващи се избори“, които представляват сигурна загуба. Тоест, агентът избира стратегия, която със сигурност е по-лоша, от собствените си светлини, отколкото друга стратегия, която иначе би могла да избере, ако само нейното правило за учене беше такова, че би избрала различно в един или повече бъдещи възли за избор.

Подобен аргумент може да се използва за защита на предпочитанията на ЕС. В този случай ние приемаме, че правилото за учене на агента е условност; освен това, ние приемаме, както и преди, че агентът има стабилни предпочитания и използва усъвършенстван подход към проблемите с последователни решения. Hammond (1976, 1977, 1988b, в) дава аргумент за „динамична съгласуваност“за теорията на ЕС, който е подобен на горния по отношение на кондиционирането; той показва, че само предпочитанията със структура на ЕС са такива, че агентът може да планира да следва всеки път в дърво на последователни решения, което се счита за оптимално от агента от първоначалния избор на възел. За разлика от други структури за предпочитания (правила за вземане на решения), предпочитанията на ЕС никога не водят до „самоубиващи се избори“,в смисъл, че агентът е принуден да избере стратегия, която е по-лоша от собствените си светлини, отколкото друга стратегия, която тя иначе би могла да избере, ако само нейните предпочитания бяха такива, че би избрала различно при бъдещи възли за избор.

Аргументът на Хамънд за теорията на ЕС и представата за динамична последователност, на която се позовава, са критикувани от различни квартали, както от тези, които защитават теориите, които нарушават аксиомата на независимостта, но запазват аксиомите за пълнота и транзитивност (т.е. подреждане) на теорията на ЕС, и тези, които защитават теориите, които нарушават последната (за обсъждане, вижте Steele 2010). Подходът, възприет от някои защитници на теории за нарушаване на независимостта (по-специално, Machina 1989 и McClennen 1990), вече е споменат: Те отхвърлят предположението за сложен избор, който задвижва аргументите на динамичната последователност. Seidenfeld (1988a, b, 1994, 2000a, b) по-скоро отхвърля идеята на Хамонд за динамична последователност в полза на по-фина представа, която разграничава теориите, които нарушават подреждането, и тези, които сами нарушават независимостта; бившият,за разлика от последния, преминете теста на Seidenfeld. И този аргумент не е без критиците (вж. McClennen 1988, Hammond 1988a, Rabinowicz 2000). Имайте предвид, че разходите за всяко отклонение от теорията на ЕС са добре подчертани от Al-Najjar и Weinstein (2009) и Kadane et al. (2008), по-специално възможността за отвращение към свободната информация и отвращение към възможностите за по-голям избор в бъдеще.

7. Заключителни бележки

Нека завършим с обобщаването на основните причини, поради които теорията на решенията, описана по-горе, представлява философски интерес. Първо, теорията на нормативното решение явно е (минимална) теория на практическата рационалност. Целта е да се характеризират нагласите на агентите, които са практически рационални и обикновено се правят различни (статични и последователни) аргументи, за да се покаже, че някои практически катастрофи попадат в агенти, които не отговарят на стандартните теоретически ограничения за решения. Второ, много от тези ограничения се отнасят до убежденията на агентите. По-специално, теорията на нормативните решения изисква степента на убеждения на агентите да отговаря на вероятностите на аксиомите и те да реагират на нова информация чрез кондициониране. Следователно теорията на решенията има голямо значение за дебатите в гносеологията и философията на науката; това е,за теории на епистемичната рационалност.

И накрая, теорията на решенията би трябвало да представлява голям интерес за философите на ума и психологията и други, които се интересуват от това как хората могат да разберат поведението и намеренията на другите; и по-общо как можем да тълкуваме какво се случва в съзнанието на други хора. Теоретиците на решения обикновено приемат, че поведението на даден човек може да бъде напълно обяснено по отношение на неговите убеждения и желания. Но може би по-интересното е, че някои от най-важните резултати от теорията на решенията - различните теореми за представителство, някои от които са обсъдени тук, предполагат, че ако човек удовлетворява определени изисквания за рационалност, тогава можем да прочетем нейните вярвания и желания и колко силни са тези вярванията и желанията са, от нейния избор (или предпочитания) по избор. Колко наистина ни казват тези теореми е въпрос на дебат, както беше обсъдено по-горе. Но при оптимистичен прочит на тези резултати, те ни уверяват, че можем смислено да говорим за това, което се случва в съзнанието на други хора, без много доказателства, освен информация за техните възможности за избор.

библиография

  • Ал-Наджар, Набил И. и Джонатан Вайнщайн, 2009 г., „Нееднозначната литература за отклонение: критична оценка“, икономика и философия, 25: 249–284. [al-Najjar and Weinstein 2009 достъпни онлайн (pdf)]
  • Allais, Maurice, 1953, „Le Comportement de l’Homme Rationnel devant le Risque: Critique des Postulats et Axiomes de l’Ecole Américaine“, Econometrica, 21: 503–546.
  • Anscombe, FJ, 1963, “Последователни медицински изпитвания”, сп. Американска статистическа асоциация, 58: 365–383.
  • Anscombe, FJ и Robert J. Aumann, 1963, „Определение на субективната вероятност“, Annals of Mathematical Statistics, 34: 199–204.
  • Бен-Хаим, Яков, 2001, Теория на информационните пропуски: Решенията при сериозна несигурност, Лондон: Academic Press.
  • Бермудес, Хосе Луис, 2009 г., Предизвикателства пред теорията на решенията, Оксфорд: University of Oxford.
  • Binmore, Ken, 2009, Рационални решения, Принстън, Ню Джърси: Princeton University Press.
  • Болкер, Итън Д., 1966, „Функции, наподобяващи коефициенти на мерките“, Трансакции на Американското математическо дружество, 124: 292–312.
  • –––, 1967, „Едновременна аксиоматизация на полезността и субективната вероятност“, Философия на науката, 34: 333–340.
  • Брадли, Ричард, 1998, „Теорема на представянето за теория на решението с условни условия“, Синтез, 116: 187–222
  • –––, 2004 г., „Теорема на представителството на Рамзи“, Диалектика, 4: 484–497.
  • –––, 2007, „Единна байесова теория на решенията“, теория и решение, 63: 233–263.
  • Брадли, Ричард и Х. Ори Стефанссон, 2016, „Противопоказателна желателност“, Британски журнал за философия на науката, в пресата.
  • –––, 2016, „Желание, очакване и инвариантност“, ум, в пресата.
  • Broome, John, 1991a, Претегляне на стоки: равенство, несигурност и време, Оксфорд: Блеквел.
  • –––, 1991b, „Структурата на доброто: теория на решението и етика“, в „Основи на теорията на решенията“, Майкъл Бачарах и Сюзън Хърли (редактори), Оксфорд: Блеквел, стр. 123–146.
  • –––, 1991c, „Желание, вяра и очакване“, Ум, 100: 265–267.
  • –––, 1993, „Може ли Humean да бъде умерен?“, В „Стойност, благополучие и морал“, GR Frey и Christopher W. Morris (ред.), Cambridge: Cambridge University Press. с. 51–73.
  • Buchak, Lara, 2013, Риск и рационалност, Oxford: Oxford University Press.
  • –––, предстояща „Теория на решенията“в Наръчника за вероятността и философията на Оксфорд, Кристофър Хичкок и Алън Хаджек (ред.), Оксфорд: Оксфордски университет прес.
  • Бирн, Алекс и Алън Хаек, 1997, „Дейвид Хюм, Дейвид Люис и теория на решенията“, Ум, 106: 411–728.
  • Чанг, Рут, 2002, „Възможността за честност“, Етика, 112: 659–688.
  • Colyvan, Mark, Damian Cox и Katie Steele, 2010, „Моделиране на моралното измерение на решенията“, Noûs, 44: 503–529.
  • Дитрих, Франц и християнски списък, 2013, „Основана на разума теория на рационалния избор“, Noûs, 47: 104–134.
  • –––, 2015, „Изборът, основан на разума и контекстната зависимост: обяснителна рамка“, икономика и философия, в печата.
  • –––, 2015, „Ментализмът срещу бихевиоризмът в икономиката: перспектива на философията на науката“, икономика и философия, в печата.
  • Дрейер, Джеймс, 1996, „Рационални предпочитания: Теория на решенията като теория на практическата рационалност“, Теория и решение, 40: 249–276.
  • Elster, Jon и John E. Roemer (ред.), 1993 г., Междуличностни сравнения на благополучието, Cambridge: Cambridge University Press.
  • Gärdenfors, Peter and Nils-Eric Sahlin, 1982, „Вероятности за ненадеждност, поемане на риск и вземане на решения“, препечатани в P. Gärdenfors и N.-E. Sahlin (ред.), 1988, Решение, Вероятност и полезност, Кеймбридж: Cambridge University Press, 313–334.
  • Gilboa, Itzhak и David Schmeidler, 1989, „Maxmin очакваше полезност с нееднозначен приоритет“, Journal of Mathematical Economics, 18: 141–153.
  • Good, IJ, 1967, „На принципа на пълните доказателства“, Британско списание за философия на науката, 17: 319–321.
  • Гуала, Франческо, 2006, „Опроверга ли се теорията на игрите?“, Сп. „Философия“, 103: 239–263.
  • –––, 2008, „Парадигматични експерименти: Играта на ултиматум от тестване до измервателно устройство“, Философия на науката, 75: 658–669.
  • Густафсон, Йохан Е., 2010, „Помпа за пари за ациклични интрансивни предпочитания“, Диалектика, 64: 251–257.
  • –––, 2013 г., „Нерелевантността на диахроничния аргумент на паричната помпа за ацикличност“, сп. „Философия“, 110: 460–464.
  • Хайек, Алън и Филип Петтит, 2004 г., „Желание отвъд вярването“, австралийско списание по философия, 82: 77–92.
  • Халперн, Джоузеф Й., 2003, Изложение на несигурността, Кеймбридж, МА: MIT Press.
  • Хамънд, Питър Дж., 1976, „Промяна на вкусовете и последователния динамичен избор“, Преглед на икономическите изследвания, 43: 159–173.
  • –––, 1977 г., „Динамични ограничения на метастатичния избор“, Economica 44: 337–350.
  • –––, 1988a, „Теория на правилното решение: коментар на професор Зайденфелд“, Икономика и философия, 4: 292-297.
  • –––, 1988b, „Консеквенциализъм и аксиома за независимост“, в риск, решение и рационалност, BR Munier (съст.), Dordrecht: D. Reidel.
  • –––, 1988c, „Конвенционални основи за теория на очакваната полезност“, Теория и решение, 25: 25–78.
  • Хаусман, Даниел М., 2011, „Грешки относно предпочитанията в социалните науки“, Философия на социалните науки, 41: 3–25.
  • Хейп, Шон Харгрийвс, Мартин Холис, Брус Лайънс, Робърт Сугден и Алберт Уайл, 1992, Теория на избора: Критично въведение, Оксфорд: Блеквел издатели.
  • Хил, Брайън, 2013, „Доверие и решение“, Игри и икономическо поведение, 82: 675–692.
  • Джаксън, Франк и Майкъл Смит, 2006, „Абсолютистки теории на морала и несигурност“, сп. „Философия“, 103: 267–283.
  • Джефри, Ричард К., 1965 г., "Логиката на решението", Ню Йорк: МакГрау-Хил.
  • –––, 1974 г., „Предпочитания сред предпочитанията“, сп. „Философия“, 71: 377–391.
  • –––, 1983, „Байезианство с човешко лице“, в Тестване на научни теории, Джон Ърман (съст.), Минеаполис: Университет на Минесота Прес, стр. 133–156.
  • Джойс, Джеймс М., 1998, „Непрагматична обосновка на вероятността”, Философия на науката 65: 575–603.
  • –––, 1999, Основите на теорията за причинно-следствените решения, Ню Йорк: Cambridge University Press.
  • –––, 2002, „Леви върху теорията за причинно-следствените решения и възможността да се предскаже собствените действия“, Философски изследвания, 110: 69–102.
  • –––, 2010 г., „Защита на неточните достоверности в извода и вземането на решения“, Философски перспективи, 24: 281–323.
  • Кадане, Джоузеф Б., Марк Дж. Шервиш и Теди Зайденфелд, 2008, „Близостта на невежеството?“, Сп. „Философия“, 105: 5–36.
  • Кини, Ралф Л. и Хауърд Райфа, 1993 г., Решения с множество цели: Предпочитания и стойностни компромиси, Кеймбридж: Cambridge University Press.
  • Klibanoff, Peter, Massimo Marinacci и Sujoy Mukerji, 2005, „Гладък модел на вземане на решения под двусмислие“, Econometrica, 73: 1849–1892.
  • Найт, Франк, 1921, Риск, Несигурност и печалба, Бостън, Масачузетс: Хауфтън Мифлин компания.
  • Крепс, Дейвид М., 1988, Бележки за теорията на избора, Боулдър, Колорадо: Westview Press.
  • Леви, Исак, 1986, Труден избор: Вземане на решение при неразрешен конфликт, Кеймбридж: Cambridge University Press.
  • –––, 1991, „Консеквенциализъм и последователен избор“, в „Основи на теорията на решенията“, M. Bacharach и S. Hurley (ред.), Oxford: Basil Blackwell, стр. 70–101.
  • Люис, Дейвид, 1988, „Желание като вяра”, Ум, 97: 323–332.
  • –––, 1996, „Желание като вяра II“, Ум, 105: 303–313.
  • Лоумс, Греъм и Робърт Сугден, 1982 г., “Теория на съжалението: Алтернативна теория на рационалния избор при несигурност”, Икономически вестник, 92: 805–824.
  • Machina, Mark J., 1989, „Динамична последователност и непредвидени полезни модели на избор при несигурност“, сп. „Икономическа литература“, 27: 1622–1668.
  • Maher, Patrick, 1992, “Диахронична рационалност”, Философия на науката, 59: 120–141.
  • Мандлър, Майкъл, 2001, „Труден избор в теорията на предпочитанията: Рационалността предполага пълнота или транзитивност, но не и двете“, в разновидности на практическо разсъждение, Илия Милграм (изд.), Кеймбридж, МА: MIT Press, стр. 373–402.
  • McClennen, Edward F., 1988, „Подреждане и независимост: коментар за професор Seidenfeld”, Икономика и философия, 4: 298–308.
  • –––, 1990 г., Рационалност и динамичен избор: основополагащи изследвания. Cambridge: Cambridge University Press.
  • Peterson, Martin, 2009, Въведение в теорията на решенията, Кеймбридж: Cambridge University Press.
  • Петтит, Филип, 1993, „Теория на решенията и народна психология“, в „Основи на теорията на решенията“: Проблеми и напредъци, Майкъл Бакарач и Сюзън Хърли (ред.), Оксфорд: Блеквел, стр. 147–175.
  • Рабинович, Wlodek, 1995, „Да си вземеш тортата и да я ядеш, твърде: последователен избор и нарушения на очакваните полезности“, сп. „Философия“, 92: 586–620.
  • –––, 2000, „Стабилност на предпочитанията и заместване на индивидите: възвръщане на Зайденфелд“, Теория и решение, 48: 311–318.
  • –––, 2002, „Дали практическото съзнание изтласква самопредсказването?“, Erkenntnis, 57: 91–122.
  • Ramsey, Frank P., 1926/1931, "Истина и вероятност", в "Основи на математиката и други логически есета", RB Braithwaite (ed.), Лондон: Kegan, Paul, Trench, Trubner & Co., стр. 156– 198.
  • –––, 1990, „Тегло на стойността на знанието“, Британско списание за философия на науката, 41: 1–4.
  • Resnik, Michael D., 1987, Choices: Въведение в теорията на решенията, Минеаполис: University of Minnesota Press.
  • Савидж, Леонард Дж., 1954, Основите на статистиката, Ню Йорк: Джон Уайли и синове.
  • Schervish, Mark J., Teddy Seidenfeld, Joseph B. Kadane, и Isaac Levi, 2003, „Разширения на теорията на очакваната полезност и някои ограничения на двойни сравнения“, Proceedings of 3rd ISIPTA (JM), 496–510.
  • Seidenfeld, Теди, 1988a, „Теория на решенията без„ независимост “или без„ подреждане “, Икономика и философия, 4: 309–315.
  • –––, 1988b, „Възвръщане [на Хамънд и Макленлен]”, Икономика и философия, 4: 309–315.
  • –––, 1994, „Когато нормалните и обширни формални решения се различават“, Логика, методология и философия на науката, IX: 451–463.
  • –––, 2000а, „Замяна на безразличните опции при избор на възли и допустимост: отговор на Рабинович“, Теория и решение, 48: 305–310.
  • –––, 2000b, „Постулатът за независимост, хипотетичните и призованите действия: допълнителен отговор на Рабинович“, Теория и решение, 48: 319–322.
  • Sen, Amartya, 1973, „Поведение и концепция за предпочитание“, Economica, 40: 241–259.
  • –––, 1977 г., „Рационални глупаци: Критика на поведенческите основи на икономическата теория“, Философия и публични въпроси, 6: 317–344.
  • Skyrms, Brian, 1993, „Грешка в аргументите на динамичната кохерентност?“, Философия на науката, 60: 320–328.
  • Stalnaker, Robert C., 1987, Enquiry, Cambridge, MA: MIT Press.
  • Steele, Katie S., 2010, „Какви са минималните изисквания за рационален избор ?: Аргументи от настройката на последователното решение“, Теория и решение, 68: 463–487.
  • Stefánsson, H. Orri, 2014, „Желания, вярвания и условно желание“, Synthese, 191: 4019–4035.
  • Suppes, Patrick, 2002, Представяне и инвариантност на научните структури, Stanford, CA: CSLI Publications.
  • Temkin, Larry, 2012, Преосмисляне на доброто: Морални идеали и естеството на практическото разсъждение, Оксфорд: University Oxford Press.
  • Tversky, Amos, 1975 г., „Критика на теорията на очакваната полезност: описателни и нормативни съображения“, Erkenntnis, 9: 163–173.
  • Villegas, C., 1964, „За качествена вероятност (sigma) - Алгебри“, Annals of Mathematical Statistics, 35: 1787–1796.
  • фон Нойман, Джон и Оскар Моргенстерн, 1944 г., Теория на игрите и икономическото поведение, Принстън: Принстънски университетски печат.
  • Walley, Peter, 1991, Статистически разсъждения с неточни вероятности, Ню Йорк: Чапман и Хол.
  • Zynda, Lyle, 2000, „Теореми за представяне и реализъм за степените на вярване“, Философия на науката, 67: 45–69.

Академични инструменти

сеп човек икона
сеп човек икона
Как да цитирам този запис.
сеп човек икона
сеп човек икона
Вижте PDF версията на този запис в Дружеството на приятелите на SEP.
inpho икона
inpho икона
Разгледайте тази тема за вписване в интернет философския онтологичен проект (InPhO).
Фил хартия икона
Фил хартия икона
Подобрена библиография за този запис в PhilPapers, с връзки към неговата база данни.

Други интернет ресурси

  • Брадли, Ричард, 2014, Теория на решенията: формално философско въведение.
  • Hansson, Sven Ove, 1994, Теория на решенията: Кратко въведение.

Препоръчано: