Category Archives: Model Thinking

Learning From Data Lecture 8 偏倚和偏差的权衡

Segment 1 偏倚和偏差(Bias and Variances)

权衡的定量化:

由VC理论知:Eout<=Ein

Ein是Eout的一个近似,是针对训练数据拟合的h的样本内误差。

加上一般化误差Ω,这个式子告诉我们由样本内推广到样本外会如何。

偏倚和偏差分析是另一种途径,尝试将误差分解为两个部分,即:

  1. 假说集合H在多大程度上能近似目标函数f
    忽略样本,假设已知f和H,分析H中与f最接近的h与f之间的差距
  2. 能够从假说集合中找到这个h的可能性
    假设已知H中与f最近的f,根据已有的数据,有多大可能选择出这个h

下面的讨论中,将采用实值的目标函数,并用平方误差作为误差测量。

从Eout开始:

通过给定的训练数据集D,挑选出的最终假说g的样本外误差表达式为:

  • Eout(g(D))= EX[(g(D)(x)−f(x))2]

明显地,样本外误差的值依赖于所给定的训练数据集D。

假设现在只限定训练数据集D的样本数量为N,允许生成多个这样的训练数据集,则针对这些不同的训练数据集,可以获得不同的最终假说以及相应的样本外误差。

想要了解与某一给定训练数据集D无关的一般化的样本外误差,在等式两边都加上样本的期望:

  • ED[Eout(g(D))]=ED[EX[(g(D)(x)−f(x))2]]

根据期望迭代定律有:

  • ED[Eout(g(D))]=EX[ED[(g(D)(x)−f(x))2]]

下面主要讨论右边里面只与数据集D有关的这一项:

ED[(g(D)(x)−f(x))2]

平均假说(average hypothesis):

平均假说的定义:

对于一个特定的假说集合H,定义平均假说g(x)为:

g(x)=ED[(g(D)(x)]

g(D)(x)中x是一个给定的数据点,g(D)()是针对不同的训练数据集D挑选出的最终假说,g(D)(x)合起来是这些挑选而出的最终假说在这个给定的数据点X上的函数值ED[(g(D)(x)]是这些函数值的平均值。

如果训练数据集D的数量非常大,那么这个平均期望可能可以非常接近f。

QQ截图20131231153043

下面对ED[(g(D)(x)−f(x))2]进行展开:

ED[(g(D)(x)−f(x))2]=ED[(g(D)(x)−g(x)+g(x)-f(x))2]

=ED[(g(D)(x)−g(x))2+((g(x)-f(x))2+2(g(D)(x)−g(x))((g(x)-f(x))]

考虑到所求的是针对D的期望:

g(x)-f(x)为常数,交叉相乘项的关键在于ED[(g(D)(x)−g(x))]

由差的期望等于期望的差知:

  • ED[(g(D)(x)−g(x))]=ED[g(D)(x)]-ED[g(x)],其中ED[g(D)(x)]=g(x)为常数ED[g(x)]=g(x),两项消除为0

因此得到:

  • ED[(g(D)(x)−f(x))2]=ED[(g(D)(x)−g(x))2]+((g(x)-f(x))2

尝试理解这个式子:

ED[(g(D)(x)−f(x))2]告诉我们的是针对训练数据集D,我们从假说集合H中挑选出的最终假说g与目标函数f之间的差距

我们将其分解为两个部分:

  1. ED[(g(D)(x)−g(x))2]告诉我们的是,我们从假说集合H中挑选出的最终假说g与可能最好的平均假说g之间的差距
  2. ((g(x)-f(x))2是这个可能最佳的平均假说g与目标函数f之间的差距。

偏倚和偏差分别对应于这两者:

  1. 偏差为(var(X)):ED[(g(D)(x)−g(x))2]:是根据训练数据集D选出的最终假说g与平均假说g之间的距离,揭示的是给训练数据集D的影响
  2. 偏倚(bias(X))为:((g(x)-f(x))2: 是假说集合中最好的情况与目标函数之间针对某一个数据点的差距,揭示的是假说集合本身的影响

因此简化最一开始提出的样本外误差表达式:

Eout(g(D))= EX[(g(D)(x)−f(x))2]  = EX[bias(X)+var(X)]

偏差和偏倚权衡:

  • 偏倚:EX[bias(X)]=EX[((g(x)-f(x))2]
  • 偏差:EX[var(X)]=EX[ED[(g(D)(x)−g(x))2]]

以两张图来尝试说明偏倚和偏差之间的权衡

QQ截图20131231154811

上图代表假说集合H的复杂程度较低,假说集合中最好的情况离目标函数的距离可能较大,但是偏差可能较小。

QQ截图20131231154819

上图代表假说集合H的复杂程度较高,假说集合中最好的情况离目标函数的距离可能较小(甚至包含在其内),但是偏差可能较大。

告诉我们:

随着假说集合H的复杂度上升,偏倚减小,偏差增大。

举例说明:

假设目标函数是 f:[-1,+1] –> R, f(x)=sin(πx).

假设我们的训练数据集只含两个数据N=2, D={(x1,y1),(x2,y2)}

假设我们有两个假说集合:

H0为常数,h(x)=b

H1为线性一次函数,h(x)=ax+b

对于H0,挑选g(x)=(y1+y2)/2可以是Ein最小

QQ截图20131231155842

对于H1中挑选g(x)=(y1+y2)/(x1-x2)x+(x1y2-x2y1)/(x1-x2)可以使Ein最小

QQ截图20131231155852

现在要比较这两个假说集合的样本外误差Eout

就相当于是看获得的直线与目标函数对应的曲线之间区域的面积:

QQ截图20131231160801

下面考虑两个假说集合中平均假说分别是什么:

对于H0

下图左边表示的是反复抽取2个数据构成训练数据集D并拟合出的g()的分布情况,右边的绿色直线表示的是这些假说的平均,即g(x)。

g(x)是我们希望能选为最终假说的输出结果,但不一定能够选到它,这依赖于给定的数据集D。

下图右边的阴影部分是正负一个标准差的范围,因此:

蓝色曲线与绿色直线之间的差别代表偏倚,而阴影部分代表偏差。

QQ截图20131231212436

对于H1

下图左边表示的是反复抽取2个数据构成训练数据集D并拟合出的g()的分布情况,右边的红色直线表示的是这些假说的平均,即g(x)。

g(x)是我们希望能选为最终假说的输出结果,但不一定能够选到它,这依赖于给定的数据集D。

下图右边的阴影部分是正负一个标准差的范围,因此:

蓝色曲线与红色直线之间的差别代表偏倚,而阴影部分代表偏差。

QQ截图20131231213519

比较这两个假说集合,可以知道:

H0与H1相比,偏差较小,偏倚较大,下面是两者的具体数值。

QQ截图20131231213917

因此,在给定一个只含两个数据点的训练数据集D的情况下,赢家是H0

给我们的教训:

在机器学习问题中,我们是在模型复杂程度与训练数据集之间做匹配,而非在模型复杂程度与目标函数复杂程度之间做匹配。


Segment 2 学习曲线(Learning Curve)

学习曲线是在一张图表上同时绘制出样本内误差和样本外误差。

下图揭示的是简单模型和复杂模型的学习曲线。

QQ截图20131231214451

对于简单的模型,样本内外误差之间的差距较小,随着训练数据集样本量的增加,最终能达到的样本内误差不低,误差趋近于收敛的速度较快。

对于复杂的模型,样本内外误差之间的差距较大,随着训练数据集样本量的增加,最终能达到的样本内误差较低,误差趋近于收敛的速度较慢。

解读复杂模型的学习曲线:对于样本量较少的情况,复杂的模型是“记忆”住了样本,因此对样本外数据的误差大,只有在样本量足够大的时候,才能打破这个“偏见”而得以能够推广到样本外。

偏倚、偏差分析与VC分析告诉我们的结果是类似的。

QQ截图20131231215404

上图左边是基于VC理论的分析:

  • 蓝色区域代表样本内误差
  • 对于给定的N,做一条垂线,其在两条曲线上交点值之间的距离与一般化误差Ω成正比

上图右边是基于偏倚和偏差的分析:

  • 蓝色区域代表的是偏倚,即g(x)与f(X轴)之间的差距
  • 红色区域代表的是偏差

两种分析都考虑了样本内外误差,区别在于:

基于VC理论的分析中样本内外误差都随着样本量而改变

基于偏倚、偏差的分析中偏倚是常数,由假说集合决定,而偏差则由假说集合以及样本量共同决定

比较容易能理解为什么基于偏倚、偏差的分析的学习曲线的结构,下面举例解释基于VC理论的学习曲线结构。

最后以线性回归做示例:

假设我们尝试去学习的是一个有噪声的线性目标函数:y=wTX+noise

训练数据集为:D = {(x1,y1),…,(xn,yn)}

利用线性回归的正规方程解法,最终假说g中 w=(XTX)-1XTy

样本内误差Ein=Xw-y

对于同样的数据X,利用不同的noise生成y’用于估计样本外误差Eout=Xw-y’

QQ截图20131231221533

由此获得的学习曲线如上图所示。

其中:

  • σ2是样本外误差所能达到的最佳误差情况
  • 样本内误差的期望为:σ2(1-(d+1)/N)
  • 样本外误差的期望为:σ2(1+(d+1)/N)
  • 一般化误差的期望为:2σ2((d+1)/N)

d是假说集合的自由度。

一般化误差的期望值表达式也是上节中对曲线解读的来源。

课程地址:

http://work.caltech.edu/telecourse.html

模型思维 笔记2 隔离和同群效应

涉及的内容:

  1. 谢林模型(Schelling Model)
  2. 格兰诺维特模型(Granovetter Model)
  3. 分类与同群效应比较
  4. 起立鼓掌(Standing Ovation)
  5. 辨识问题(identification problem)

模型的种类:

  • 基于方程的模型(equation based model)
  • 基于主体的模型(agent based model)

0 问题描述

存在这样一种经验现象:经常在一起的一群人,通常外表看上去类似,思维方式和行为方式也类似。模型能够帮助我们理解为什么会有这样的现象。

一个可能的原因是分类(sorting)或者社会学家称之为同质性(homophily),即人们选择与自己类似的人在一起。

下图是底特律的人口普查地图,其中蓝色的点代表的是主要居民为非裔美国人的街区,红色的点代表的是主要居民为白人的街区,可以看出明显的种族隔离,即人们选择住在周围都是与自己类似的人的地方。但注意这是隔离,而非同群效应。

detroit census map

另外一个原因是同群效应(peer effect),人们会改变自己的行为,以适应周围的人。

例如你本来不抽烟,但是你开始经常和一群抽烟的人一起生活,于是你渐渐地开始改变自己,开始抽烟了。

1 谢林模型

谢林模型是经济学家汤姆斯·谢林(Thomas Schelling)开发的一个模型,谢林开发这个模型的目的便是去理解上面所描述的隔离问题,具体而言,谢林所关心的是种族隔离和收入隔离。

Thomas Schelling

下图是根据纽约的人口普查数据绘制的地图:

图片2

其中红点代表白人,蓝点代表非裔美国人聚居的街区,黄点代表拉丁美洲人聚居的街区,绿色代表亚洲人聚居的街区,可以看出按照种族有明显的隔离现象。

下图同样是纽约的地图:

New York Map by

其中红色点代表富人,蓝色代表中产阶级,浅蓝色代表穷人,也可以看出按照收入明显地呈现出隔离。

为了理解这种隔离现象,谢林构建了一个基于主体的模型(agent based model),一个基于主体的模型包含三方面内容:主体(人、企业、国家等),主体所遵从的规则(或主体遵从其规则所表现出的行为),宏观层面的结果。

在谢林模型中,城市被抽象成一个棋盘,棋盘上的每一个格子里可以有人定居,也可以是空白的,红色的格子代表居住的人是富人,灰色的格子代表居住的人是穷人。

QQ截图20130811172033

上图中的X代表的人其周围有7户人家,其中有3户是富人,即3/7的邻居是与其相似的。

谢林模型中所设定的规则是一种基于阀值的规则(threshold based rule),即每一个主体都有一个阀值,主体依据这个阀值作出自己是否进行某项行为的判断。

例如规则可以是:如果有33%的邻居与主体近似,该主体就会留在这个街区,否则的话便会搬家。假使X按照这个规则做判断,在有3/7的邻居与其类似时不会搬家,如果5号位处的邻居搬走了,代替其的新主人是一个穷人,则X身边只有2/7的邻居与其类似,2/7小于33%,于是X会搬走。

QQ截图20130811172048

下面是在netlogo中编写的谢林模型,这是随机初始化生成的情况,黄色代表富人,蓝色代表穷人,黑色代表无人居住。

QQ截图20130811172421

所有主体的阀值都是30%。在初始情况下,有16.5%的主体对其居住地方的情况不满意,主体周围邻居与其相似程度为49.7%。如果我们运行模型一段时间,得到下图所示情况:

QQ截图20130811172707

没有主体对其所居住地方的情况不满意,主体周围邻居与其相似程度为72.4%。

有趣的是阀值是主体周围邻居与其的相似度为大于等于30%,最终的结果却是72.4%。

这便是谢林模型所提供地一个深度视角:在宏观层面所观测到的隔离,并没有反映出微观层面主体的行为。

如果我们设置阀值为40%,在netlogo中运行模型的最终结果是80%。

QQ截图20130811173518

如果设置阀值为52%,最终结果是94%。

QQ截图20130811173431

如果设置阀值为80%,则模型可能永远无法收敛。

谢林模型告诉我们微观动机与宏观行为(micromotives <>macrobehavior)可能并不一致。

更多见谢林《微观动机与宏观行为》

谢林模型有的时候也被称为是一种引爆现象(Tipping Phenomena)。因为每当有人搬家时,会导致其他人也搬家。

两种不同类型的引爆:

退出引爆(exodus tip):一个邻居搬离导致主体搬离,如:

图片4

产生引爆(genesis tip):一个新的不相似的邻居搬进,导致主体搬离

图片5

 2 隔离的测量

相异指数(index of dissimilarity)可以被用来测量不同城市的隔离程度,通过构造这样的一个指数,可以帮助我们更好地理解和利用人口普查所获得的数据。

在一个24格的网格上,每一个格子代表10个人,黄色代表穷人,蓝色代表富人,绿色代表一半为富人,一半为穷人。

图片6

12个蓝色格子代表120个富人,6个黄色格子代表60个穷人,6个绿色格子代表30个富人和30个穷人。总数为150个富人和90个穷人。

令:

  • b = 某一区域的富人数量
  • B = 富人的总数量
  • y = 某一区域的穷人数量
  • Y = 穷人的总数量

计算相异指数=|b/B-y/Y|,表示该区域的分布扭曲情况。

假设现在有一个区域中有5个富人3个穷人,计算得|5/150-3/90|=0表示该区域是比较平均的。

在上面的图中:

  • 对于任何一个蓝色的格子,相异指数为|10/150-0/90|=1/15
  • 对于任何一个黄色的格子,相异指数为|0/150-10/90|=1/9
  • 对于任何一个绿色的格子,相异指数为|5/150-5/90|=1/45

总区域的隔离程度为:

(6*1/45+6×1/9+12×1/15)/2=36/45。

对于下面的区域,彻底地隔离

图片7

用相同的方法计算出隔离程度为1

对于下面的区域,彻底地平衡

图片8

用相同的方法计算出隔离程度为0

因此对于36/45的街区,其隔离程度约为0.8。

有了这个相异指数后,我们便可以计算不同的城市的隔离程度:

图片9

费城,隔离程度为0.8

图片10

底特律,隔离程度为0.6

3 同群效应

to be continued

模型思维 笔记1 为什么要用模型?

为什么要学习模型:

  1. 理解模型让人们成为智慧公民(intelligent citizen)
  2. 模型让人更善于思考
  3. 模型能够帮助人们理解和利用数据
  4. 模型能帮助人们做决定、制定战略、制定计划

1 理解模型让人们成为智慧公民

模型是对现实的简化和抽象,乔治·伯克斯(George E.P Box)曾说过:“所有模型都是错误的,但有些是有用的。”(All models are wrong, but some are useful.)

图片1

模型是新的通用语言(Lingua Franca),不仅运用于学术语言中,也运用于商业、政治语言中,运用于各种地方。只要人们希望能将事情做得更好,他们都会使用模型。

美国教育学家罗伯特·梅纳德·哈钦斯Robert Maynard Hutchins)等人,曾倡导一场巨著计划(或称名著运动、名著教育计划),编著了一套称为《伟大观念索引》的书目(Syntopicon:An Index to The Great Ideas),其中列举了一个智慧公民所需要了解的观念。这些众多的观念中有一个是“将你自己系在桅杆上”(tie yourself to the mast 出自于奥德赛),寓意是在诱惑面前你需要管好你自己。荷南·科尔蒂Hernán Cortés)斯烧掉了自己的船,因而他的士兵便无路可退只能向前奋战。

图片9

人类历史上产生了很多有指导意义的谚语,如:“当断不断,必受其患”(He who hesitates is lost),“洞不补,大洞吃苦”(a stitch in time saves nine)又或“人多智广”(two heads are better than one)这些观念在特定情况下都很有价值,但是也可能存在一些其他有价值的观念与之相冲突,例如:“人多反误事”(too many cooks spoil the broth)。问题在于,我们如何做出抉择。

通过构建模型,可以帮助我们做出抉择,因为模型为我们提供了一些条件,在某些条件下,犹豫不决将会导致错失良机,再另外一些条件下,及时补救错误能够避免未来的灾难结果。在某些条件下,“人多智广”,而在另外一些条件下却是“人多反误事”。

模型的作用便是将我们系在桅杆上,具体而言,这个桅杆是逻辑,我们将自己系在逻辑的桅杆上,便能知道怎样的思维方式,怎样的观念对我们解决问题是有用的。

下面是一个经济学的模型,是一个代理的效用函数(Utility Function),这个代理所做的便是最大化收益:

economic model

经济学使用模型,生物学家使用模型:

图片2

社会学中采用模型,帮助我们理解作用、行为的效应:

图片3

政治学也采用模型,例如投票空间模型(Spatial Model of Voting),帮助我们理解人们所做的决定:

图片4

语言学中用模型来理解语言的结构:

图片5

法学中也可以采用模型:

图片6

博弈论(game theory)研究的是策略性行为(strategic behavior),博弈论的各种模型已经被运用于各个领域,实际上整个博弈论学科都是建立在模型的基础之上的。

图片7

下图是菲利普·E·泰特洛克(Philip E. Tetlock)书中的一张在20多年间,收集了上万次人们所做的预测而绘制的图标。横坐标为校准程度,纵坐标为辨识程度。其中刺猬(Hedgehogs)指的是只采用一种模型进行预测的人,狐狸(Foxes)指的是头脑中有许多不同种类模型的人,采用正式模型的人预测的结果最好。

图片3

下图中的布鲁斯·麦斯奇塔(Bruce Bueno de Mesquita)是一位政治学家,他非常擅长使用模型来预测国际关系。

图片2

模型让人们成为智慧公民的另一个原因是,当你学会了一个模型后,可以将其用于其他领域。例如马尔柯夫过程(Markov Process),原本是有关动态过程的模型,但是也被用来分析疾病传播。

模型让人们谦卑,在构建模型的过程中,需要考虑问题的方方面面。

如果我们希望理解这个世界,我们便需要掌握许多正式的模型。

2模型让人更善于思考

模型让人更善于思考,模型帮助人们更有逻辑地思考世界是怎样运作的,这是一个多步骤的过程。

第一步是为各个部分命名(name the parts):

例如我们要构建一个模型分析人们去哪里吃午饭,可能需要考虑到的部分有:

四家不同的餐馆、各个餐馆的菜价、在不同餐馆就餐所需要的时间、餐馆的菜式

需要吃午餐的人、计划花多少钱吃午餐、允许的就餐的时间、就餐者的倾向

第二步是识别各个部分之间的关系(Identify Relationships):

下图是一个简单的博弈论模型,这是一个扩展型的博弈(extensive form game)

图片4

其中的关系是游戏者1作的决定与游戏者2作出的决定,以及不同组合的决定与最终收益之间的关系。

第三步是考虑清楚其中的逻辑(Think through the logic):

直觉感受和符合逻辑的思维结果之间可能会非常不一样。

第四步是归纳式地探索(inductively explore):

探寻在我们构建的模型中改变一些东西会引起怎样的变化,从而归纳式地得出怎样可以更好地达到目标。

第五步是理解结果的类型(Understand Class of Outcomes):

四种不同类型的结果分别是:

  1. 平衡(Equilibrium)
  2. 循环(Cycle)
  3. 随机(Random)
  4. 复杂(Complex)

第六步是确定逻辑边界(Identify logical boundaries):

模型使我们知道在某些特定的条件之下某个结论成立而另一个结论不成立,这里的特定条件便是逻辑边界。

第七步是交流(Communicate):

模型使得我们能够更清楚地与别人交流我们的想法。

3模型能够帮助人们理解和利用数据

无论是自然科学中还是社会科学中,研究者利用模型将研究的对象变成数据,并且利用模型来更好地理解和利用这些数据。

  1. 使用模型可以理解数据中的基本模式
  2. 使用模型可以进行点预测
  3. 使用模型可以进行范围预测
  4. 使用模型可以倒推式地估计过去的情况
  5. 使用为某一问题而构建的模型分析其他问题
  6. 指导数据的收集工作
  7. 估计模型中的隐藏参数
  8. 校准,在构建模型后将其校准成尽可能符合现实世界情况

4模型能帮助人们做决定、制定战略、制定计划

第一、模型是决策助手,帮助人们做出更好的决定:

帮助我们判断什么时候该介入,什么时候不该。

QQ截图20130810094223

上图中是一些金融机构,箭头表示的是这些机构之间的关系,即一家机构经济上的成功对其他机构经济上的成功的依赖程度。假设现在有一场金融危机,这些机构都开始走下坡路,你需要决定要去拯救其中的某一个机构。我们可能会首先选择拯救AIG,因为很多机构都严重依赖AIG的经济状况。

下面让我们看看蒙提霍尔问题(Monty Hall Problem)

图片3

游戏是这样的:假设有三扇门,其中一扇门的后面有奖品,你需要做的是选择一扇门。因为蒙提霍尔知道奖励究竟在哪一扇门背后,他将另外两扇门中间一扇背后没有奖励的门当场打开,然后问你是否要修改你的选择。那么你是否要换呢?

为了要回答这个问题,我们首先要理清游戏的逻辑,我们增加一些门的数量,这有助于我们理清逻辑。

假设你面前有5扇门,分别是红、橙、黄、绿、蓝五种颜色,只有一扇门背后有奖励。

假设你选择了蓝色的那扇门,你获得奖励的几率是1/5。

假设蒙提霍尔为你打开了黄色、橙色和红色的门,背后都没有奖励。那么你是否要换选绿色的门呢?面前只有两扇门蓝色和绿色,其中一扇背后有奖励。

如果你任然选择蓝色,你获奖励的几率仍旧是1/5,但是如果你换成绿色的门,你获得奖励的几率便提高到了1/2。因此你应该换成选择绿色的门。

类似地在原版的蒙提霍尔游戏中,也应该换门,将把获奖的几率由1/3提高到1/2。

第二、比较静态分析(Comparative Statics)

帮助我们判断,如果我们做出某一个决定后会有怎样的改变。

下面是一个经济学模型,比较静态分析意味着你知道从一个平衡移动到另一个平衡。

图片4

图中S代表某样产品的供给曲线(supply curves),D1和D2是两条需求曲线(demand curves),横坐标是数量,纵坐标是价格。

D1、D2与S的交点是平衡点所在,D1与S的平衡点为(Q1,P1),当需求量变大时即需求由D1变化为D2,在新的平衡点(Q2,P2)处,数量和价格都上升了。

第三、反事实(Counterfactuals)

帮助我们思考如果我们不做某一件事,结果会怎样。

在现实世界中,事情只能做一次,但是如果你构建了一个模型,你可以在模型中进行无数次尝试。

图片5

上图是美国联邦政府在2009年4月决定实施一个恢复计划(recovery plan),颜色较淡的一条线是根据模型预测的在不实施该恢复计划情况下的失业率变化,颜色较深的一条线是根据模型所预测的,在实施恢复计划情况下的失业率变化。虽然这个预测可能不准,但是至少帮助你理解这个恢复计划可能会有怎样的效果。

第四、识别和排列杠杆(To identify and rank levers)

如果我们有很多选择,模型可以帮助我们明白哪一个选择影响最大。

QQ截图20130810103920

上图是失败的波及效应(contagion of failure)的网络分析模型,其所显现的是在英国经济如果失败后带来的波及,表明英国是全球经济体系中的一个重要杠杆。

第五、试验设计(experimental design)

为我们开发更好的政策和策略而设计试验。

例如,假使政府要拍卖国内的手机通讯波段,并且希望能获得最大的收益,可以依据模型来设计一个拍卖的试验。

图片6

第六、制度设计(Institutional design)

下图是斯坦利·瑞特(Stanley Reiter)和列奥尼德·赫尔维茨(Leonid Hurwic)。

图片7     hurwicz_postcard

列奥尼德·赫尔维茨曾获得过经济学的诺贝尔奖,其研究领域是机制设计(mechanism design)。

下图是称为蒙特-瑞特图表(Mount-Reiter diagram)

图片9

Θ代表的是环境,例如技术、人们的倾向等;X代表的是结果;θ→f(θ)代表的是社会一致选择(social choice coorespondence)或者是一个社会选择函数,意味着社会的理想结果是什么。问题在于,社会不能得到理想的结果,因为你需要机制M来达到所期望的结果。机制可以是市场、政治制度甚至是官僚制度。其背后的主要观点便是,机制越好,社会越有可能获得接近期望的结果。

我们可以用模型来预测机制的好坏。

第七、帮助选择政策和制度(Help Choose Among Policies and Institutions)

帮助我们在不同的政策和制度之间做出选择。

课程地址:https://class.coursera.org/modelthinking-004