2.2.2 博弈论的发展过程
近代对于博弈论的研究,开始于策梅洛(Zermelo),波莱尔(Borel)及冯·诺依曼(von Neumann)。
1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统地应用于经济领域,从而奠定了这一学科的基础和理论体系。
1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。纳什在1950年完成的奠定非合作博弈理论发展基础的研究—《n人博弈中的均衡点》,还是他在普林斯顿大学数学系度研究生时的博士论文。此外,莱因哈德·泽尔腾、约翰·海萨尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。
到了20世纪的后半叶,一方面,博弈论在经济学的众多领域(如产业组织学、宏观经济学、人力资源管理、金融理论与股累计贸易理论等)取得了广泛的应用,改变了经济学思考和分析问题的方法,开创了许多新的经济学研究领域,引起了经济学的深刻变革;另一方面对经济学的深入研究,又形成了多姿多彩的博弈论模型,大大推动了博弈论的发展。直到1994年,诺贝尔经济学奖授予三位博弈论专家—纳什(Nash)、泽尔腾(Selten)和海萨尼(Harsanyi)。人们这才发现,博弈论与经济学相互渗透、相互融合是何等的深刻。
从1960年开始,博弈论在不同类型的博弈问题的研究上取得突破性进展。1965年,泽尔腾将纳什均衡的概念引入动态分析,提出了“子博弈精炼纳什均衡”概念。1967年,海萨尼把不完全信息引入到博弈论的研究,提出了“海萨尼转换”的著名方法,定义为“贝叶斯纳什均衡”概念。到20世纪80年代,经济学家在博弈论研究方向方面做出了重要的贡献。最具影响的是1982年克瑞普斯(Kreps)和威尔逊(Wilson)合作发表的论文,把动态分析与不完全信息揉合在一起引入博弈论,提出了“序贯均衡”概念。由于对博弈论的重要贡献,克瑞普斯于1990年获得全美对40岁以下经济学家的最高奖——“克拉克奖”(Clark medal”)。
2.2.3 博弈论的分类
博弈按照其不同的分类方式可以做如下划分:
首先是博弈可以可以分为合作博弈和非合作博弈。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,相反,如果没有,就是非合作博弈。
二是从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈
三是按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。
最后需要说明的是不同人对博弈论的不同理解以及匪类标准的不一致又会有很多其他的分类方式,比如:以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈;以表现形式也可以分为一般型(战略型)或者展开型;以博弈的逻辑基础不同又可以分为传统博弈和演化博弈等等。
当然在不同博弈论下,其博弈的策略与方法也会有所不同,具体的博弈分类及相应的分析方法见下表:
表2-1:博弈的分类及其相应的博弈方法
信息 行动顺序 |
静态 |
动态 |
完全信息 |
完全信息 纳什均衡 |
完全信息动态博弈 子博弈精炼纳什均衡 |
不完全信息 |
不完全信息静态博弈 贝叶斯纳均衡 |
不完全信息动态博弈 精炼贝叶斯纳什均衡 |
第三章 政企低碳博弈的动因分析
3.1 政府低碳博弈动因分析
能源是一个国家经济发展的基础。在全球气候变化的时代,能源是当今世界的一个焦点问题。自20世界70年代全球发生了第一次能源危机后,能源因素在世界政治经济中的作用可以与军事因素的作用相媲美。这种形式推动了世界能源政治的出现和大国之间能源外交的形成。经过数十年,双边及多边能源外交理论与实践得到了迅速的发展。能源外交包括两个方面的内容:一是为保障国家在能源领域中的经济利益而采取的外交行动;二是由于能源因素经常被用来达到某种具体的政治目的。
中国作为世界上人数最多的国家,能源对于一个国家来说是至关重要的,在过去的几十年当中中国的发展虽然取得了巨大的进步,但是在这些进步的背后又是牺牲了多少能源和污染了多少的环境而得来的。未来的30年,中国的工业化、城市化和现代化仍处于加速发展的阶段,也将是能源需求快速增长的时期;13多亿人口的生活质量提高,也会带来能源消耗的快速增长;生产领域、消费领域和流通领域都处于高碳经济的状况,必然导致温室气体的排放,产生一系列政治、经济、外交、生态等严重后果。在这些严峻的挑战下,使得我们的政府必须把推行的低碳模式提高到战略高度。为此,中国政府制定了低碳环境下的经济发展战略和实现途径(如图3-1所示)。
3.2 企业低碳博弈动因分析
由于能源危机的加重以及环境日益恶化,政府会出台相应的政策来限制企业不顾对能源和环境的消极影响而无限制的发展。比如说政府联合有关部门制定相应的碳排放量标准;取缔一些高能耗、高污染的企业;还有对企业进行相应的改造,使其符合国家规定的环保和能耗标准等等。然而这些措施无一例外都会给企业利益造成巨大的伤害,此时,企业也不会坐以待毙,他们会积极的与政府进行沟通,以期能够产生一个令政府和企业双方都有利的方案。
企业要实现正常的运转就必须进行生产,在人力、物力日益增长的今天企业要想能够生存并不断扩大生产就必须保证有足够的利益空间。而足够利益必须保证以最小的成本在运行着企业,当政府强制性要求企业进行改变生产方式,毫无疑问企业需要为此付出一定的成本。既然是无法避免的改革而改革过程又难免会要付出一定的成本,那么企业会想尽一切办法降低这样的成本。据了解碳排放量与成本之间存在着近似的反比关系,即投入的成本越高碳的排放量就会越少;投入的成本越低碳的排放就越高(图3-2)。因此,在企业这一方面当然是希望投入的成本越少越好,这样企业就能获得更多的利益,当然这样的情况是政府不愿意看到的。所以,企业为了腐恶政府的相关政策和规定就会相应的有一定的投入以期能够达到政府的要求,但又不能无限制的投入因为从图像中我们也可以看出来,当投入的成本达到一定值时,碳排量是不变的。因此企业和政府在此博弈过程中都会去寻找一个合适的投入成本点。
图3-2 碳排放量与投入成本之间的关系
如图2-2所示,政府是希望企业能够尽可能的接近点,这样能够保证更低的碳排放量,但却大大增加了企业的成本,一个明智的企业是不会这么做的。相反企业会在保证符合政府规定的排放量后尽可能的选择在点附近,这样会使企业付出尽可能小的成本。
第四章 博弈模型的建立及假设
本文研究的是低碳模式下的政府与企业之间的经济博弈,由于在研究过程中不存在严格占优战略均衡或逐步剔除严格劣战略均衡的博弈,只存在Nash均衡。
4.1 纳什(Nash)均衡定义
定义:在个参与者标准式博弈中,如果对于每一个参与者是针对其他个参与者所选战略的最优反应战略,即
对中的所有都成立,亦即是最优化问题
,
的解,则战略组合称为该博弈的一个纳什均衡。
4.2 假设及博弈矩阵的建立
政府可以看作是社会福利创造者的代表,他和企业一样都是为了追求一定利益的理性行动者,双方在合作中难免会产生利益冲突,因此导致博弈关系的形成。由于该课题研究的问题十分复杂且可变因素太多,在此为了研究方便特对一些复杂多变的条件加以简化,故对博弈模型做出如下假设:
(1)理性的参与者。参与者是指一个博弈中的决策主体,通常又称为参与人或局中人。参与者参加博弈的目的是通过合理选择自己的行动,以期取得最大化自己的收益(或效用)水平。参与者可以是自然人,也可以是企业、团队、国家,甚至是国家组成的集团(如欧盟、OPEC等)对参与者而言,在博弈的过程中,他必须有不同的行动可作应对选择。在博弈的结局中,他能知道或计算出各参与者不同的行动组合产生的效益(或效用)。在此课题中设参与者集合为。其中0代表政府,1代表企业。前者(政府)是低碳生产政策的制定者、监督者,而后者(企业)是具体的低碳制造行动者。在动态博弈的过程中,二者都是理性者,会选择对自己最有利的方案,即以最小的经济投入获得最大的经济利益,并且总是执行能使自己利益最大化的策略。
(2)信息。信息指的是参与者在博弈的过程中能过了解到的和观察到的知识。这些知识包括“自然”的选择,其他参与者的特征和行动等。再次假设所哟的信息政府和企业双方都能够获得,处于理想的透明状态。
(3)战略。战略是参与者如何对其他参与者的行动作出反应的行动规则,它规定参与者在什么时候该选择什么行动。或者说战略是参与者“相机行动方案”。
在博弈过程中,通常用小写的表示参与者的一个特定的战略,用大写表示参与者的所有可以选择战略集合(又称为战略空间)本文中政府有两种策略(图4-4-1所示)一是对企业也的低碳生产技术进行补助,二是对企业不进行任何的补助。对于企业来说也有两种选择一是积极配合政府实施低碳技术改造,二是不管政府是否给予补助都不进行任何的低碳生产模式改造。
表4-2-1:政企低碳博弈矩阵
企业 政府 |
实施 |
不实施 |
补助 |
{ 补助,(实施,不实施)} |
{ 补助,(实施,不实施)} |
不补助 |
{ 不补助,(实施,不实施)} |
{ 不补助,(实施,不实施)} |
(4)成本收益。在博弈过程中,成本收益指的是在一个特定的战略组合下参与者得到的确定的效用或期望效用。通常表现为博弈过程中的各种投入、成本、得失、盈亏等等。在本文中政府为了鼓励企业引进低碳技术会对企业给予一定的补贴假设政府补贴数额为b,当企业按照政府的要求实施了低碳技术的改革是企业生产的产品碳排放量低于政府规定的标准时政府会给予企业单位产品的奖励为,政府为治理单位产品所造成的污染所需的成本为,这些都被视为政府博弈过程中的成本,但是却是企业博弈过程中的收益。而企业生产的产品碳排放量高于政府规定的标准碳排放量,政府会对企业给予一定的处罚,假设单位产品的处罚额为视为政府博弈过程中的收益但却是其一在博弈过意过程中的成本。另外再假设政府规定的单位标准碳排放量为,企业低于政府规定的碳排放量为,高于政府规定的碳排放量为,单位产品创造的社会价值是,企业生产单位产品的成本为,产品的售价为,企业生产产品的数量为,同时企业为了生产低碳产品需要引进先进的低碳生产设备和技术,假设总的成本为。
4.3 博弈收益矩阵
基于对以上的假设可以做出政府和企业之间低碳博弈收益矩阵如下:
表4-3-1:政企双方低碳博弈矩阵
政府 企业 |
实施 |
不实施 |
补助 |
||
不补助 |
4.4 博弈树
为了形象直观的了解到政府和企业双方的博弈关系,通过对以上数据的分析将上面的矩阵转换成下面的博弈树。如图4-4-1所示
图4-4-1 政企低碳博弈树
图中()代表政府(社会)能够得到的净利益,()代表企
业能够获得的净利益。具体的表达式如下:
由于我们假设的是完全信息和博弈双方的完全理性,政府和企业在做出各自的决定时是希望自己的利益能够获得自大化。
在博弈的过程中政府和企业都各自有两种选择方式:首先对政府而言一是可以选择补助企业,鼓励企业积极的进行低碳化改造,在此过程中企业又可以有两种选择,一是企业拿到政府的补助后积极配合政府进行相应的设备、技术、人才等的引进以此来降低产品生产过程中的碳排放量;二是企业在得到政府的补助后不做任何的改进,依然按照原来的生产方式进行产品生产。其次是对政府而言,政府可以选择不对企业做任何补助,在这个过程中企业又会有两种选择方式,一是即使政府不给我企业任何的补助,企业在改造的过程中能获得更多的利益。同时,为了适应社会的发展积极的引进新技术、新工艺来降低产品生产过程中的碳排放量,二是企业从自身的状况出发,当政府没有任何补助时,企业保持原有生产现状,不做任何的改变。