<noframes id="ixm7d"><noframes id="ixm7d"><rt id="ixm7d"><delect id="ixm7d"></delect></rt><noframes id="ixm7d"><rt id="ixm7d"><rt id="ixm7d"></rt></rt><rt id="ixm7d"></rt> <noframes id="ixm7d"><rt id="ixm7d"><delect id="ixm7d"></delect></rt><delect id="ixm7d"></delect><bdo id="ixm7d"></bdo><rt id="ixm7d"></rt><bdo id="ixm7d"></bdo><noframes id="ixm7d"><rt id="ixm7d"><rt id="ixm7d"></rt></rt><rt id="ixm7d"><rt id="ixm7d"></rt></rt><noframes id="ixm7d"><rt id="ixm7d"></rt><noframes id="ixm7d"><rt id="ixm7d"></rt> <noframes id="ixm7d"><rt id="ixm7d"></rt><noframes id="ixm7d"><noframes id="ixm7d"><noframes id="ixm7d"><rt id="ixm7d"></rt><noframes id="ixm7d"><noframes id="ixm7d"><noframes id="ixm7d"><rt id="ixm7d"></rt><noframes id="ixm7d"><rt id="ixm7d"></rt><noframes id="ixm7d"><rt id="ixm7d"></rt><noframes id="ixm7d">

博弈論定義范文

2023-09-22

博弈論定義范文第1篇

摘要：文章提出了在運籌學類課程教學過程中的三種課程思政思路：一是以運籌學大師的人生經歷和追求真理的執著開展人生觀、價值觀教育;二是以中國學者在運籌學領域的貢獻開展文化自信教育;三是以運籌學與人工智能的融合開展時代特征教育。

關鍵詞：運籌學課程;課程思政;人生觀;價值觀;文化自信;時代特征

2020年5月28日，教育部印發《高等學校課程思政建設指導綱要》，全面推進高校課程思政建設?！毒V要》指出，全面推進高校課程思政建設是深入貫徹習近平總書記關于教育的重要論述和全國教育大會精神、落實立德樹人根本任務的戰略舉措，高校要深化教育教學改革，充分挖掘各類課程思想政治資源，發揮好每門課程的育人作用，全面提高人才培養質量。

《綱要》明確了課程思政建設的總體目標和重點內容?！毒V要》提出，課程思政建設要在所有高校、所有學科專業全面推進，圍繞全面提高人才培養能力這一核心點，圍繞政治認同、家國情懷、文化素養、憲法法治意識、道德修養等重點優化課程思政內容供給，提升教師開展課程思政建設的意識和能力，系統進行中國特色社會主義和中國夢教育、社會主義核心價值觀教育、法治教育、勞動教育、心理健康教育、中華優秀傳統文化教育，堅定學生理想信念，切實提升立德樹人的成效。

根據《綱要》的精神，所有的學科專業、所有的課程都需要推動課程思政融入課堂教學建設之中，把思想政治工作貫穿教育教學全過程，實現全程育人、全方位育人。

筆者常年從事運籌學的教學與科研工作，對照《綱要》的要求，從運籌學的歷史脈絡與學科特點中梳理課程思政的落腳點。

運籌學分為最優化與博弈論兩個分支，最優化主要側重于單方面決策實現最優、次優或者滿意求解，博弈論主要側重于多方面交互式決策實現穩定求解，它們都是運籌學不可割裂的核心組成部分。最優化伴隨第二次世界大戰成長，以丹捷格發明的線性規劃單純形算法和康托洛維奇發明的解乘數法為誕生標志，至今已經形成了線性規劃、整數規劃、非線性規劃、對偶理論、動態規劃、圖與網絡、決策理論、存儲論、排隊論、多目標優化等典型的理論板塊。博弈論的誕生與最優化差不多同步，1944年馮·諾依曼和摩根斯坦合著的《博弈論與經濟行為》出版，標志著博弈論成為一門真正的科學理論;1950年納什在博士論文中正式提出了納什均衡的概念，標志著博弈論有了一般意義上的解概念，為博弈論的繁榮發展奠定了最堅實的基礎。1994年，諾貝爾經濟學獎授予納什、澤爾騰和海撒尼三位著名的博弈論大師，標志著博弈論成為核心主流科學。經過幾十年的發展，運籌學已經得到空前繁榮，在多個領域得到廣泛而深入的運用。

當前運籌學在世界范圍內受到學者和民眾的普遍關注，主要基于以下幾個原因：一是運籌學特別是博弈論與諾貝爾經濟學獎的密切關系，使得人們對博弈論充滿了崇敬的心理;二是運籌學特別是博弈論領域的少數學者富有傳奇色彩的人生經歷給了人們茶余飯后的談資;三是運籌學的發展引起了多個領域的革命性變化，在具有智能特征的網絡信息時代，運籌學的作用越來越大，引起了學術界和產業界甚至資本界的高度重視。

總體而言，運籌學還是以數學特征為主的一門綜合性學科，很多學者對數學類和智能類相關的課程思政展開了深入研究[1-5]，為運籌學類課程的課程思政建設提供了很多有力的啟發與證據，但是缺乏對運籌學本身所蘊含的課程思政的剖析。通過對運籌學的梳理以及根據《綱要》的要求，筆者對運籌學類課程教學的課程思政提出如下三個思路：一是以運籌學大師的經歷開展人生觀和價值觀教育;二是以中國學者在運籌學領域的貢獻增強文化自信;三是以運籌學與人工智能的融合感知時代特征脈搏。

一、以運籌學大師的經歷開展人生觀與價值觀教育

運籌學領域的發展是由運籌學大師推動的，比較典型的有：丹捷格、康托洛維奇、馮·諾依曼、納什、澤爾騰、海撒尼、沙普利、奧曼、馬斯金、邁爾斯、梯若爾等，他們的人生經歷和對學問的執著追求對學生的感染是巨大的。

康托洛維奇1912年出生于俄國彼得堡，1926年考入列寧格勒大學數學系，1930年大學畢業，1934年任列寧格勒大學教授，1935年獲博士學位，1938年首次提出求解線性規劃問題的方法——解乘數法，1939年創立了線形規劃理論，對資源最優分配理論做出了貢獻，1949年因在數學研究工作中的成就獲斯大林獎金，1965年因其在經濟分析和計劃工作中應用數學方法的成績而獲列寧獎金。從康托洛維奇的人生經歷來看，這是非常成功的人生。但是他在1939年提出線性規劃的時候，他的理論并沒有受到蘇聯國內的重視，因為是以俄語發表的，并且處于戰爭時期，歐美學術界也并沒有充分了解他的工作，從而導致1947年丹捷格發表了單純形算法后，學術界將“線性規劃之父”以及“運籌學誕生標志”的榮譽堆積在丹捷格身上?？低新寰S奇并沒有對他的學問喪失信心，在1939年的論文發表之后，康托羅維奇開始致力于效果的普遍性研究。通過思考，在二十世紀四十年代上半期他已經寫好了他下一部主要經濟學著作的草稿。但在蘇聯，這部著作直到1959年才出版（直到1965年才被譯成英文）。這部名為《經濟資源的最佳利用》的著作，是一項引人注目的成果?？低辛_維奇把他的線性規劃結構延伸到把經濟作為一個整體的層次上，影子價格的概念被應用到生產過程的所有投入上，包括資本設備的租金和土地及自然資源的租金，他還指出影子價格能夠用來評價對鄰近最優解的計劃的微小調整，這使得迅速地替代比較成為可能。正是由于他的堅持不懈，他的貢獻在1965年后受到世界的普遍認可，1975年與美國經濟學家庫普曼斯共同獲得當年的諾貝爾經濟學獎，成為第一個獲此殊榮的蘇聯經濟學家。

馮·諾依曼出生于匈牙利的富裕家庭，按照傳統，他可以繼承家族的利潤豐厚的銀行事業，但他卻選擇了追求真理、探索未知的學術道路。此時，博弈論已經在歐洲大陸開始萌芽，除了1913年澤梅洛的棋類游戲三擇一定理之外，法國數學家博萊爾針對二人零和博弈發明了一系列的規范術語，包括混合策略的現代化表述，但是博萊爾對二人零和博弈模型怎么定義解概念陷入了困難。1928年，25歲的馮·諾依曼解決了二人零和博弈的解概念的設計問題，提出了博弈雙方的最優策略、博弈的最優策略、博弈的值等概念，并證明了極小極大定理，這是博弈論歷史上具有里程碑意義的重要定理。1944年馮·諾依曼和奧斯卡·摩根斯坦出版了《博弈論與經濟行為》一書，系統總結了博弈論的理論成果以及在經濟學中的應用，標志著博弈論真正成為一門科學理論。以1940年為界，馮·諾依曼在此之前主要研究純粹數學，包括集合論、泛函分析、量子力學的數學原理、遍歷理論等，是馮·諾依曼代數的發明者;在此之后，主要從事應用數學的研究，包括計算機的數學原理、曼哈頓工程的數值計算等，直到生命的最后一刻，他仍然在從事計算機和大腦相關性的研究工作。馮·諾依曼是天才，但最重要的他對學問極度勤奮、極度執著地追求。

博弈論的另一個大師納什的一生充滿了悲劇與傳奇色彩。他在普林斯頓用27頁的博士論文從根本上改變了博弈論的面貌，提出了納什均衡的概念，這是對馮·諾依曼二人零和博弈理論的重大突破，是博弈論中最根本最重要的基礎創新。納什在麻省理工任教期間，在流形的嵌入、橢圓方程的正則化估計方面取得了豐碩的成果，足以支持他獲得數學領域的菲爾茲獎，但是他陷入了長期的與精神分裂的斗爭之中。經過幾十年的斗爭，在家人的照顧和普林斯頓的寬容之下，納什在二十世紀90年代初的精神狀態得到很大緩解。1994年，因其對博弈論領域的根本性貢獻，獲得諾貝爾經濟學獎;2015年，因其對微分幾何、微分方程的根本性貢獻，獲得了阿貝爾數學獎，在領獎歸來的路上，不幸因車禍離世。納什的一生個人充滿了悲劇，但是整個世界的數學和博弈理論卻因他而精彩。

康托洛維奇、馮·諾依曼、納什的經歷可以生動地鼓勵學生：人生的苦難一方面是悲劇，另一方面是寶貴的財富，經歷生死的挫折都能扛過來，沒有任何事能夠阻攔我們的前進;人生貴在專一和持之以恒，在大挫折、大困難中堅持道路自信，一定可以取得輝煌的成就。

二、以中國學者在運籌學領域的貢獻增強文化自信

運籌學是由大師推動發展的，而我們了解的大師大多在西方發達國家作出突出的貢獻。作為一門核心科學，難道中國學者沒有作出貢獻嗎？難道中國人不如西方國家的人？答案是否定的。在歷史上，中國學者不僅對運籌學做出了貢獻，而且是領先西方學者做出了卓越的貢獻;在當代，中國學者依然正在對運籌學作出杰出貢獻，是世界運籌學研究的重要組成力量。

吳文俊先生是世界著名的拓撲學、代數幾何、數學機械化大師，同時他對博弈論在中國的傳播與發展以及博弈論理論方面做出了重要的貢獻[6]。1959年，吳文俊先生發表了新中國第一篇博弈論研究論文《關于博弈理論基本定理的一個注記》，1960年，他寫了關于博弈論的一篇科普性文章《博弈論雜談：（一）二人博弈》，深入淺出介紹了博弈論基本定理的證明，在這篇文章中，他提出田忌賽馬是博弈論的范疇，使得中國寶貴思想文庫中的博弈論思想得以發揚光大。同年，吳文俊先生牽頭編寫了《對策論（博弈論）講義》，這是新中國第一本博弈論教材。

吳文俊先生在博弈論方面最大的貢獻在于，他和他的學生江嘉禾合作在有限策略型博弈上面提出了本質均衡的概念，并給出了其重要的性質和存在性定理。這是中國數學家在博弈論領域最早的貢獻，也是迄今為止最重要的貢獻。

吳文俊和江嘉禾先生的本質均衡的意義不僅如此，更重要的是這個理論開創了納什均衡精煉的先河。納什均衡的精煉主要從擴展型博弈和策略型博弈展開，最著名的工作是1965年澤爾騰針對擴展型博弈提出了子博弈完美納什均衡的概念;針對策略型博弈的精煉，主要是要求博弈在各類型的擾動之下，均衡還應該保持穩定，澤爾騰在1975年提出了策略在擾動下的顫抖手均衡的概念，而吳文俊先生的思想是盈利函數在擾動下的本質均衡的概念。同樣是擾動保持均衡的思想，吳文俊先生比澤爾騰早了13年。1994年，澤爾騰依靠子博弈完美均衡以及顫抖手均衡的貢獻獲得諾貝爾經濟學獎。由于歷史的原因，吳文俊先生的工作在改革開放之前沒有得到應有的重視，在改革開放以后，國外眾多學者引用推廣了吳先生的結果，其中包括馬斯金、梯若爾等諾貝爾經濟學獎獲得者?？梢哉f，吳先生在博弈論領域的結果是世界級的成果。

葉蔭宇先生是國際最知名的運籌學專家之一，發表了多篇在世界范圍內有重大影響的論文，取得了一批重大的理論成果。2005年他被ISI選為在世界范圍內其科技成果被應用最多的科學家之一。葉蔭宇教授多次被邀請為國際重要會議的大會發言者，如2000年和2006年兩次被邀請為數學規劃會議大會發言者，是麻省理工計算機工程系統2002年杰出報告人，第十七屆數學規劃大會的發言者，2007年選為國際工業與應用數學學會優化分會副主席。從這些成就來看，葉蔭宇先生是無比成功的人生，但是在取得這些成就之前，葉先生經歷了最曲折的考驗。葉先生出生于1948年，1966年畢業于華中師大一附中，后下鄉在農村勞動，1978年考上華中科技大學自動控制系，1982年畢業，此時已經34歲了，他有時不我待的緊迫感，毅然赴美留學，在斯坦福大學追隨線性規劃之父丹捷格，1983年獲得碩士學位，1988年獲得工程經濟系統和運籌學博士學位，此時已是40歲“高齡”，按照一般規律，錯過了學術的黃金時間。但是此后20年，葉先生用頑強的毅力和無可辯駁的杰出成果，攻克了一個又一個高峰。2009年，在美國加州圣地亞哥舉辦的運籌管理協會年會上葉蔭宇被授予運籌管理學領域最高獎項-馮·諾依曼理論獎，以表彰其在運籌管理學所作出的巨大貢獻;2012年，葉蔭宇成為國際數學規劃大會Tseng Lectureship 獎的首位獲獎者;2014年，葉蔭宇成為美國應用數學學會三年一度的優化大獎（Optimization Prize）的獲獎者。這些獎，葉先生都是目前為止唯一的或者首個華人獲得者，體現了葉先生無與倫比的創造力。

這些事實說明，中國人無論是在歷史上還是在現在以及將來都已經、正在和即將為運籌學的繁榮發展作出積極貢獻。

三、以運籌學與人工智能的融合感知時代特征脈搏

進入二十一世紀，以深度學習為代表的人工智能理論與系統在多個領域掀起浪潮，人類已經初步跨入了智能時代，可以說智能是這個時代最顯著的脈搏特征。長期以來，我們對于運籌學特別是博弈論的認知停留在它與諾貝爾經濟學獎關系密切這個誤解上面，導致當前的運籌學以及博弈論課程的開設與教學的主要版圖是：大量集中在經濟、商業、管理領域，極少量在數學、計算機領域。這種現狀使得人們在教學的時代性方面具有比較明顯的缺陷，特別是缺乏智能的時代特征。

事實上，運籌學與智能的關系特別密切[7-10]。目前存在幾類有代表性的智能系統。一是以圍棋為主要應用場景，采用監督范式深度學習模型開發的Alpha Go系統;二是以國際象棋、圍棋、日本將棋為主要應用場景，采用強化學習范式深度模型開發的Alpha Zero系統;三是以星際爭霸游戲為主要應用場景的Alpha Star系統;四是以德州撲克為主要場景的Libratus系統。這些系統與背后的模型都和運籌學有著密切的關系。比如Alpha Go，Alpha Zero系統所涉及的模型是利用樹圖構建的完全信息動態博弈，因為描述此類游戲的樹圖規模特別巨大，采用了基于深度學習的蒙特卡洛樹搜索算法來簡化博弈均衡的計算;再比如Libratus系統所涉及的模型是不完全信息動態博弈，其主要構建工具是貝葉斯機制和子博弈之間的平衡，利用蒙特卡洛反事實遺憾最小化規則進行了快速計算。參考任何一本機器學習或者人工智能的教材，最優化與博弈論都最核心的理論。比如我們經常所說的支持向量機就是用兩個平行超平面分割數據集，以這兩個超平面之間的距離最大化為優化目標，盡可能減少誤分率，最終建立的模型是典型的最優化模型，對這個模型運用對偶理論進行計算，就可以建立核學習理論，如果數據具有隨機特征，那么最大似然估計、最大后驗估計、最大熵估計甚至KL散度估計、魯棒估計也都可以構建為最優化模型，然后運用梯度法、牛頓法、內點法實現求解。這些例子表明最優化與博弈論是智能時代背后最重要的數學機理之一。

多位人工智能方面的頂級學者對運籌學非常青睞。如美國國家科學院、國家工程院、藝術與科學學院三院院士Michael I. Jordan呼吁重視運籌學在機器學習中的作用，他在加州伯克利長期開設凸優化類課程。華人唯一的圖靈獎獲得者姚期智院士在清華推動了算法博弈論的研究，培養了幾位頂尖的算法博弈論青年學者。Ian Goodfellow將二人零和博弈模型與深度學習中的生成器、判別器融合產生了著名的生成對抗式網絡模型GAN，被人評價為“最近十年最激動人心的機器學習新思想”。在某種意義上講，擁抱智能時代必須擁抱運籌學。

這些事實說明，運籌學不僅僅在經濟學、管理學等領域具有重要應用，它從來都沒有和時代脫節，在智能時代仍然具有其不可替代的重要性，因此在運籌學的課堂教學中賦予其時代特征有利于學生的成長。

四、運籌學類教學課程思政的總結與展望

教育部印發《高等學校課程思政建設指導綱要》，全面推進高校課程思政建設的舉措為各類型課程開展課程思政教育提供了根本的遵循和依據。運籌學作為理論宏大、內涵豐富、應用廣泛的重要課程群，理所當然要扎實開展課程思政教育。運籌學成型于第二次世界大戰期間，眾多大師在歷史的潮流之中歷經人生的苦難而不妥協，為運籌學宏偉大廈的建立做出了卓越貢獻，這是最好的人生觀、價值觀素材。中國學者并沒有在這個領域落后于人，不僅如此，在某些局部遙遙領先西方學者提出了深邃的思想和理論，在當代運籌學研究的大潮中，也形成了中國特色的研究力量，這證明了中國人在任何領域不僅不會不如人，還會超越別人，有力增強我們的民族自信與文化自信。運籌學并不是正在凋亡的理論，它不僅在歷史上的經濟學領域大放異彩，它還在如火如荼的智能時代具有重要作用，是諸多智能系統和模型背后的數學原理，必將推動運籌學在時代適應性方面具有無與倫比的優勢，有利于學生把握時代脈搏。

參考文獻：

[1]孫曉青，薛秋芳，秦新強.新工科形式下“課程思政”在《線性代數》課程中的體現[J].當代教育實踐與教學研究，2019（13）：48-49.

[2]閻慧臻，劉燕，劉超，等.將思政教育融入高等數學教學模式初探[J].科技視界，2020（16）：101-103.

[3]黃炳超.博弈論在高校思想政治教育中的運用思考[J].金華職業技術學院學報，2014（05）：63-66.

[4]閆睿穎.高校核心價值觀課堂教育路徑探究——基于博弈論的方法[J].廈門城市職業學院學報，2015（02）：86-90.

[5]周家樂，吳騰.思政教育融入專業課課堂的探索與實踐——以《人工智能》課程為例[J].教育現代化，2019（69）：175-176+187.

[6]姜伯駒，等.吳文俊與中國數學[M].上海交通大學出版社，2016.

[7]張宏達，李德才，何玉慶.人工智能與“星際爭霸”：多智能體博弈研究新進展[J].無人系統技術，2019（01）：5-16.

[8]趙美勇，宋思睿.博弈論算法在AI中的應用[J].計算機產品與流通，2019（09）：278.

[9]蔣胤傑，況琨，吳飛.大數據智能：從數據擬合最優解到博弈對抗均衡解[J].智能系統學報，2020，15（01）：175-182.

[10]蘇景佑，易嗣力，彭康杰，等.量子博弈的多機器人追捕合作方法[J].電子技術與軟件工程，2019（10）：92.

博弈論定義范文第2篇

我們首先就會問，什么是博弈論?其實就是研究個體如何在錯綜復雜的相互影響中得出最合理的策略。生活中每個人，其每一個行為如同在一張看不見的棋盤上布一個子，精明慎重的棋手們相互揣摩、相互牽制，人人爭贏，下出諸多精彩紛呈、變化多端的棋局。博弈論是研究棋手們“出棋”著數中理性化、邏輯化的部分，并將其系統化為一門科學。事實上，博弈論正是衍生于古老的游戲或曰博弈如象棋、撲克等。數學家們將具體的問題抽象化，通過建立完備的邏輯框架、體系研究其規律及變化。這可不是件容易的事情，以最簡單的二人對弈為例，稍想一下便知此中大有玄妙：若假設雙方都精確地記得自己和對手的每一步棋且都是最“理性”的棋手，甲出子的時候，為了贏棋，得仔細考慮乙的想法，而乙出子時也得考慮甲的想法，所以甲還得想到乙在想他的想法，乙當然也知道甲想到了他在想甲的想法„ 博弈論怎樣著手分析解決問題，怎樣對作為現實歸納的抽象數學問題求出最優解、從而為在理論上指導實踐提供可能性呢?現代博弈理論由匈牙利大數學家馮·諾伊曼于20世紀20年代開始創立，1944年他與經濟學家奧斯卡·摩根斯特恩合作出版的巨著《博弈論與經濟行為》，標志著現代系統博弈理論的初步形成。

博弈論是指某個個人或是組織，面對一定的環境條件，在一定的規則約束下，依靠所掌握的信息，從各自選擇的行為或是策略進行選擇并加以實施，并從各自取得相應結果或收益的過程，博弈論經過了這么多年的發展已經完善成為一門十分重要的經濟學分支學科，不管是在結構分析還是決策預測等方面都發揮著越來越重要的作用，尤其對于理性人來說懂得如何博弈就顯得越發重要。

下面我說一下我個人的想法。博弈其實就是一種游戲，是如何做出對自己有利選擇的游戲，但又區別于傳統的如體育運動、下棋、打牌等游戲，同時又和這些有些有本質的共同特征，如都有一定的規則，都有一個結果，策略至關重要，同時策略和得益有相互依存性，游戲者不同的策略會帶來不同的結果。這樣看來博弈好像和我們身邊普通的游戲是一樣的，其實這并不奇怪，其實博弈本身的含義就是博弈參與者在一定的規則條件下選擇相應的策略以期獲得足夠的利益的過程，這和傳統的游戲是相通的，如最常見的斗地主，就是在一定的規則下(如連牌至少5張一連等等)，選擇如何出牌(出牌的組合以及出牌的順序等等)而獲勝(當然也可能輸)的過程，這本身就是一個三方博弈的過程。

為了能夠了解博弈的含義，那么下面我們來看一下經典的博弈模型。

需要提到的當然是任何與博弈有關的書籍中都會講到的“囚徒困境”。

囚徒困境的博弈的基本模型是這樣的：警察抓了兩個合伙犯罪的罪犯，但卻缺乏足夠的證據指證他們所犯的罪行。如果其中至少有一個供認犯罪就能確認罪名成立。為了得到所需的口供，警察將這兩名罪犯分別關押以防止他們串供或結成攻守同盟，并給他們同樣的選擇機會：如果他們兩人都拒不認罪，則他們會被以較輕的妨礙公務罪各判一年徒刑;如果兩人中有一人坦白認罪，則坦白者從輕處理，立即釋放，而另一人則將重判8年徒刑;如果兩人同時坦白認罪，則他們將被各判5年監禁。

如果分別用-1，-5和-8表示判刑1年、5年、8年的得益，用0表示被立即釋放的得益，則我們可以用一個特殊的矩陣將這個博弈表示出來，這種矩陣是表示博弈問題的一種常用方法，我們稱這種矩陣為一個博弈的：得益矩陣：

囚徒

1、囚徒2代表兩個博弈方，他們各自都有“坦白”和“不坦白”兩種可選擇的策略;因為這兩個囚徒被隔離開，其中任何一個人在選擇策略時都不可能知道另外一個選擇什么，因此可能兩人做出選擇時間不同，但是在選擇時不知道對方的決定，因此我們在理論上可以看做他們同時做出選擇，那么下面我們就來分析一下，他們會如何選擇呢，如果是其中一個是你，你又會如何選擇呢?

在分析之前我必須要說明一下，我們這里的博弈方是理性的，即他總是考慮自身是否能得到最大的利益，而不是集體得到最大的利益。

例如對于囚徒1來說，囚徒2有坦白和不坦白兩種可能的選擇，假設囚徒2選擇的是“不坦白”，則對囚徒1來說，“不坦白”的得益為-1，坦白的得益為0，那么他肯定會選擇坦白，假設囚徒2選擇的是“坦白”，那么囚徒1坦白的得益為-5，不坦白的得益為-8，他肯定也會選擇坦白。因此在本博弈中，無論囚徒2采用何種策略，只考慮自身利益的囚徒1的選擇是唯一的，那就是“坦白”，因為在另一方的兩種可能選擇的情況下，“坦白”給他自己帶來的得益都是最大的。同樣的，因為囚徒2與囚徒1的情況完全相同，因此囚徒2與囚徒1的決策思路和選擇也會和囚徒1完全一樣，囚徒2在這個博弈中唯一合理的選擇也是“坦白”。所以該博弈的最終結果必然是兩博弈方同時選擇“坦白”策略，同時被判5年。也許你會感到和奇怪，他們怎么都不選擇“不坦白”呢，如果這樣的話他們不是都只判1年刑了嗎?事實上通過上述分析我們知道那是不可能的。除非在兩人串供的基礎上，但我們的前提是他們被分別關押，根本沒有串供的可能。這個結果或許你會感到不能理解，但通過我上述運用博弈知識的分析，你應該清楚了吧，而這也正是博弈論的魅力所在。

下面這個案例是老師在上課時講過的了，我覺得比較有意義的。有5個海盜，他們要分100個金幣，假設他們分別為

1、

2、

3、

4、5，這5個人都非常聰明，都想獲得最多可能的錢，并且絕對理性。就在給出以下分配方案：由1開始說自己的分配方案，如果有超過一半的人同意，那么該分配方案得以實行，如果沒有超過一半的人同意。那么他就被推到海里，由2號說自己的分配方案，同理如果有超過一

半的人同意，那么該分配方案得以實行，如果沒有超過一半的人同意，那么他就被推到海里，接著由

3、4說自己的方案直到只剩下5號一個人，那么現在問：1號應該怎么分配金幣，才能得到最多的金幣，且不被推到海里，我相信現在沒有一個人能夠說出正確答案，即使你知道正確答案，你也不知道為什么會是這樣吧，下面我來告訴正確答案：9

7、0、

1、

2、0，想不到吧，想知道為什么嗎，那么就去學一下博弈論吧。

博弈論畢竟是數學，更確切地說是運籌學的一個分支，談經論道自然少不了數學語言，外行人看來只是一大堆數學公式。好在博弈論關心的是日常經濟生活問題，所以不能不食人間煙火。其實這一理論是從棋弈、撲克和戰爭等帶有競賽、對抗和決策性質的問題中借用的術語，聽上去有點玄奧，實際上卻具有重要現實意義。博弈論大師看經濟社會問題猶如棋局，常常寓深刻道理于游戲之中。所以，多從我們的日常生活中的凡人小事入手，以我們身邊的故事做例子，娓娓道來，并不乏味。我在上面講過了一個“囚徒困境”的例子，我們可以看到，個人理性與集體理性的沖突，各人追求利己行為而導致的最終結局是一個“納什均衡”，也是對所有人都不利的結局。他們兩人都是在坦白與抵賴策略上首先想到自己，這樣他們必然要服長的刑期。只有當他們都首先替對方著想時，或者相互合謀(串供)時，才可以得到最短時間的監禁的結果。“納什均衡”首先對亞當·斯密的“看不見的手”的原理提出挑戰。按照斯密的理論，在市場經濟中，每一個人都從利己的目的出發，而最終全社會達到利他的效果。不妨讓我們

重溫一下這位經濟學圣人在《國富論》中的名言：“通過追求(個人的)自身利益，他常常會比其實際上想做的那樣更有效地促進社會利益。”從“納什均衡”我們引出了“看不見的手”的原理的一個悖論：從利己目的出發，結果損人不利己，既不利己也不利他。兩個囚徒的命運就是如此。從這個意義上說，“納什均衡”提出的悖論實際上動搖了西方經濟學的基石。因此，從“納什均衡”中我們還可以悟出一條真理：合作是有利的“利己策略”。但它必須符合以下黃金律：按照你愿意別人對你的方式來對別人，但只有他們也按同樣方式行事才行。也就是中國人說的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次，“納什均衡”是一種非合作博弈均衡，在現實中非合作的情況要比合作情況普遍。所以“納什均衡”是對馮·諾依曼和摩根斯特恩的合作博弈理論的重大發展，甚至可以說是一場革命。

從“納什均衡”的普遍意義中我們可以深刻領悟司空見慣的經濟、社會、政治、國防、管理和日常生活中的博弈現象。如價格戰、軍奮競賽、污染等等。一般的博弈問題由三個要素所構成：即局中人又稱當事人、參與者、策略等等的集合，策略集合以及每一對局中人所做的選擇和贏得集合。其中所謂贏得是指如果一個特定的策略關系被選擇，每一局中人所得到的效用。所有的博弈問題都會遇到這三個要素。

我上面說到的例子只是博弈論中非常簡單的例子，現代博弈論在納什均衡定理的推動下已經得到了極大的發展，尤其是有限理性博弈

模型更是發展迅速，要想真正理解博弈論那么我們還要很長的一段路要走。

博弈論定義范文第3篇

摘要：大學校園的誠信教育，是高校思想政治教育的重要內容，并直接關系到培養什么樣的人的根本問題。誠信教育離不開誠信教育環境的營造，筆者通過對高校誠信教育環境建設的現狀分析，結合當下一些學?！罢\信驛站”教育環境實踐的現實舉措，進而提出大學生誠信教育環境建設的建議及對策。

關鍵詞：誠信驛站誠信教育環境對策

伴隨著我國高等教育的快速發展，大學生誠信教育已經成為全社會關注的重要話題之一。在社會拜金主義、利己思潮等各種價值觀沖擊下，大學生誠信現狀令人堪憂，考試作弊、論文造假、拖欠助學貸款等誠信缺失現象日益凸顯。如何開展行之有效的大學生誠信教育成為當前高校思想政治工作的重要課題，而誠信教育離不開誠信教育環境的營造，因此，培養大學生誠信品格，必須要重視大學生誠信教育環境的建設。

一、高校誠信教育環境建設的現狀分析

目前，高校對于誠信教育環境建設的重要性認識不足，沒有在校園內形成誠實守信的良好輿論環境，雖然高校通過各類文化建設力求推進校園誠信教育，然而誠信教育文化建設的針對性不強，沒有深入剖析大學生誠信心理的特點與需求，常常無疾而終。此外，由于過多強調大學生誠信道德的“自律”，造成誠信教育法律環境建設滯后，教師也由此忽視了對于大學生誠信言行的引導和約束。分析原因，主要有三：一是思想認識不足，忽視了高校在大學生誠信教育環境建設中的重要作用，僅是片面的將誠信教育歸結為思想政治教師的工作任務;二是投入不夠，由于人力、精力、資金和時間投入不足，制約了環境建設工作的順利開展;三是制度不完善，由于缺乏相應的規章制度，造成誠信教育環境建設存在較大的隨意性，難以實現可持續發展。

二、校園“誠信驛站”對誠信教育環境建設的有益推動

面對大學生誠信缺失問題，各大高校積極采取措施，如：建立誠信檔案，組織無人監考等，以期營造大學校園誠信教育環境?！罢\信驛站”作為河北科技大學理工學院加強大學生誠信教育的鮮活事例，是進一步加強和改進大學生思想政治教育成果的縮影，也是學校積極探索大學生誠信教育活動新方式、新渠道的直觀反映。

自“誠信驛站”開辦兩年里，該驛站以誠信為經營宗旨，以公益為活動目的，在學生們之間產生了一定的影響。學生們考試時作弊現象減少了，生活中拾金不昧的現象也越來越多，同學之間的交往也充滿了誠信。這種無人售貨攤點的形式觸發了學生內心誠信的潛質，以榜樣的力量為引領，固化學生誠信的慣性，對營造良好的誠信教育環境起到了很大的促進作用。

三、大學生誠信教育環境建設的建議及對策

大學生誠信教育環境建設要在吸收和借鑒已有成功經驗的基礎上，以社會主義核心價值觀為指導，遵循“以生為本”的基本原則，秉承創造性、開放性、有效性、連貫性的指導思想，綜合運用建設的多種手段，切實從以下幾個方面開展工作：

1.提高重視程度，拓寬誠信教育開展渠道

高校要堅持“育人為本，德育為先”的原則，通過德育教育，加大大學生誠信教育力度。一方面，通過加大誠信教育內容比重，引導大學生樹立誠信理念;另一方面，充分利用各種教育陣地和教育資源，將誠信教育與校風、學風校園文化建設、社會實踐、學生社團活動等緊密結合，強化大學生誠信意識和參與程度。

2.加大宣傳力度，建構誠信教育輿論氛圍

堅持以“信”立校，以“信”育人，通過大力營造大學生誠信教育輿論氛圍引導大學生對于誠信的選擇與實踐，進而構建“校園誠信亞文化”。輿論代表多數人的心理導向，正確的校園輿論可以使學生清楚的認識自己的價值與行為取向，并用主流的道德要求來規范自己的言行。因此，在誠信校風的形成過程中，高校應正確的輿論導向、唱響時代主旋律，努力使誠信成為學校所有成員的共同價值標準。

3.緊跟時代步伐，占領誠信教育網絡陣地

在信息時代飛速發展的今天，大學生誠信教育的網絡建設，是大學生誠信教育環境的重要組成部分。首先，高?？梢猿浞掷镁W絡平臺，開設誠信教育系列課程，發揮網絡育人的功能。其次，通過網絡管理制度的建立及校園網絡的監控，規范大學生網上誠信行為。最后，加大校園網絡在誠信教育環境建設中的資金、人力等投入，提高網絡誠信教育技術水平，通過開設“誠信論壇”等師生互動專欄，強化誠信教育。

4.增強示范引領，提高校園誠信影響力

在大學校園誠信教育環境建設中，教師肩負著光榮而神圣的使命。教師誠信是指教師在執教過程中，善意行使權利并履行法定義務和道德義務，為人師表、言而有信、以身作則，其一言一行都有很強的示范和引領作用。因此，廣大教師在大學誠信教育環境建設中，要加強師德修養，以身示范，努力在學生中樹立良好的誠信形象，在工作和生活中，“言必行、行必果”，以其特有的人格魅力潛移默化地去感染和影響學生。

以上四個方面密切聯系，相互促進。大學生誠信教育環境建設需要借助一定的手段，創設、改造和優化，作為高校教育者，應該積極構建和完善大學生誠信教育環境，努力提高大學生的誠信意識，規范其一言一行，進而培養祖國建設發展的合格接班人。

參考文獻：

[1]紀安玲.當下大學生誠信缺失原因及教育對策探析.寶雞文理學院學報（社會科學版），2014（6）.

[2]任素梅.大學生誠信教育現狀及對策探索.產業與科技論壇，2014（20）.

[3]蔣云芳.淺談大學生誠信教育缺失的原因及對策.湖北函授大學學報，2014（18）.

[4]吳凌，揭財明，黃警秋.博弈論視角的大學生誠信缺失分析與誠信教育探索.價值工程，2014（30）.

[5]劉麗琴.高校誠信教育長效機制的功能及其構建.柳州師專學報，2014（5）.

【基金項目】2014年河北省教育廳課題《基于“誠信驛站”視域下的大學生誠信教育環境研究》的研究成果，課題編號SZ141077。

作者簡介：

左旭乾（1981-），男，河北石家莊人，職位：科員，職稱：講師，研究方向：思想政治教育。

博弈論定義范文第4篇

雖然中美匯率博弈全面升級，但出現貿易戰導致兩敗俱傷的概率較低，更可能的結果是人民幣緩慢小幅的升值，從而引發二級市場上本幣升值概念股的大幅炒作。

第三只眼看中美匯率博弈

經過一連串的貿易摩擦后，美國國會眾議院于9月29日審議通過了“以貨幣改革促公平貿易法案”；與此同時，中國商務部新聞發言人姚堅明確表示，以匯率為由進行反補貼調查，不符合世貿組織的有關規則。至此，人民幣匯率低估和升值的問題又再一次處于中美兩國經濟博弈的風口浪尖上。

貿易摩擦導致的直接后果就是人民幣升值壓力變大，這在此前的中美貿易摩擦中已經十分明顯。今年上半年，我國貿易順差大幅度下降使人民幣升值壓力減緩，但近期的高順差又使人民幣升值問題再一次引起人們關注。導致人民幣升值壓力的另一個因素是人民幣的升值預期。8月份我國外匯占款2530億元，是繼4月份以來的今年次高點，反映了熱錢向國內流動的跡象，也加速了人民幣幣值上升，另外，國內連續的CPI新高也使加息預期增強，雖然我們認為年內央行不會加息，但這種預期的增強對人民幣升值已經形成現實的壓力。

表面上看，中美雙方在匯率問題上的博弈背后是選票之爭，但從深層次看代表的卻是國家發展模式之爭。相對以往的匯率爭端，這一次中美官員、專家在認識上有所趨近，即單靠人民幣匯率升值無法有效解決貿易不平衡和美國國內失業率的問題，必須采用更加多元化的綜合手段來解決雙邊貿易問題。目前美元兌人民幣已經突破6.7關口并一度達到6.6997，而目前12個月的NDF為6.5535，表明市場對人民幣未來走勢的預期仍在不斷增強。對市場的影響來自于三方面，一是傳統的傳導機制，如升值預期將可能導致熱錢流入，產業方面有利于外幣借款的行業(航空)、進口成本的行業(造紙、鋼鐵)以及人民幣資產升值的行業(金融、地產)等，但應同時考慮國內政策的調控壓力；二是匯率博弈對帶動全球大宗商品上漲，相關產業如有色金屬、農產品、石油石化等可能會有短期刺激；三是多種手段改善貿易關系的影響。

從這個角度出發，我們認為，雖然中美匯率博弈全面升級，但出現貿易戰導致兩敗俱傷的概率較低，更可能是人民幣緩慢小幅的升值。

淘金本幣升值概念股

正是在強烈升值的預期刺激下，上周五金融地產股無視房貸利空出臺反而走出了強勁的大幅攀升行情，而歷來活躍的資源概念股更是早已大行其道，在二級市場上掀起了一連串的炒作熱浪。

從內因的觸發因素分析，我國CP r已經連續3個月上漲，抗通貨膨脹的壓力加大。但當前并不是通過加息這一控制通貨膨脹常用手段的良好時機，因此，通過人民幣小幅升值來緩解通貨膨脹也在情理之中。

從主題投資的角度來看，雖然人民幣在短期內大幅升值的空間不大，但一定程度上的升值是可期的。從中短期來看，人民幣升值的預期將產生結構性的投資機會。

而這次結構性的投資機會將會重點對三類股票帶來正面的影響：一是生產要素依賴于進口，結算多以美元進行的公司及行業，如造紙包裝行業；二是承擔較多外幣負債的企業，其償債壓力將會在人民幣升值中過程中得到降低，如民航業；三是由于人民幣升值預期的增強而導致熱錢大量增加，帶來國內資產價格的上升的受益行業，如房地產、銀行業。而綜合上述幾大因素再加上目前政策層面導向來看，我們認為造紙業、民航業在此次人民幣升值中的投資機會值得關注。

此外，值得重點一提的是石化行業。雖然該板塊在歷次的本幣升值概念股炒作中鮮有表現，但實際上，人民幣升值對石化行業影響總體利大于弊。如果國際原油價格不隨人民幣升值而出現大幅波動，中資石油公司原油進口成本將降低。人民幣每升值1％，中石油和中石化集團盈利可能將分別提升0-1％和5-6％。市場的漠視不代表機會的不存在，石化板塊會否在此次升值大潮中爆出個大冷門，無疑是我們最關注的焦點之一。

博弈論定義范文第5篇

1 兩種競價機制下的進化博弈模型

為討論為簡單起見, 假設某區域電力市場內的發電企業根據設備容量的多少分為2類CK=2}:小企業 (k=1) 和大企業 (k=2) 。它們在競價上網中均有2個競價策略 (N=2) 、報高價 (H) 、報基價 (B) 。按照生產成本報價稱為按基價報價, 則在實行統一出清電價時, 發電商報價博弈的支付矩陣如表1-4所示;在實行PAB電價時, 發電商報價博弈的支付矩陣如表1-5所示。在這個例子中, 所有的競爭者都只考慮當前時段的情況。

表1-1中umMCP, vmMCP (m=1, 2, 3, 4) 表示統一出清電價下, 小企業和大企業的支付, 其中u1MCP

假設如下:

在MCP方式下:在一定的成本下, 當兩類企業都選擇高價策略時, 由于有較高的單位利潤, 兩類都可以獲得高額利潤, 使得u3MCP和v3MCP都較高。

當兩類企業都選擇基價策略時, 由于單位利潤較低, 因而所得支付u2MCP和v2MCP較低。當小企業選擇高價策略, 大企業選擇基價策略時, 市場統一出清價格被抬升, 則此時報基價的大企業所得利潤高于其他情況的相應支付, 同時報高價的小企業所得利潤低于其他情況的相應支付。即v4MCP最大, u1MCP最小。當小企業選擇基價策略, 大企業選擇高價策略時, 市場統一出清價格被抬升, 則此時報高價的大企業所得利潤低于其他情況的相應支付, 同時報基價的小企業所得利潤高于其他情況的相應支付。即v1MCP最小, v1MCP最大。

由此可以得出:

u1MCP

在PAB方式下:對于一定的成本, 由十按報價結算, 選擇高價策略有較高的單位利潤。

當兩類企業都選擇高價策略時, 都可以獲得高額利潤, 使得u4PAB和v4PAB

分別大于其他情況的相應支付。

當兩類企業都選擇基價策略時, 由于單位利潤較低, 因所得支付u2PAB和v2PAB較低。

當小企業選擇高價策略, 大企業選擇基價策略時, 則大企業優先上網, 因而支付u3PAB高于兩類企業都選擇基價策略時大企業的支付v2PAB。而小企業上網電量減少, 因而支付u3PAB低于兩類企業都選擇基價時小企業的支付u2PAB

當小企業選擇基價策略, 大企業選擇高價策略時, 則小企業優先上網, 因而支付支付u3PAB高于兩類企業都選擇基價策略時小企業的支付u2PAB, 而大企業上網電量減少, 因而支付v1PAB低于兩類企業都選擇基價策略時大企業的支付v2PAB。

由此可以得出:

u1PAB

假設P表示小企業群體中使用高價策略的比例, q表示大企業群體中使用高價策略的比例。狀態可表示為:s={ (s1H, s2H) (s1B, s2B) }即:s={ (q, 1-1) , (q, 1-q) }, 可用[0, 1]×[0, 1]區間上的點 (p, q) 來描述, (p, q) 反映了發電商競價進化的動態。r B= (0, 1) 表示發電商以概率1選擇高價策略, r B= (0, 1) 表示發電商以概率1選擇基價策略。

2 兩種競價模式下的發電商支付情況

2.1 在PAB方式下, 發電商的競價ESS由表1-3可得。小企業采用高價策略的支付為:f1 (r H, s) =u4PABq+u1PAB (1-q)

采用基價策略的支付為:f1 (r B, s) =u3PABq+u2PAB (1-q)

平均支付為:f1 (p, s) =pf1 (r H, s) + (1-p) f1 (r B, s)

同理可得大企業的支付為:

f2 (r H, s) =v4PABp+v1PAB (1-p) , f2 (r B, s) =v3PABp+v2PAB (1-p)

平均支付為:

f2 (q, s) =qf2 (r H, s) + (1-q) f2 (r B, s)

假設種群使用某個策略的個體在種群眾所占比例的增長等于該策略的相應致富, 只有一個策略的適應度比群體的平均支付高, 該策略就會發展。因此, 采用高價策略的小企業和大企業的增長率分別為:

同理可得:

q.=q (1-q) [ (v4PAB-v3PAB+v2PAB-v1PAB) P- (v2PAB-v1PAB) ] (1-2)

于是, 發電公司競價系統的進化公式 (1-1) 和公式 (1-2) 組成的系統來描述。公式 (1-2) 表明, 僅當p=0或p= (u2PAB-u1PAB) / (u4PAB-u3PAB+u2PAB-u1PAB) 時, 小企業群體中使用高價策略的小企業所占比例是穩定的。公式 (1-2) 表明, 僅當q=0, 1或p= (v2PAB-v1PAB) / (v4PAB-v3PAB+v2PAB-v1PAB) 時, 大企業群體中使用高價策略的大企業所占的比例是穩定的。因此, 該系統有5個局部平衡點。

對于一個由微分方程系統描述的群體動態, 其均衡點的穩定性是由該系統得到的雅可比矩陣的局部分析得到的。

根據局部穩定分析法對5個均衡點進行穩定性分析, 結果如表1-3

可見5個局部平衡點中有兩個是ESS, 分別是當p=0, q=1=0和p=1, q=1, 即兩類企業都報高價和基價的時候, 發電企業在競爭過程中自發形成穩定狀態。另外, 該企業還有兩個不穩定平衡點和鞍點。

2.2 在MCP方式下, 發電商的競價ESS的求解方法在同PAB方式下發電商的競價ESS求解方法是相同的, 可得:f1 (r H, s) =u3MCPq+u1MCP (1-q)

小企業采用高價策略的支付為:f1 (r H, s) =u3MCPq+u1MCP (1-q)

采用基價策略的支付為:f1 (r B, s) =u4MCPq+u2MCP (1-q)

平均支付為:f1 (p, s) =pf1 (r H, s) + (1-p) f1 (r B, s)

大企業的支付為:

f2 (r H, s) =v3MCPp+v1MCP (1-q) , f2 (r B, s) =v4MCPp+v2MCP (1-p)

平均支付為:f2 (q, s) =qf2 (r H, s) + (1-q) f2 (r B, s)

采用高價策略的小企業和大企業的增量分別為:

即

p.=p (1-p) [ (u3MCP-u4MCP+u2MCP-u1MCP) q+u1MCP-u2MCP]

q.=1 (1-p) [ (v3MCP-v4MCP+v2MCP-v1MCP) p+v1MCP-v2MCP]

雅可比矩陣為:

根據局部穩定分析法此時系統的均衡點有4個: (0, 0) , (0, 1) ; (1, 0) (1, 1) , 根據局部穩定分析法對這4個均衡點進行分析, 結果如表 (1-4) 所示。

可見, 4個局部平衡點中有一個是ESS, 是當p=0, q=0時候, 即兩類企業都報基價的時候, 發電企業在競價過程中自發形成穩定狀態。另外, 該系統一個不平衡點和兩個鞍點。

2.3 在統一出清電價下, 只存在一個ESS, 就是報基價, 這正是

市場想要得到的最理想的狀況, 也就是說, 統一出清電價是一種非常理想的電價機制。而在PAB電價下, 明顯存在兩個ESS, 一個是報高價, 一個是報基價。

綜上所述, 筆者認為單就競價機制而言, 統一出清電價比PAB電價具有更多優越性。而目前西南市場實行的是PAB競價機制, 所以西南電力市場更容易出現價格報的過高的情況, 而事實是西南電力市場兩次運行都出現了價格過高的現象, 且這個因素直接導致了西南電力市場第一次的被迫停運。由此可見, 事實業已證明了PAB競價機制的不足。

上面的結論僅是從機制本身進行分析得出的結論。而在現實中, 統一出清電價競價機制也非如此完美。由于物理條件以及市場機制自身存在的不完善性, 也會出現不易解決的問題。一方面來說當網絡出現堵塞情況時, 無法在電價上體現出不同地區電力供求關系的差別, 會加劇市場投機現象, 使得出清價抬高;另一方面, 電廠為了維持對市場的控制并追求更高的利潤, 會維持資源分布不合理現象的存在, 還可能出現市場操縱行為。目前在試運行的西南電力市場就存在這樣的問題:出清價過高。市場是相同的, 所以同樣在PAB競價機制下也存在著市場力導致價格的進一步抬高, 使得成交價飄升, 造成市場的不穩定。

博弈論定義范文第6篇

1.1 數學建模

數學建模按照通俗意義講是根據實際問題來建立數學模型去解決各種實際問題, 但數學建模并不是生活中所有解決問題方法的代名詞, 它是運用適當的數學理論以及工具找尋問題原型中的內在規律, 建立相應的數學方程或模型去解決求解從而得到最優結果。數學建模理論中需要用到的基礎學科例如最優化、圖論、數理統計、線性代數、微分方程、計算方法、模糊數學及數學軟件包的使用等等, 這都是常見的數學學科。但在實際應用或比賽中, 很多問題的綜合性與抽象性使得數學這門理論學科在應用方面顯得格外艱難, 很多案例都不能具體直觀的建立模型, 特別是對于非數學專業的學生來說, 他們只學過高等數學、概率論等基礎理論, 另外的運籌學與優化問題、泛函分析等專業數學知識并未涉及。另外, 數學專業的學生對其他應用專業的認知和涉及也是非常淺的, 即便數學專業理論知識很扎實, 也不能很好地與其他學科結合應用, 這樣就造成了數學建模的短板, 所以數學建模需要深厚、扎實的數學基礎, 敏銳的洞察力和想象力, 對實際問題的濃厚興趣、廣播的知識面專業型人才與許多應用學科結合應用。近年來, 越來越多的前沿科學與數學建模交叉應用, 例如神經網絡算法、小波分析、圖像處理、博弈理論等等, 因此數學建模廣泛應用于各類現實生活問題中。

1.2 博弈論

博弈論中所指的博弈是指對局中的多個主體都會受其他策略的影響。我們將其稱之為博弈對局。并且在這種博弈對局中, 主體如何做出決策并采取行動這一問題理論化后的產物就是博弈論。

博弈論的定義:多個主體在對局中分別受其他策略的影響, 我們將主體如何進行決策并采取行動這一問題理論化后的產物稱為博弈論。博弈論就是指處于利益關系中的人如何選擇對應的決策。

其實博弈論是由游戲規則理論演變而來的, 在我們日常生活中, 隨處可見的棋牌等不同類型的游戲中, 當然我們也可以將博弈論看作是一個游戲的原型理論, 但不管是哪種形式的游戲都有一個相似之處, 也就是游戲中參與者選擇的策略方式, 我們都知道在任何游戲中, 策略是最重要的, 與其說游戲的輸贏是看運氣的好壞, 還不如說是選擇策略的好壞。在許多軍事策略和市場經濟中, 所謂的競選和談判都和游戲相似, 都是需要依賴提前選好最優的策略, 才可能有較好的結果。博弈論分為合作博弈與非合作博弈, 在現代更多地方提到的是非合作博弈, 并且合作博弈與非合作博弈是互斥的, 二者只能存在其一, 至于合作博弈與非合作博弈在本文中就不再詳細介紹。在非合作博弈中又分為:完全信息靜態博弈、完全信息動態博弈、不完全信息靜態博弈、不完全信息動態博弈。無論在任何一個博弈中, 除了具備滿足博弈過程的四個條件以外, 還要具備能有利用數學建模等專業知識對其進行分析的先前條件。

2 博弈論在數學建模中的應用

在許多的數學建模問題中, 雖然有很多涉及博弈論的實際問題, 但大部分都不能直觀的展示, 解題者不能從問題中清晰的了解其問題指向性, 這就更加需要學生多學習數學建模與博弈論的相關理論。

2.1 提出問題

報童每日早上從報社以a元/份 (批發價) 購進報紙, 以b元/份 (零售價) 在市場出售。若當日售不出去, 回收公司以c元/份 (收購價) 收購 (b>a>c) 。若已知需求分布, 則報童每早應購進多少報紙可使期望收益最大。

2.2 模型假設

報童只帶賣出各個數量報紙的概率大小.設報童每天批進報紙n份, 進價為b元, 賣家為a元, 處理價為c元。

由假設, 報童每賣出一份報紙獲利a-b元, 每處理一份報紙虧損b-c元。當賣出份數r≤n時, 報童獲利 (a-b) r- (b-c) (n元-r) 。由大數定理, 報童每天的平均收入因為每天收入的期望值來表示。

設每天賣出r份報紙的概率為f (r, ) 因而期望收入為:

從而問題轉變為求出進貨量n, 使期望收入G (n) 達到最大。

2.3 求解模型

為了用微積分的方法解決該問題, 將變量連續化, 從而相應的概率函數f (r) 用連續型隨機變量的概率密度p (r) 來表示。于是由連續性隨機變量的數學期望公式:

由極值存在的條件, 對式 () 求導并令其為零, 再由參變量積分的求導公式, 得

整理, 得

即

n再由合比定理, 得

再由概率密度的性質

由于K≤1是一個常數, 當概率密度為已知時, 可由 (9) 計算相應的n.在統計學中n又稱為p-分位數。

數值是賣出一份報紙所造成虧損的比值。這個比值越大, 進報量就應該大一, 如果處理價c變小, 則應該少進一些。

2.4 模型應用

某報停銷售新民晚報, 售價為0.7元, 進價為0.4元, 處理價為0.25元, 銷售量服從參數為0.015的指數分布, 求相應的進貨量n。

采用Mathematica軟件計算積分, 輸入:

得積分值為0.670441, 即進報紙的份數近似為74, 若提高處理價, 處理價調整為0.30元。

輸入:Integrate[E^ (-0.015x) *0.015, {x, 0, 92}]

得積分值為0.748421, 即進貨量為92。

這是一個動態的博弈問題, 通過這個動態的博弈來說明在數學建模的過程中報童選擇進報紙的份數的方案是多樣的, 重點就在于選擇最有利于報童的最優的策略方案解決具體問題, 運用博弈理論的建模案例有很多。本文只研究了對于報童而言最優的策略方, 也可以從報社的最優策略研究?？傊? 數學建模需要用到的專業知識很多, 我們的最優策略是不斷學習更新我們的知識結構。

摘要：本文簡單介紹了博弈論與數學建模的基本定義, 并給出一個數學建模中的實例, 介紹了博弈論在數學建模中的簡單應用, 并給出博弈論的相關理論。

關鍵詞：數學建模,博弈論,動態

參考文獻

[1] 姜啟源.數學模型[M].北京:高等教育出版社, 2003.

上一篇：煤炭企業成本核算范文下一篇：銷售人員基本禮儀范文

91尤物免费视频-97这里有精品视频-99久久婷婷国产综合亚洲-国产91精品老熟女泄火