課程設(shè)計---應(yīng)用統(tǒng)計分析模型解決實際問題_第1頁
已閱讀1頁,還剩35頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、<p>  課 程 設(shè) 計</p><p>  2017年 6 月 27 日</p><p><b>  課程設(shè)計任務(wù)書</b></p><p>  課程 《數(shù)學(xué)模型》課程設(shè)計</p><p>  題目 應(yīng)用統(tǒng)計分析模型解決實際問題</p><p>  主要內(nèi)容、基本要

2、求、主要參考資料等</p><p><b>  主要內(nèi)容</b></p><p>  簡單介紹統(tǒng)計分析模型的基礎(chǔ)理論及本文所用的統(tǒng)計分析方法,了解MATLAB軟件和SPSS軟件的功能,進(jìn)一步通過實例來掌握如何應(yīng)用常用的統(tǒng)計分析方法建立數(shù)學(xué)模型及求解。并利用本文所介紹的統(tǒng)計分析方法來求解2005年數(shù)學(xué)建模的“互聯(lián)網(wǎng)+”時代的出租車資源配置問題。</p>&

3、lt;p><b>  課程設(shè)計的要求:</b></p><p>  1.獨(dú)立完成建模,并提交一篇建模論文。</p><p>  2.論文的主要內(nèi)容包括:摘要,問題的提出,問題的分析,模型假設(shè),模型設(shè)計, 模型解法與結(jié)果,模型結(jié)果的分析和檢驗,包括誤差分析、穩(wěn)定性分析等。模型的優(yōu)缺點及改進(jìn)方向。必要的計算機(jī)程序。</p><p>  3.文

4、檔格式:參照《東北石油大學(xué)課程設(shè)計撰寫規(guī)范》和《數(shù)學(xué)模型課程設(shè)計教學(xué)大綱》。</p><p>  4.課程設(shè)計結(jié)束時參加答辯。</p><p><b>  主要參考資料: </b></p><p>  [1]鄒志云,蔣忠海,梅亞楠,宋程.大中城市居民出行強(qiáng)度的聚類分析.交通運(yùn)輸工程與信息學(xué)報,5(2):8-13,2007,6</p>

5、<p>  [2]衡量出租車供求的三大指標(biāo)——里程利用率、車輛滿載率、萬人擁有量.《運(yùn)輸經(jīng)理世界》,2007,(5)</p><p>  [3]王榃.成都市客運(yùn)出租車需求分析.西南交通大學(xué)工程碩士學(xué)位論文,2009,12</p><p>  [4]大連,北京,廣州,杭州,深圳,武漢、南京2013年年鑒</p><p>  [5]韓中庚.數(shù)學(xué)建模方法及其

6、應(yīng)用.北京:高等教育出版社,2005.6</p><p><b>  摘 要</b></p><p>  統(tǒng)計,顧名思義即將信息統(tǒng)括起來進(jìn)行計算的意思,它是對數(shù)據(jù)進(jìn)行定量處理的理論與技術(shù)。統(tǒng)計分析,常指對收集到的有關(guān)數(shù)據(jù)資料進(jìn)行整理歸類并進(jìn)行解釋的過程。</p><p>  統(tǒng)計分析是統(tǒng)計工作中統(tǒng)計設(shè)計、資料收集、整理匯總、統(tǒng)計分析、信息反饋五

7、個階段最關(guān)鍵的一步。如果缺少這一步或這一步做得不好,均將降低統(tǒng)計工作的作用??梢源_切地說,沒有統(tǒng)計分析,統(tǒng)計工作就沒有活力、沒有發(fā)展,也沒有統(tǒng)計工作的地位。所以統(tǒng)計工作者必須學(xué)會寫統(tǒng)計分析,積極地為領(lǐng)導(dǎo)決策服務(wù),這既是統(tǒng)計工作者的職責(zé),也是統(tǒng)計工作的最終目的。</p><p>  本文簡要地介紹了統(tǒng)計分析中的聚類分析和回歸分析的概念和應(yīng)用,以及常用的求解聚類分析和回歸分析的方法,初步了解了統(tǒng)計分析問題的基本思想。

8、此外,本文還簡要介紹了有關(guān)MATLAB和SPSS軟件的功能和特點,以便于用其去處理實際的統(tǒng)計分析問題。在對聚類分析和回歸分析的相關(guān)內(nèi)容做了簡介之后,本文還列舉了聚類分析和回歸分析的相關(guān)實例,并用MATLAB和SPSS軟件對所舉實例進(jìn)行了編程求解,得出了模型的最優(yōu)化配置方案和選擇方案。最后,本文著重的探討了關(guān)于典型統(tǒng)計分析模型“互聯(lián)網(wǎng)+”時代的出租車資源配置的不同時空供求匹配程度的計算。</p><p>  隨著信

9、息科學(xué)的進(jìn)步,統(tǒng)計應(yīng)用的范圍越來越廣,數(shù)據(jù)處理及數(shù)據(jù)采集挖掘的方法呈現(xiàn)出多樣化,統(tǒng)計分析方法也相對復(fù)雜化,專業(yè)化。面對如今的大數(shù)據(jù)時代,統(tǒng)計分析的作用顯得越來越重要,因此我們需要掌握一些常見的統(tǒng)計分析方法,以便于在以后的工作和學(xué)習(xí)中能夠獨(dú)立而有效的處理相關(guān)問題。</p><p>  關(guān)鍵字:統(tǒng)計分析;聚類分析;回歸分析;MATLAB;SPSS </p><p><b>  目 錄

10、</b></p><p>  第1章 統(tǒng)計分析問題基礎(chǔ)理論3</p><p>  1.1統(tǒng)計分析相關(guān)介紹3</p><p>  1.2 MATLAB和SPASS軟件介紹4</p><p><b>  1.3本章小結(jié)6</b></p><p>  第2章 統(tǒng)計分析常用方法簡介7

11、</p><p>  2.1 方法1——聚類分析7</p><p>  2.2 方法2——回歸分析8</p><p>  2.3 本章小結(jié)9</p><p>  第3章 典型實例10</p><p>  3.1 實例1——聚類分析10</p><p>  3.2 實例2——回歸分析1

12、1</p><p>  3.3 本章小結(jié)15</p><p>  第4章 數(shù)學(xué)模型案例16</p><p>  4.1 問題重述16</p><p>  4.2 問題分析17</p><p>  4.3 模型假設(shè)17</p><p>  4.4 符號說明18</p>&

13、lt;p>  4.5 模型建立與求解18</p><p>  4.6 模型評價28</p><p>  4.7 本章小結(jié)29</p><p><b>  結(jié)論30</b></p><p><b>  參考文獻(xiàn)31</b></p><p>  統(tǒng)計分析問題基礎(chǔ)理

14、論</p><p>  統(tǒng)計分析是指運(yùn)用統(tǒng)計方法及與分析對象有關(guān)的知識,從定量與定性的結(jié)合上進(jìn)行的研究活動。它是繼統(tǒng)計設(shè)計、統(tǒng)計調(diào)查、統(tǒng)計整理之后的一項十分重要的工作,是在前幾個階段工作的基礎(chǔ)上通過分析從而達(dá)到對研究對象更為深刻的認(rèn)識。它又是在一定的選題下,集分析方案的設(shè)計、資料的搜集和整理而展開的研究活動。系統(tǒng)、完善的資料是統(tǒng)計分析的必要條件。本文主要介紹了有關(guān)聚類分析和回歸分析的有關(guān)知識,以及MATLAB和S

15、PSS軟件的功能。</p><p><b>  統(tǒng)計分析相關(guān)介紹</b></p><p><b>  聚類分析</b></p><p><b>  一、聚類分析的概念</b></p><p>  聚類分析指將物理或抽象對象的集合分組成為由類似的對象組成的多個類的分析過程。它是一

16、種重要的人類行為。聚類分析的目標(biāo)就是在相似的基礎(chǔ)上收集數(shù)據(jù)來分類。</p><p><b>  二、聚類分析的應(yīng)用</b></p><p>  高維聚類分析已成為聚類分析的一個重要研究方向。同時高維數(shù)據(jù)聚類也是聚類技術(shù)的難點是隨著技術(shù)的進(jìn)步使得數(shù)據(jù)收集變得越來越容易,導(dǎo)致數(shù)據(jù)庫規(guī)模越來越大、復(fù)雜性越來越高,如各種類型的貿(mào)易交易數(shù)據(jù)、Web 文檔、基因表達(dá)數(shù)據(jù)等,它們的

17、維度(屬性)通??梢赃_(dá)到成百上千維,甚至更高。但是,受“維度效應(yīng)”的影響,許多在低維數(shù)據(jù)空間表現(xiàn)良好的聚類方法運(yùn)用在高維空間上往往無法獲得好的聚類效果。高維數(shù)據(jù)聚類分析是聚類分析中一個非?;钴S的領(lǐng)域,同時它也是一個具有挑戰(zhàn)性的工作。目前,高維數(shù)據(jù)聚類分析在市場分析、信息安全、金融、娛樂、反恐等方面都有很廣泛的應(yīng)用。</p><p><b>  1.1.2回歸分析</b></p>

18、<p><b>  一、回歸分析的概念</b></p><p>  回歸分析(regression analysis)是確定兩種或兩種以上變數(shù)間相互依賴的定量關(guān)系的一種統(tǒng)計分析方法。運(yùn)用十分廣泛,回歸分析按照涉及的自變量的多少,可分為一元回歸分析和多元回歸分析;按照自變量和因變量之間的關(guān)系類型,可分為線性回歸分析和非線性回歸分析。如果在回歸分析中,只包括一 個自變量和一個因變量,

19、且二者的關(guān)系可用一條直線近似表示,這種回歸分析稱為一元線性回歸分析。如果回歸分析中包括兩個或兩個以上的自變量,且因變量和自變量之間是線性關(guān)系,則稱為多元線性回歸分析。</p><p>  回歸分析的主要內(nèi)容為:①從一組數(shù)據(jù)出發(fā)確定某些變量之間的定量關(guān)系式,即建立數(shù)學(xué)模型并估計其中的未知參數(shù)。估計參數(shù)的常用方法是最小二乘法。②對這些關(guān)系式的可信程度進(jìn)行檢驗。③在許多自變量共同影響著一個因變量的關(guān)系中,判斷哪個(或哪

20、些)自變量的影響是顯著的,哪些自變量的影響是不顯著的,將影響顯著的自變量選入模型中,而剔除影響不顯著的變量,通常用逐步回歸、向前回歸和向后回歸等方法。④利用所求的關(guān)系式對某一生產(chǎn)過程進(jìn)行預(yù)測或控制?;貧w分析的應(yīng)用是非常廣泛的,統(tǒng)計軟件包使各種回歸方法計算十分方便。</p><p><b>  二、回歸分析的應(yīng)用</b></p><p>  回歸分析是重要統(tǒng)計推斷方法。

21、在實際應(yīng)用中,回歸分析是數(shù)理統(tǒng)計學(xué)與實際問題聯(lián)系最為緊密,應(yīng)用最為廣泛,也是收效最為顯著的統(tǒng)計分析方法;是分析數(shù)據(jù),尋求變量之間關(guān)系有利的工具。隨著科學(xué)技術(shù)的發(fā)展,生物、醫(yī)學(xué)、農(nóng)業(yè)、林業(yè)、經(jīng)濟(jì)、管理、金融、社會等領(lǐng)域的許多事跡新問題提出,有力的推動了回歸分析的發(fā)展。</p><p>  MATLAB和SPASS軟件介紹</p><p>  1.2.1 MATLAB相關(guān)介紹</p>

22、;<p>  MATLAB是美國MathWorks公司出品的商業(yè)數(shù)學(xué)軟件,用于算法開發(fā)、數(shù)據(jù)可視化、數(shù)據(jù)分析以及數(shù)值計算的高級技術(shù)計算語言和交互式環(huán)境,主要包括MATLAB和Simulink兩大部分。</p><p>  MATLAB是matrix&laboratory兩個詞的組合,意為矩陣工廠(矩陣實驗室)。是由美國mathworks公司發(fā)布的主要面對科學(xué)計算、可視化以及交互式程序設(shè)計的高

23、科技計算環(huán)境。它將數(shù)值分析、矩陣計算、科學(xué)數(shù)據(jù)可視化以及非線性動態(tài)系統(tǒng)的建模和仿真等諸多強(qiáng)大功能集成在一個易于使用的視窗環(huán)境中,為科學(xué)研究、工程設(shè)計以及必須進(jìn)行有效數(shù)值計算的眾多科學(xué)領(lǐng)域提供了一種全面的解決方案,并在很大程度上擺脫了傳統(tǒng)非交互式程序設(shè)計語言(如C、Fortran)的編輯模式,代表了當(dāng)今國際科學(xué)計算軟件的先進(jìn)水平。</p><p>  MATLAB和Mathematica、Maple并稱為三大數(shù)學(xué)軟

24、件。它在數(shù)學(xué)類科技應(yīng)用軟件中在數(shù)值計算方面首屈一指。MATLAB可以進(jìn)行矩陣運(yùn)算、繪制函數(shù)和數(shù)據(jù)、實現(xiàn)算法、創(chuàng)建用戶界面、連接其他編程語言的程序等,主要應(yīng)用于工程計算、控制設(shè)計、信號處理與通訊、圖像處理、信號檢測、金融建模設(shè)計與分析等領(lǐng)域。</p><p>  1.2.2 SPSS軟件相關(guān)介紹</p><p>  1984年SPSS總部首先推出了世界上第一個統(tǒng)計分析軟件微機(jī)版本SPSS/P

25、C+,開創(chuàng)了SPSS微機(jī)系列產(chǎn)品的開發(fā)方向,極大地擴(kuò)充了它的應(yīng)用范圍,并使其能很快地應(yīng)用于自然科學(xué)、技術(shù)科學(xué)、社會科學(xué)的各個領(lǐng)域。世界上許多有影響的報刊雜志紛紛就SPSS的自動統(tǒng)計繪圖、數(shù)據(jù)的深入分析、使用方便、功能齊全等方面給予了高度的評價。</p><p>  SPSS的基本功能包括數(shù)據(jù)管理、統(tǒng)計分析、圖表分析、輸出管理等等。SPSS統(tǒng)計分析過程包括描述性統(tǒng)計、均值比較、一般線性模型、相關(guān)分析、回歸分析、對數(shù)

26、線性模型、聚類分析、數(shù)據(jù)簡化、生存分析、時間序列分析、多重響應(yīng)等幾大類,每類中又分好幾個統(tǒng)計過程,比如回歸分析中又分線性回歸分析、曲線估計、Logistic回歸、Probit回歸、加權(quán)估計、兩階段最小二乘法、非線性回歸等多個統(tǒng)計過程,而且每個過程中又允許用戶選擇不同的方法及參數(shù)。SPSS也有專門的繪圖系統(tǒng),可以根據(jù)數(shù)據(jù)繪制各種圖形。</p><p>  SPSS軟件具有以下特點:</p><p

27、><b>  操作簡便</b></p><p>  界面非常友好,除了數(shù)據(jù)錄入及部分命令程序等少數(shù)輸入工作需要鍵盤鍵入外,大多數(shù)操作可通過鼠標(biāo)拖曳、點擊“菜單”、“按鈕”和“對話框”來完成。</p><p><b>  編程方便</b></p><p>  具有第四代語言的特點,告訴系統(tǒng)要做什么,無需告訴怎樣做。只要

28、了解統(tǒng)計分析的原理,無需通曉統(tǒng)計方法的各種算法,即可得到需要的統(tǒng)計分析結(jié)果。對于常見的統(tǒng)計方法,SPSS的命令語句、子命令及選擇項的選擇絕大部分由“對話框”的操作完成。因此,用戶無需花大量時間記憶大量的命令、過程、選擇項。</p><p><b>  功能強(qiáng)大</b></p><p>  具有完整的數(shù)據(jù)輸入、編輯、統(tǒng)計分析、報表、圖形制作等功能。自帶11種類型136個

29、函數(shù)。SPSS提供了從簡單的統(tǒng)計描述到復(fù)雜的多因素統(tǒng)計分析方法,比如數(shù)據(jù)的探索性分析、統(tǒng)計描述、列聯(lián)表分析、二維相關(guān)、秩相關(guān)、偏相關(guān)、方差分析、非參數(shù)檢驗、多元回歸、生存分析、協(xié)方差分析、判別分析、因子分析、聚類分析、非線性回歸、Logistic回歸等。</p><p><b>  數(shù)據(jù)接口</b></p><p>  能夠讀取及輸出多種格式的文件。比如由dBASE、

30、FoxBASE、FoxPRO產(chǎn)生的*.dbf文件,文本編輯器軟件生成的ASCⅡ數(shù)據(jù)文件,Excel的*.xls文件等均可轉(zhuǎn)換成可供分析的SPSS數(shù)據(jù)文件。能夠把SPSS的圖形轉(zhuǎn)換為7種圖形文件。結(jié)果可保存為*.txt及html格式的文件。</p><p><b>  模塊組合</b></p><p>  SPSS for Windows軟件分為若干功能模塊。用戶可以根

31、據(jù)自己的分析需要和計算機(jī)的實際配置情況靈活選擇。</p><p><b>  針對性強(qiáng)</b></p><p>  SPSS針對初學(xué)者、熟練者及精通者都比較適用。并且很多群體只需要掌握簡單的操作分析,大多青睞于SPSS,像薛薇的《基于SPSS的數(shù)據(jù)分析》一書也較適用于初學(xué)者。而那些熟練或精通者也較喜歡SPSS,因為他們可以通過編程來實現(xiàn)更強(qiáng)大的功能。</p>

32、;<p><b>  本章小結(jié)</b></p><p>  本章主要介紹了聚類分析和回歸分析的概念以及他們在實際生活中的廣泛應(yīng)用。并且介紹了將要用到的MATLAB和SPSS軟件的功能和特點,以及他們在實際生活中的用處。</p><p>  第2章 統(tǒng)計分析常用方法簡介</p><p>  2.1 方法1——聚類分析</p&g

33、t;<p>  聚類分析是將樣品或變量按照它們在性質(zhì)上的親疏程度進(jìn)行分類的多元統(tǒng)計分析方法。聚類分析時,用來描述樣品或變量的親疏程度通常有來兩個途徑,一是把每個樣品或變量看成是多維空間上的一個點,在多維坐標(biāo)中,定一點與點,類和類之間的距離,用點與點間距離來描述樣品或變量之間的親疏程度:另一個是計算樣品或變量的相似系數(shù),用相似系數(shù)來描述樣品或變量之間的親屬程度。</p><p>  聚類分析是實用多元

34、統(tǒng)計分析的一個新的分支,聚類分析的功能是建立一種分類方法,他將一批樣品或變量,按照它們在性質(zhì)上的親疏、相似程度進(jìn)行分類。</p><p>  聚類分析的內(nèi)容十分豐富,按其聚類的方法可分為以下幾種:</p><p>  (1)系統(tǒng)聚類法:開始每個對象自成一類,然后每次將最相似的兩類合并,合并后重新計算新類與其他類的距離或相近性測度。這一過程可用一張譜系聚類圖描述。</p>&l

35、t;p>  (2)調(diào)優(yōu)法(動態(tài)聚類法):首先對n個對象初步分類,然后根據(jù)分類的損失函數(shù)盡可能小的原則對其進(jìn)行調(diào)整,直到分類合理為止。</p><p>  (3)最優(yōu)分割法(有序樣品聚類法):開始將所有樣品看做一類,然后根據(jù)某種最優(yōu)準(zhǔn)則將它們分割為二類、三類,一直分割到所需的K類為止。這種方法適用于有序樣品的分類問題,也稱為有序樣品的聚類法。</p><p>  (4)模糊聚類法:利用

36、模糊集理論來處理分類問題,它對經(jīng)濟(jì)領(lǐng)域中具有模糊特征兩態(tài)數(shù)據(jù)或多態(tài)數(shù)據(jù)具有明顯的分類效果。</p><p>  (5)圖論聚類法:利用圖論中最小支撐樹的理論來處理分類問題,創(chuàng)造了獨(dú)具風(fēng)格的方法。</p><p>  (6)聚類預(yù)報法:利用聚類方法處理預(yù)報問題,在多元統(tǒng)計分析中,可以用來做預(yù)報的方法很多,如回歸分析和判別分析。但對一些異常數(shù)據(jù),如氣象中的災(zāi)害性天氣的預(yù)報,使用回歸分析或判別分

37、析處理的效果都不好,而聚類預(yù)報彌補(bǔ)了這一不足,只是一個值得重視的方法。</p><p>  聚類分析根據(jù)對象的不同又分為R型和Q型兩大類,R型是對變量(指標(biāo))進(jìn)行分類,Q型是對樣品進(jìn)行分類。</p><p>  R型聚類分析的目的有以下幾方面:</p><p>  (1)可以了解變量間及變量組合間的親疏關(guān)系;</p><p> ?。?)對變量

38、進(jìn)行分類;</p><p>  (3)根據(jù)分類結(jié)果及它們之間的關(guān)系,在每一類中選擇有代表性的變量作為重要變量,利用少數(shù)幾個重要變量進(jìn)一步作分析計算,如進(jìn)行回歸分析或Q型聚類分析等。</p><p>  Q型聚類分析的目的主要是對樣品進(jìn)行分類。分類的結(jié)果是直觀的,且比傳統(tǒng)的分類方法更細(xì)致、全面、合理。當(dāng)然使用不同的分類方法通常有不同的分類結(jié)果。對任何觀測數(shù)據(jù)都沒有唯一“正確”的分類方法。實際

39、應(yīng)用中,常采用不同的分類方法,對數(shù)據(jù)進(jìn)行分析計算,一邊對分類提供具體意見,并由實際工作者決定所需要的分類數(shù)及分類情況。</p><p>  2.2 方法2——回歸分析</p><p>  多元線性回歸模型的一般形式</p><p>  回歸分析是最靈活最常用的統(tǒng)計分析方法之一,它用于分析一個因變量與一個或多個自變量之間的關(guān)系。特別是用于:(1)定量的描述和解釋相互關(guān)

40、系;(2)估測或預(yù)測因變量的值。 </p><p>  回歸分析方法是在眾多的相關(guān)變量中,根據(jù)實際問題考察其中一個或多個變量與其余變量的依賴關(guān)系。如果只要考察一個變量與其余多個變量之間的相互依賴關(guān)系,我們稱為多元回歸問題。若要同時考察多個因變量與多個自變量之間的相互依賴關(guān)系,我們稱為多因變量的多元回歸問題。</p><p>  多元回歸分析是研究因變量Y與m個自變量的相關(guān)關(guān)系 ,而且總是

41、假設(shè)因變量Y為隨機(jī)變量,而為一般變量。</p><p>  下面我們來看一下多元線性回歸模型的建立。 </p><p>  假定因變量Y與線性相關(guān)。收集到的n組數(shù)據(jù)()(t=1,2,···n)滿足以下回歸模型:</p><p><b>  記</b></p><p><b>  

42、C=,</b></p><p>  則所建回歸模型的矩陣形式為</p><p><b>  或</b></p><p>  并稱它們?yōu)榻?jīng)典多元回歸模型,其中Y是可觀測的隨機(jī)向量,是不可觀測的隨機(jī)向量,C是已知矩陣,是未知參數(shù),并設(shè)n>m,且rank(C)=m+1。</p><p>  在經(jīng)典回歸分析中,

43、我們討論模型中參數(shù)和的估計和檢驗問題。近代回歸分析中討論變量篩選、估計的改進(jìn),以及對模型中的一些假設(shè)進(jìn)行診斷等問題。</p><p><b>  2.3 本章小結(jié)</b></p><p>  本章主要介紹了統(tǒng)計分析問題的聚類分析和回歸分析的概念及其常用的求解方法,了解了他們的基礎(chǔ)思想。并將這兩種分析方法運(yùn)用到第三章和第四章中去解決實際的數(shù)學(xué)問題。</p>

44、<p><b>  第3章 典型實例</b></p><p>  3.1 實例1——聚類分析</p><p>  下面是聚類分析的一個簡單例子。有五個樣品,每個只測量了一個指標(biāo),分別為1,2,6,8,11,我們用最短距離法將它們分類。</p><p>  (1)計算五個樣品兩兩間的距離,得初始類間的距離矩陣,</p>

45、<p>  (2)由知類間最小距離為1,于是將和合并成,并計算和其他類之間的距離,的新的距離陣</p><p>  (3)由知,類間最小距離為2,合并和 為,計算與其他類間的距離得矩陣,</p><p>  (4)由知,類間的最小距離為3,將和合并為,得新的距離矩陣,</p><p>  (5)最后將和合并為,這時五個樣品聚為一類。</p>

46、<p>  3.2 實例2——回歸分析</p><p>  3.2.1數(shù)據(jù)的準(zhǔn)備</p><p>  《中國統(tǒng)計年鑒》把財政支出劃分為31個組成部分。本文只選取2005年我國31個省、市、自治區(qū)的地區(qū)生產(chǎn)總值和13個重要支出項,分別是:為基本建設(shè)支出,為企業(yè)挖潛改造資金,為科技三項費(fèi)用,為農(nóng)業(yè)支出,為農(nóng)林水利氣象等部門事業(yè)費(fèi),為工業(yè)交通部門事業(yè)費(fèi),為流動部門事業(yè)費(fèi),為教育事業(yè)費(fèi),

47、為科學(xué)事業(yè)費(fèi),為衛(wèi)生經(jīng)費(fèi),為行政管理費(fèi),為公檢法司支出,為城市維護(hù)費(fèi)。為地區(qū)生產(chǎn)總值。(數(shù)據(jù)單位為:萬元)</p><p>  3.2.2模型的建立及求解</p><p>  3.2.2.1 模型的建立</p><p>  將13個重要支出項設(shè)為自變量,用表示;將地區(qū)生產(chǎn)總值設(shè)為因變量。采用最小二乘法擬合一個多元線性回歸模型,采用數(shù)學(xué)軟件SPSS計算出回歸系數(shù),運(yùn)行

48、結(jié)果如下表:</p><p>  表3.1 回歸系數(shù)表</p><p>  因而對13個自變量的線性回歸方程為:</p><p>  3.2.2.2模型的檢驗</p><p>  首先,對模型(3.1)進(jìn)行擬合優(yōu)度的檢驗,采用數(shù)學(xué)軟件SPSS計算樣本可決系數(shù)和調(diào)整后的樣本可決系數(shù),運(yùn)行結(jié)果如下表</p><p><

49、;b>  表3.2 模型匯總</b></p><p>  由表3.2可知,模型(3.1)擬合效果很好。</p><p>  然后,對模型(3.1)進(jìn)行顯著性F檢驗,提出原假設(shè):采用數(shù)學(xué)軟件SRSS計算出的方差分析表如下表</p><p>  表3.3 方差分析表</p><p>  表3.3中的Sig.即為顯著性P值,由P值

50、=0.000(近似值),,P值小于,所以,拒絕原假設(shè),認(rèn)為在顯著性水平的條件下,因變量對自變量有顯著的線性關(guān)系,即回歸方程(3.1)是顯著的。</p><p>  最后,對模型(3.1)進(jìn)行回歸系數(shù)的顯著性檢驗,提出原假設(shè)其中 。利用SPSS計算出關(guān)于的t統(tǒng)計量及相應(yīng)的P值,見表3.1。由表我們可以發(fā)現(xiàn)并不是所有的單獨(dú)對因變量都有顯著影響。這說明盡管回歸方程通過了顯著性檢驗,但也會出現(xiàn)某些單個變量對并不顯著的情況

51、。</p><p>  由于某些變量不顯著,因此本文采取后退法[3]簡單的剔除多余變量,由于變量間的交互作用,不能一次性剔除所有不顯著的變量,所以進(jìn)行依次剔除,首先剔除P值最大的一個變量,然后再進(jìn)回歸系數(shù)的顯著性檢驗,如果有不顯著的變量,那么再進(jìn)行剔除,依次下去,知道保留的變量都對有顯著性影響為止。</p><p>  根據(jù)表3.1,我們首先剔除,用剩余變量與進(jìn)行回歸系數(shù)的顯著性檢驗,SP

52、SS運(yùn)行結(jié)果如下表</p><p>  表3.4 回歸系數(shù)表</p><p>  由結(jié)果看,剔除后,剩余變量的顯著性都發(fā)生了變化,仍然有部分變量不顯著,所以繼續(xù)進(jìn)行剔除(由于剔除過程比較繁瑣,在此不一一列出,只列出最終保留的變量)。最終保留的變量為,,,,,,,。將剩余變量與做回歸分析,SPSS運(yùn)行結(jié)果如下表</p><p><b>  表3.5回歸系數(shù)表

53、</b></p><p>  由表3.5建立新的多元線性回歸模型</p><p><b> ?。?.2)</b></p><p>  應(yīng)用SPSS軟件計算樣本可決系數(shù)和調(diào)整后的樣本可決系數(shù),如下表</p><p><b>  表3.6 模型匯總</b></p><p&

54、gt;  由表3.6可知,模型(3.2)擬合效果很好。</p><p>  然后,對模型(3.2)進(jìn)行顯著性F檢驗,采用數(shù)學(xué)軟件SPSS計算出的方差分析表如下表</p><p>  表3.7 方差分析表</p><p>  由P值=0.000(近似值),,P值小于,所以,在顯著性水平的條件下,回歸方程(3.2)是顯著的。</p><p>  

55、經(jīng)過以上算法步驟,新建立的模型(3.2)通過了顯著性檢驗,因此。模型(3.2)為最終確定的模型。</p><p><b>  3.3 本章小結(jié)</b></p><p>  本章主要根據(jù)典型例題更加詳細(xì)的說明了聚類分析和回歸分析的思想,并且利用SPSS軟件對它們的經(jīng)典案例進(jìn)行了編程求解,同時感受到了SPSS在解決數(shù)學(xué)規(guī)劃問題中的強(qiáng)大功能。</p><

56、p>  第4章 數(shù)學(xué)模型案例</p><p>  2015年3月,李克強(qiáng)總理在政府工作報告中指出,要制定“互聯(lián)網(wǎng)+”行動計劃,推動移動互聯(lián)網(wǎng)、云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)等與現(xiàn)代制造業(yè)結(jié)合。2015年7月4日,國務(wù)院印發(fā)了《關(guān)于積極推進(jìn)“互聯(lián)網(wǎng)+”行動的指導(dǎo)意見》,提出著力創(chuàng)新政府服務(wù)模式,夯實網(wǎng)絡(luò)發(fā)展基礎(chǔ),營造安全網(wǎng)路環(huán)境,提升公共服務(wù)水平,并將“互聯(lián)網(wǎng)+”高效物流和“互聯(lián)網(wǎng)+”便捷交通作為其中兩項重點行動。&

57、lt;/p><p>  上世紀(jì)90年代末開始,我國互聯(lián)網(wǎng)蓬勃發(fā)展,形成具有國際先進(jìn)水平的用戶規(guī)模和普及率,并且培育形成了豐富的互聯(lián)網(wǎng)應(yīng)用產(chǎn)品和技術(shù)力量,為我國各行業(yè)融合互聯(lián)網(wǎng),推動技術(shù)進(jìn)步、效率提升和組織變革,提升實體經(jīng)濟(jì)創(chuàng)新力和生產(chǎn)力,打造大眾創(chuàng)業(yè)、萬眾創(chuàng)新,四項經(jīng)濟(jì)提質(zhì)增效升級奠定了技術(shù)、資源條件。事實上,從2014年以來,淘寶、微信、滴滴打車等基于互聯(lián)網(wǎng)(移動互聯(lián)網(wǎng))的新業(yè)態(tài)已經(jīng)在改變著社會經(jīng)濟(jì)的運(yùn)行?;诨ヂ?lián)

58、網(wǎng)平臺的交通運(yùn)輸服務(wù)已延展到客運(yùn)、貨運(yùn)、鐵路、停車、維修、公交、出租汽車、航空等交通行業(yè),熱門手機(jī)APP達(dá)60余個,累計下載量超過50億人次。</p><p>  交通運(yùn)輸作為人類社交活動、商品交易的支撐,不僅對城市建設(shè)和社會發(fā)展具有重要影響力,而且存在與科學(xué)技術(shù)同步發(fā)展的緊密互動關(guān)系。縱觀交通發(fā)展史,每次科學(xué)技術(shù)的進(jìn)步都帶來交通運(yùn)輸方式的改變,交通運(yùn)輸方式的進(jìn)步又支撐起社會經(jīng)濟(jì)發(fā)展、科技進(jìn)步。同時,也注意在交通

59、行業(yè)的發(fā)展變革過程中,每一次新的交通運(yùn)輸方式出現(xiàn),都會伴隨傳統(tǒng)模式與新型模式之間的沖突、轉(zhuǎn)變,運(yùn)輸?shù)男枨蠛凸┙o雙方都需有一個逐漸的轉(zhuǎn)變和相互適應(yīng)過程。本文就出租車供求關(guān)系、資源配置問題利用統(tǒng)計分析相關(guān)知識進(jìn)行了初步的探討。</p><p><b>  4.1 問題重述</b></p><p>  隨著經(jīng)濟(jì)的發(fā)展,近年來,人們對出行的要求不斷提高,城市出租車以其方便、快

60、捷、舒適和私密性的特點成為越來越多人的出行選擇。但是,國內(nèi)各大城市交通問題日趨嚴(yán)重,“打車難”也是人們關(guān)注的一個社會熱點問題。數(shù)據(jù)顯示,包括上海、杭州等眾多大城市,出租車非高峰期的空駛率始終在30%上下徘徊,而高峰期卻打不到車。這與眾多市民反映的打車難背后所隱藏的強(qiáng)烈需求看似形成了一個矛盾。究其原因,最主要的莫過于司機(jī)與乘客需求信息不對稱,缺乏及時溝通交流的平臺。</p><p>  隨著“互聯(lián)網(wǎng)+”時代的到來,

61、有多家公司依托移動互聯(lián)網(wǎng)建立了打車軟件服務(wù)平臺,實現(xiàn)了乘客與出租車司機(jī)之間的信息互通,同時推出了多種出租車的補(bǔ)貼方案,吸引了越來越多的司機(jī)和乘客使用打車軟件。然而,打車軟件同時也導(dǎo)致出租車行業(yè)亂象叢生,存在馬路揚(yáng)招成功率降低、乘客怕司機(jī)接到大單拒載、司機(jī)分心忙于搶單影響行車安全等問題。</p><p>  請你們搜集相關(guān)數(shù)據(jù),建立數(shù)學(xué)模型研究如下問題:</p><p>  問題:試建立合理

62、的指標(biāo),并分析不同時空出租車資源的“供求匹配”程度。</p><p><b>  4.2 問題分析</b></p><p>  “打車難”是人們關(guān)注的一個社會熱點問題。但是,在北京也不是無論何時何地都難打到車。打車難往往出現(xiàn)在特殊時間和地點:上班高峰的住宅區(qū),下班高峰的商務(wù)區(qū),凌晨和深夜的郊區(qū)或偏僻地點,遇到雨雪天氣……</p><p>  “

63、互聯(lián)網(wǎng)+”時代的出租車資源配置是一個十分復(fù)雜的社會問題。要想準(zhǔn)確得出合理的資源配置方案難以實現(xiàn),同時也難以準(zhǔn)確收集大量出租車的各項數(shù)據(jù)如出租車的每天跑單數(shù),收費(fèi),拒載情況等,以及不同城市不同城區(qū)不同時間居民的出行行為特征數(shù)據(jù)。</p><p>  為了建立合理的指標(biāo),分析不同時空出租車資源的供求匹配程度,首先從城市居民出行對出租車的需求量入手,分析與需求量有關(guān)的主要指標(biāo),如城市居民出行量。為分析城市居民出行量與城

64、市經(jīng)濟(jì)指標(biāo)的相關(guān)性,先將這些指標(biāo)進(jìn)行聚類分析,繼而得出每類最具代表性的經(jīng)濟(jì)指標(biāo),再將最具代表性的經(jīng)濟(jì)指標(biāo)與居民出行總量進(jìn)行回歸分析,得到多元線性回歸模型,從而預(yù)測居民的出行總量。通過查閱文獻(xiàn)可以確定居民出行選擇出租車作為出行方式的比例從而,計算得出城市的出租車運(yùn)輸量的需求量。然后根據(jù)供需平衡法預(yù)測出城市出租車需求量。將城市實際出租車數(shù)量與城市出租車需求數(shù)量作比,得到衡量出租車資源的供求匹配程度的指標(biāo)即供求匹配率。對未來城市的出租需求量進(jìn)

65、行灰色關(guān)聯(lián)預(yù)測,得到未來城市的出租需求量,通過計算不同城市的出租車需求量,進(jìn)行不同時空的出租車資源供求匹配的分析。</p><p>  對于各公司的出租車補(bǔ)貼方案是否對“緩解打車難”有幫助問題,由于難以得到各公司不同時間的補(bǔ)貼方案對居民打車難度的實際影響效果數(shù)據(jù),我們從公司對每單的補(bǔ)貼金額入手,分析每單補(bǔ)貼金額范圍為0~15元,認(rèn)為補(bǔ)貼金額再高對公司利益有較大損失。司機(jī)的每日跑單數(shù)為平均每臺出租車每天接單數(shù),有效

66、載客率等效為里程利用率。以每單補(bǔ)貼金額為自變量,司機(jī)的每日跑單數(shù)和有效載客率為因變量,建立阻滯增長模型,基于前面的供求匹配率關(guān)系式算出不同每單補(bǔ)貼金額對應(yīng)的供求匹配率這一指標(biāo)。</p><p>  為一個新的打車軟件服務(wù)平臺設(shè)計合理的補(bǔ)貼方案,我們基于已建立的模型計算出租車單車日均載客次數(shù)、有效載客率與打車軟件平臺對每單補(bǔ)貼金額的關(guān)系式。綜合考慮每單補(bǔ)貼金額對出租車司機(jī)、乘客、打車軟件平臺三方各自的滿意度,利用熵

67、值法求出三方滿意度的權(quán)重,繼而將三方的標(biāo)準(zhǔn)化數(shù)據(jù)乘以權(quán)重得出綜合滿意度,比較得出最優(yōu)的補(bǔ)貼方案。</p><p><b>  4.3 模型假設(shè)</b></p><p>  1.假設(shè)城市中的黑車現(xiàn)象對居民出行沒有造成影響;</p><p>  2.假設(shè)所研究的城市沒有發(fā)生嚴(yán)重的自然災(zāi)害和社會動蕩;</p><p>  3.

68、假設(shè)所研究的城市政府對出租車行業(yè)的政策基本不變;</p><p>  4.假設(shè)司機(jī)和乘客都是為自身利益考慮,即經(jīng)濟(jì)人假設(shè);</p><p>  5.假設(shè)參考文獻(xiàn)中的數(shù)據(jù)來源可靠,真實可信。</p><p><b>  4.4 符號說明</b></p><p>  4.5 模型建立與求解</p><p&

69、gt;  4.5.1建模前的準(zhǔn)備</p><p>  由參考文獻(xiàn)[2]可得到現(xiàn)有指標(biāo)體系見表1。</p><p>  表1 衡量出租車供求的三大指標(biāo)</p><p>  4.5.2問題一:建立評價出租車資源供求匹配程度的指標(biāo)</p><p>  為評價出租車資源的“供求匹配”程度,引入出租車資源的供求匹配率這一指標(biāo),指標(biāo)的定義為城市中實際運(yùn)

70、行的出租車輛數(shù)與市民出行需要的出租車輛數(shù)之比,即</p><p><b>  (1)</b></p><p>  其中,引入P表示出租車資源的供求匹配率,M表示市民出行需要的出租車輛數(shù),N表示城市中實際運(yùn)行的出租車輛數(shù)。市民出行需要的出租車輛M的意義是指這些出租車輛能夠恰好滿足市民打車出行的需求,即城市出租車資源供求平衡時的車輛數(shù)。</p><p&

71、gt;  供求匹配率P反映了城市中實際運(yùn)行的出租車輛數(shù)與市民出行需要的出租車輛數(shù)之間的差異。供求匹配率P=1為出租車資源供求平衡狀態(tài),供求匹配率P越接近1,則說明城市出租車資源供求匹配程度越高,出租車數(shù)量配置越合理;當(dāng)供求匹配率P大于1時,表明城市中現(xiàn)有的出租車數(shù)量超過市民出行需要的數(shù)量,會增加出租車的空駛率,造成出租車司機(jī)的收益降低;當(dāng)供求匹配率P小于1時,表明城市中現(xiàn)有的出租車數(shù)量少于市民出行需要的數(shù)量,需要增加出租車的數(shù)量來緩解打

72、車難的情況。</p><p>  4.5.2.1建立市民出行需要的出租車輛數(shù)M的預(yù)測模型</p><p>  市民出行需要的出租車輛數(shù)M與市民人均日出行次數(shù)、城市總?cè)丝跀?shù)量、市民出行選擇乘坐出租車的比例有關(guān),也與每輛出租車日均載客次數(shù)、每單載客人數(shù)和車輛滿載率有關(guān),具體關(guān)系式為:</p><p><b>  符號表達(dá)式為:</b></p&

73、gt;<p><b>  (2)</b></p><p>  其中,M表示市民出行需要的出租車輛數(shù)(輛),Y表示市民人均日出行次數(shù)(單位:次/人日),W為城市總?cè)丝跀?shù)量(人),η表示市民選擇打車出行的比例,s表示出租車單車日均載客次數(shù)(單位:次/車日),λ表示出租車單車日均每次載客人數(shù)(人/車次),μ為出租車滿載率。</p><p>  根據(jù)參考文獻(xiàn)[3

74、],選取出租車單車日均載客次數(shù)s=35(次/車日),出租車單車日均每次載客人數(shù)λ=2.0(人/車次),出租車滿載率μ=65%,居民選擇打車出行的比例為6%。</p><p>  接下來建立市民人均日出行次數(shù)與城市經(jīng)濟(jì)指標(biāo)關(guān)聯(lián)的量化模型</p><p>  市民人均日出行次數(shù)是居民出行強(qiáng)度的最直接反映,其與城市人口總數(shù)量的乘積即為市民的出行總量,而市民人均日出行次數(shù)與城市經(jīng)濟(jì)指標(biāo)有著極大聯(lián)系

75、。通常情況下,市民人均日出行次數(shù)的多少與出行目的、城市布局、交通設(shè)施、城市環(huán)境質(zhì)量等因素有關(guān)。對于某一城市來說,影響居民人均出行次數(shù)的因素又間接地反映在該城市的相關(guān)經(jīng)濟(jì)指標(biāo)上。因此,多種因素與市民人均日出行次數(shù)的內(nèi)在關(guān)聯(lián)可以轉(zhuǎn)化為多種經(jīng)濟(jì)指標(biāo)與市民人均日出行次數(shù)的內(nèi)在關(guān)聯(lián)。</p><p>  STEP1:各經(jīng)濟(jì)指標(biāo)的聚類分析;</p><p>  STEP2:典型指標(biāo)的選??;</p

76、><p>  STEP3:回歸模型的建立</p><p>  STEP4:模型的檢驗。</p><p>  聚類分析是根據(jù)事物本身的特性來定量研究分類問題的一種多元統(tǒng)計分析。其基本思想是按照距離的遠(yuǎn)近將數(shù)據(jù)分為若干個類別,以使類別內(nèi)數(shù)據(jù)的“差異”盡可能小,類別間“差異”盡可能大。所用的變量可以被大致分成兩類:對樣本個體進(jìn)行聚類通常稱為Q型聚類,對研究變量進(jìn)行聚類稱為R型

77、聚類。</p><p>  選用歐幾里得距離(歐式距離)來度量指標(biāo)之間接近的程度。歐式距離就是空間中兩點之間的直線距離,其中各特征參數(shù)是等權(quán)的,記dij表示指標(biāo)vi和vj之間的距離,則有計算公式如下:</p><p>  聚類分析具體過程如下:</p><p>  首先將各聚類單位各自作為一類(這時有p類),按照所選取的距離計算各數(shù)據(jù)點之間的距離,形成一個距離陣。&

78、lt;/p><p>  將距離最近的兩個單位并為一個類別,形成n-1個類別,計算新產(chǎn)生的類別與其他各類別之間的距離,形成新的距離陣。</p><p>  按照和第二步相同的原則,再將距離最接近的兩個類別合并,這時如果類別個數(shù)仍然大于1,則繼續(xù)重復(fù)這一步驟,直到所有的數(shù)據(jù)都被合并為成為一個類別為止。</p><p>  STEP1:選取北京、上海、天津、廣州、深圳、成都、

79、南京、杭州、武漢、長春、珠海、大連、福州、蘇州、常州十五個大中城市為研究對象,分析各城市人均日出行次數(shù)和十二個經(jīng)濟(jì)指標(biāo)之間的關(guān)聯(lián)。十五個大中城市2001年人均日出行次數(shù)和各經(jīng)濟(jì)指標(biāo)見表2。</p><p>  表2 大中城市居民人均出行次數(shù)和經(jīng)濟(jì)指標(biāo)</p><p>  注:數(shù)據(jù)來源:參考文獻(xiàn)[1]。</p><p>  以12個經(jīng)濟(jì)指標(biāo)為聚類單位,指標(biāo)與指標(biāo)間的

80、距離選用歐式距離,采用組間平均聯(lián)接法,進(jìn)行聚類分析。利用SPSS19.0軟件進(jìn)行聚類分析,得到各經(jīng)濟(jì)指標(biāo)間的相關(guān)系數(shù)矩陣如表3,聚類過程中的運(yùn)算結(jié)果參數(shù)見表4所示,聚類分析的譜系圖如圖1。</p><p>  表3 相關(guān)系數(shù)矩陣R</p><p>  表4 聚類分析參數(shù)</p><p>  圖1 聚類分析的譜系圖</p><p>  根

81、據(jù)聚類分析的譜系圖可以看出,這十二個經(jīng)濟(jì)指標(biāo)可分為三大類:第一大類包括人均GDP(v4);第二大類包括在崗職工平均工資(v10)和市區(qū)居民人均可支配收入(v11);第三大類包括市區(qū)面積(v1)、市區(qū)總?cè)丝跀?shù)(v2)、第三產(chǎn)業(yè)值(v3)、工業(yè)產(chǎn)品銷售收入(v5)、社會消費(fèi)品零售總額(v6)、房地產(chǎn)開發(fā)投資(v7)、城鄉(xiāng)居民儲蓄存款(v8)、居民消費(fèi)價格總指數(shù)(v9)、農(nóng)民人均純收入(v12)。聚類分析的結(jié)果見表5</p>&

82、lt;p>  表5 聚類分析結(jié)果</p><p>  STEP2:將十二個指標(biāo)進(jìn)行聚類分析得到三類指標(biāo)后,出來第一類指標(biāo)外,其他兩類都包含多個指標(biāo),為了選取各類指標(biāo)中的典型指標(biāo),分別計算類中每一變量與其余變量的Pearson相關(guān)系數(shù),繼而求得類中每一變量與其余變量的Pearson相關(guān)系數(shù)的平方和的平均值,最后把該值最大的變量作為典型指標(biāo)。</p><p>  Pearson相關(guān)系數(shù)

83、的定義為</p><p><b> ?。?)</b></p><p>  相關(guān)系數(shù)R的數(shù)值范圍是介于-1與+1之間:</p><p>  如果|R|≈0,表明兩個變量沒有線性相關(guān)關(guān)系。</p><p>  如果|R|=1,則表示兩個變量完全直線相關(guān)。線性相關(guān)的方向通過相關(guān)系數(shù)的符號來表示,“+”號表示正相關(guān),“-”表示

84、負(fù)相關(guān)。</p><p><b> ?。?)</b></p><p>  式中, 表示變量 與其余變量 的Pearson相關(guān)系數(shù)R的平方和的平均值,m為變量的個數(shù)。</p><p>  將表3中的值代入公式(3)、(4),計算得到第二類和第三類指標(biāo)中的各變量的,具體見表6所示。</p><p>  表6 同一類中每一變

85、量與其余變量的相關(guān)系數(shù)平方和的均值</p><p>  從表6中可以看出,第二類指標(biāo)中v10對應(yīng)的值最大,第三類指標(biāo)v3中對應(yīng)的值最大。所以,選擇v10、v3為典型數(shù)據(jù)。而第一類指標(biāo)只有一個指標(biāo),故可選取v4、v10、 v3分別作為第一、二、三類指標(biāo)的典型指標(biāo)。</p><p>  STEP3:根據(jù)聚類分析得到的典型變量,利用表2中的數(shù)據(jù),建立2001年人均日出行次數(shù)Y與第三產(chǎn)業(yè)值(v3)

86、、人均GDP(v4)、在崗+職工平均工資(v10)的多元線性回歸方程。</p><p><b>  多元線性回歸原理:</b></p><p><b>  多元線性回歸模型為</b></p><p><b> ?。?)</b></p><p>  每個因變量的實測值由兩部分組成

87、:估計值,用表示,即給定各自變量取值時因變量y的估計值,它代表的是能與自變量決定的部分;ei為殘差,是因變量實測值與估計值之差,表示不由自變量決定的部分。</p><p>  應(yīng)用多個個回歸模型對每一條記錄求其因變量預(yù)測值與實測值之差的平方和,并將其累加,那么每個回歸模型都會得到一個累加值,而該數(shù)值的最小的那個回歸模型就是需要的模型,這就是最小二乘法。</p><p><b> 

88、?。?)</b></p><p>  利用SPSS19.0軟件計算得</p><p><b>  (7)</b></p><p>  R2=0.678表明因變量Y(人均出行次數(shù))的67.8%可由回歸方程確定,回歸方程視為可用的。</p><p>  STEP4:模型檢驗:</p><p&g

89、t;  將表2中的第三產(chǎn)業(yè)值、人均GDP、在崗+職工平均工資代入得到的多元線性回歸方程(7)中,得到人均日出行次數(shù)的模型模擬值,作出模型值與調(diào)查值的折線圖如圖2所示。</p><p>  圖2 大中城市居民平均出行次數(shù)調(diào)查值與模型值比較</p><p>  由圖2可以看出所得到的2001年人均日出行次數(shù)的回歸方程具有較好的回歸效果。由于市民每天出行次數(shù)的多少與出行目的、城市布局、生活方

90、式、工作方式、家庭經(jīng)濟(jì)狀況、交通設(shè)施、通訊設(shè)施、城市環(huán)境質(zhì)量等因素有關(guān),隨著社會經(jīng)濟(jì)的迅猛發(fā)展,人民生活水平也日漸提高,私家車數(shù)量大幅增加,城市的交通更加發(fā)達(dá),人們之間的聯(lián)系加強(qiáng),越來越多的人選擇逛街、旅游等休閑方式,綜合考慮社會經(jīng)濟(jì)的發(fā)展帶來的影響,修正2001年人均日出行次數(shù)的回歸方程,得到2013年人均日出行次數(shù)的回歸方程:</p><p><b> ?。?)</b></p>

91、;<p>  根據(jù)從參考文獻(xiàn)[5]各城市2013年年鑒上收集到的數(shù)據(jù)(見表7),利用2013年人均日出行次數(shù)的回歸方程[8],計算得到相應(yīng)城市的人均日出行次數(shù),結(jié)果如表7所示。</p><p>  表7 國內(nèi)主要城市相關(guān)的經(jīng)濟(jì)指標(biāo)</p><p>  利用表7中的數(shù)據(jù)計算八座城市的出租車資源的供求匹配率,結(jié)果如表8所示。</p><p>  表8

92、國內(nèi)主要城市出行相關(guān)信息</p><p>  從表8可以看出,在所研究的八個國內(nèi)主要城市中,只有大連這一座城市的供求匹配率略大于1,而其余主要城市的供求匹配率均小于1,并且深圳和杭州兩地的供求匹配率與1相距最遠(yuǎn)。因此,城市出租車資源供求達(dá)到近似平衡的城市為大連,而城市出租車資源供小于求的城市為北京、廣州、武漢、南京、成都,嚴(yán)重供小于求的城市為杭州和深圳。</p><p>  4.5.2.2

93、不同時間的出租車資源的供求匹配</p><p>  由參考文獻(xiàn)[4]得到的在不同時刻蚌埠市居民出行的平均比例,將此比例作為成都市居民不同時刻的出行比例(見表9),計算得到各時段的出租車供求匹配率,結(jié)果見表9。</p><p>  表9 成都市不同時刻出租車資源供求情況</p><p>  由表9可以看出,在上班早高峰、下班晚高峰和中午時段成都市出租車資源的供求匹配

94、率均小于1,并且與1相距較遠(yuǎn)。所以這在四個時間段內(nèi),成都市出租車資源都是嚴(yán)重供小于求。</p><p>  4.5.2.3利用灰色模型預(yù)測2018年成都市區(qū)人口數(shù)量和出租車需求量</p><p>  利用灰色模型預(yù)測2018年成都市區(qū)人口數(shù)量和出租車需求量,接下來介紹灰色預(yù)測方法原理。</p><p>  1.設(shè)已知參考數(shù)據(jù)列為x(0)=(x(0)(1),x(0)

95、(2),…,x(0)(n)),做1次累加(AGO),生成數(shù)列</p><p><b>  其中 。求均值數(shù)列</b></p><p>  則z(1)=(z(1)(2),z(1)(3),…,z(1)(n))。于是建立灰微分方程為</p><p>  相應(yīng)的白化微分方程為</p><p><b>  記</b

96、></p><p>  由最小二乘法,求得使</p><p><b>  達(dá)到最小值的</b></p><p><b>  于是求解方程得</b></p><p>  2.灰色預(yù)測的步驟 </p><p> ?。?)數(shù)據(jù)的檢驗與處理</p><p&g

97、t;  首先,為了保證建模方法的可行性,需要對已知數(shù)據(jù)列做必要的檢驗處理。設(shè)參數(shù)據(jù)為x(0)=(x(0)(1),x(0)(2),…,x(0)(n)) ,計算數(shù)列的級比</p><p><b>  , </b></p><p>  如果所有的級比λ(k)都落在可容覆蓋 內(nèi),則數(shù)列x(0)可以作為模型</p><p>  GM(1,1)的數(shù)據(jù)進(jìn)行灰

98、色預(yù)測。否則,需要對數(shù)列x(0)做必要的變換處理,使其落入可容覆蓋內(nèi)。即取適當(dāng)?shù)某?shù)c ,作平移變換</p><p><b>  ,</b></p><p><b>  則使數(shù)列 的級比為</b></p><p><b>  ,</b></p><p><b> ?。?/p>

99、2)建立模型</b></p><p>  按1節(jié)中的方法建立模型GM(1,1),則可以得到預(yù)測值</p><p><b>  ,。</b></p><p> ?。?)建立模型預(yù)測值</p><p>  殘差檢驗:令殘差為ε(k),計算</p><p><b>  ,</

100、b></p><p>  如果ε(k)<0.2,則可認(rèn)為達(dá)到一般要求;如果ε(k)<0.1,則認(rèn)為達(dá)到較高的要求。</p><p>  級比偏差值檢驗:首先由參考數(shù)據(jù)x(0)(k-1),x(0)(k),計算出級比λ(k),再用發(fā)展系數(shù)a求出相應(yīng)的級比偏差</p><p>  如果ρ(k)<0.2,則可認(rèn)為達(dá)到一般要求;如果ρ(k)<0.1,則認(rèn)為達(dá)

101、到較高的要求。</p><p>  利用灰色預(yù)測模型和成都市2002年至2013年的人口數(shù)量,對成都市2014年至2021年的人口數(shù)量進(jìn)行預(yù)測,結(jié)果見表10和表11。</p><p>  表10 成都市人口灰色預(yù)測</p><p>  表11 成都市區(qū)人口預(yù)測</p><p>  預(yù)測2018年成都市區(qū)人口632.27萬,選取人均日出行

102、次數(shù)為2.8次,將以上數(shù)據(jù)代入公式[1],得到在出租車供求平衡即供求匹配率P=1的情況下,成都市2018年需要出租車23345輛。</p><p><b>  4.6 模型評價</b></p><p><b>  模型優(yōu)點:</b></p><p>  模型充分考慮了影響城市居民對出租車需求量的重要因素,定量分析這些因素對

103、城市出租車需求量的影響,結(jié)果具有較高的可靠性。</p><p><b>  模型缺點</b></p><p>  (1)以整個城市為研究對象,對城市內(nèi)的局部區(qū)域缺乏更細(xì)致的研究,無法刻畫不同區(qū)域的差異,如市中心與市郊的情況會有所不同。打車難的問題在局部可能依然存在。</p><p> ?。?)模型未考慮司機(jī)的挑客行為,即有些司機(jī)為了獲得更多利潤

104、,會拒載一些短途生意,而專門接一些長途活.</p><p><b>  4.7 本章小結(jié)</b></p><p>  本章研究的是“互聯(lián)網(wǎng)+”時代的出租車資源配置模型,應(yīng)用本文前兩章所介紹的聚類分析和回歸分析的方法理論,并結(jié)合MATLAB和SPSS兩種優(yōu)化軟件,對模型進(jìn)行了求解。本章首先通過對實際問題的分析,列出了關(guān)于聚類分析和回歸分析的基本模型。其后,通過結(jié)合實際背

105、景,為分析不同時空出租車資源的供求匹配程度,引入出租車資源供求匹配率這一指標(biāo),指標(biāo)的定義為城市中實際運(yùn)行的出租車輛數(shù)與居民出行需要的出租車輛數(shù)之比,反映城市中實際運(yùn)行的出租車輛數(shù)與居民出行需要的出租車輛數(shù)之間的差異。計算得出成都2013年出租車供求匹配率為0.7766,表示供不應(yīng)求。</p><p>  居民出行需要的出租車輛數(shù)與居民人均日出行次數(shù)、城市總?cè)丝跀?shù)量、居民出行選擇乘坐出租車的比例有關(guān),也與每輛出租車

106、日均載客次數(shù)、每單載客人數(shù)和車輛滿載率有關(guān)。對于居民人均日出行次數(shù),利用十五個國內(nèi)大中城市的數(shù)據(jù),將十二個城市經(jīng)濟(jì)指標(biāo)聚類分析選出每類指標(biāo)中典型的經(jīng)濟(jì)指標(biāo),建立居民人均日出行次數(shù)與這些典型經(jīng)濟(jì)指標(biāo)間的多元線性回歸方程,而與居民出行需要的出租車輛數(shù)相關(guān)的其他指標(biāo)可查閱文獻(xiàn)或年鑒獲得。分析成都市每天6:00-8:30,11:00-12:30,13:30-14:30,17:00-18:30四個時間段得供求匹配率分別為0.4111,0.5678

107、,0.6062,0.5631,結(jié)果顯示供不應(yīng)求。得到大連、北京、廣州、武漢、南京、成都、杭州、深圳八座城市的出租車資源供求匹配率分別為1.0936、0.8827、0.9430、0.7040、0.7049、0.7666、0.6583、0.5252,表明只有大連的出租車資源是供大于求,而其余七座城市為供小于求。</p><p><b>  結(jié) 論</b></p><p>

108、;  隨著人類的社會實踐,統(tǒng)計分析的知識和思想在越來越多的領(lǐng)域顯示了它的應(yīng)用性和實用性。它從整體上反映和分析事物數(shù)量特征,觀察事物的本質(zhì)和發(fā)展規(guī)律,作出正確的判斷。我們社會中的每個人,都是特定事件的決策者,都要受到統(tǒng)計分析理論的影響,大到國家,小到個人。因此我們需要通過分析達(dá)到我們的預(yù)期目標(biāo),并借助一些具有強(qiáng)大功能的軟件,比如SPSS和MATLAB等,幫助我們做出決策。</p><p>  本文共分四部分。第一部

109、分簡要介紹了統(tǒng)計分析的概念和應(yīng)用,以及SPSS和MATLAB軟件的功能和特點。本文在求解的過程中主要借助了這兩個軟件。第二部分簡要介紹了統(tǒng)計分析中最基礎(chǔ)的兩個個組成成分:聚類分析、回歸分析,對它們的概念和求解方法做了簡要介紹。第三部分分別就這兩個方法給出了經(jīng)典案例,通過SPSS軟件編程分別求解了對五個樣品進(jìn)行分類的問題,得到了最優(yōu)分類策略,以及求解了地區(qū)生產(chǎn)總值與13個重要支出項的組成關(guān)系問題,得出了在生產(chǎn)總值與支出項的最簡回歸模型。第

110、四部分是將所研究的聚類分析和回歸分析方法應(yīng)用到2015年數(shù)學(xué)建模競賽試題“互聯(lián)網(wǎng)+時代的出租車資源配置模型”當(dāng)中,根據(jù)聚類分析和回歸分析的求解和簡化方法,得到了簡單的回歸分析模型,最后利用MATLAB和SPSS軟件,得到了不同時空出租車資源的供求匹配程度最優(yōu)決策方案。</p><p>  通過求解實際統(tǒng)計分析問題,可以了解到,統(tǒng)計分析理論結(jié)合相應(yīng)的優(yōu)化軟件,可以為決策者做出最優(yōu)決策提供相應(yīng)的簡捷快速、準(zhǔn)確的最優(yōu)化

111、方案。因此,我們要利用統(tǒng)計分析的強(qiáng)大的決策作用以及現(xiàn)代計算機(jī)軟件的強(qiáng)大功能,使其為我們各個領(lǐng)域的發(fā)展和進(jìn)步發(fā)揮更大的促進(jìn)作用。</p><p><b>  參考文獻(xiàn)</b></p><p>  [1]鄒志云,蔣忠海,梅亞楠,宋程.大中城市居民出行強(qiáng)度的聚類分析.交通運(yùn)輸工程與信息學(xué)報,5(2):8-13,2007,6</p><p>  [2]

112、衡量出租車供求的三大指標(biāo)——里程利用率、車輛滿載率、萬人擁有量.《運(yùn)輸經(jīng)理世界》,2007,(5)</p><p>  [3]王榃.成都市客運(yùn)出租車需求分析.西南交通大學(xué)工程碩士學(xué)位論文,2009,12</p><p>  [4]大連,北京,廣州,杭州,深圳,武漢、南京2013年年鑒</p><p>  [5]韓中庚.數(shù)學(xué)建模方法及其應(yīng)用.北京:高等教育出版社,20

113、05.6</p><p>  [6]成都2002-2013年年鑒</p><p><b>  附 錄</b></p><p> ?。?)文件名:first.m(2001年15個城市人均每日出行次數(shù)模型值)</p><p><b>  clear;</b></p><p>  

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論