神經(jīng)網(wǎng)絡含義范文

時間:2024-03-29 11:12:51

導語:如何才能寫好一篇神經(jīng)網(wǎng)絡含義,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。

神經(jīng)網(wǎng)絡含義

篇1

關鍵詞:電阻點焊;神經(jīng)網(wǎng)絡;消音鋸片

0序言

電阻點焊過程是一個高度非線性,既有多變量靜態(tài)疊加又有動態(tài)耦合,同時又具有大量隨機不確定因素的復雜過程。這種復雜性使得傳統(tǒng)方法確定最佳工藝參數(shù)存在操作復雜、精度低等缺陷。

本文通過深入研究提出了一種神經(jīng)網(wǎng)絡優(yōu)化消音鋸片電阻點焊工藝參數(shù)方法。以試驗數(shù)據(jù)為樣本,通過神經(jīng)網(wǎng)絡,建立焊接工藝參數(shù)與焊接性能之間的復雜模型,充分發(fā)揮神經(jīng)網(wǎng)絡的非線性映射能力。為準確預測點焊質(zhì)量提高依據(jù)。在運用試驗手段、神經(jīng)網(wǎng)絡高度非線性擬合能力結(jié)合的方式,能在很大程度上克服傳統(tǒng)方法的缺陷,完成網(wǎng)絡的訓練、檢驗和最優(yōu)評價,為電阻點焊過程的決策和控制提供可靠依據(jù)。

1原理

人工神經(jīng)網(wǎng)絡是用物理模型模擬生物神經(jīng)網(wǎng)絡的基本功能和結(jié)構(gòu),可以在未知被控對象和業(yè)務模型情況下達到學習的目的。建立神經(jīng)網(wǎng)絡是利用神經(jīng)網(wǎng)絡高度并行的信息處理能力,較強的非線性映射能力及自適應學習能力,同時為消除復雜系統(tǒng)的制約因素提供了手段。人工神經(jīng)網(wǎng)絡在足夠多的樣本數(shù)據(jù)的基礎上,可以很好地比較任意復雜的非線性函數(shù)。另外,神經(jīng)網(wǎng)絡的并行結(jié)構(gòu)可用硬件實現(xiàn)的方法進行開發(fā)。目前應用最成熟最廣泛的一種神經(jīng)網(wǎng)絡是前饋多層神經(jīng)網(wǎng)絡(bp),通常稱為bp神經(jīng)網(wǎng)絡。

神經(jīng)網(wǎng)絡方法的基本思想是:神經(jīng)網(wǎng)絡模型的網(wǎng)絡輸入與神經(jīng)網(wǎng)絡輸出的數(shù)學關系用以表示系統(tǒng)的結(jié)構(gòu)參數(shù)與系統(tǒng)動態(tài)參數(shù)之間的復雜的物理關系,即訓練。我們發(fā)現(xiàn)利用經(jīng)過訓練的模型進行權(quán)值和閾值的再修改和優(yōu)化(稱之為學習)時,其計算速度要大大快于基于其他優(yōu)化計算的速度。

bp神經(jīng)網(wǎng)絡一般由大量的非線性處理單元——神經(jīng)元連接組成的。具有大規(guī)模并行處理信息能力和極強的的容錯性。每個神經(jīng)元有一個單一的輸出,但可以把這個輸出量與下一層的多個神經(jīng)元相連,每個連接通路對應一個連接權(quán)系數(shù)。根據(jù)功能可以把神經(jīng)網(wǎng)絡分為輸入層,隱含層(一或多層),輸出層三個部分。設每層輸入為ui(q)輸出為vi(q)。同時,給定了p組輸入和輸出樣本 ,dp(p=200)。

(6)

該網(wǎng)絡實質(zhì)上是對任意非線性映射關系的一種逼近,由于采用的是全局逼近的方法,因而bp網(wǎng)絡具有較好的泛化的能力。

我們主要是利用神經(jīng)網(wǎng)絡的非線性自適應能力,將它用于消音鋸片的電阻點焊過程。訓練過程是:通過點焊實驗獲得目標函數(shù)與各影響因素間的離散關系,用神經(jīng)網(wǎng)絡的隱式來表達輸入輸出的函數(shù)關系,即將實驗數(shù)據(jù)作為樣本輸入網(wǎng)絡進行訓練,建立輸入輸出之間的非線性映射關系,并將知識信息儲存在連接權(quán)上,從而利用網(wǎng)絡的記憶功能形成一個函數(shù)。不斷地迭代可以達到sse(誤差平方和)最小。

我們這次做的消音金剛石鋸片電焊機,通過實驗發(fā)現(xiàn)可以通過采用雙隱層bp神經(jīng)網(wǎng)絡就可以很好的反應輸入輸出參數(shù)的非線性關系。輸入神經(jīng)元為3,分別對應3個電阻點焊工藝參數(shù)。輸出神經(jīng)元為1,對應焊接質(zhì)量指標參數(shù)。設第1隱含層神經(jīng)元取為s1,第2隱含層神經(jīng)元取為s2。輸入層和隱含層以及隱層之間的激活函數(shù)都選取log-sigmoid型函數(shù),輸出層的激活函數(shù)選取pureline型函數(shù)。

2點焊樣本的選取

影響點焊質(zhì)量的參數(shù)有很多,我們選取點焊時的控制參數(shù),即點焊時間,電極力和焊接電流,在固定式點焊機上進行實驗。選用鋼種為50mn2v,φ600m的消音型薄型圓鋸片基體為進行實驗。對需要優(yōu)化的參數(shù)為點焊時間,電極力和焊接電流3個參數(shù)進行的訓練。最后的結(jié)果為焊接質(zhì)量,通常以鋸片的抗拉剪載荷為指標。

建立bp神經(jīng)網(wǎng)絡時,選擇樣本非常重要。樣本的選取關系到所建立的網(wǎng)絡模型能否正確反映所選點焊參數(shù)和輸出之間的關系。利用插值法,將輸入變量在較理想的區(qū)間均勻分布取值,如果有m個輸入量,每個輸入量均勻取n個值(即每個輸入量有m個水平數(shù)), 則根據(jù)排列組合有nm個樣本。對應于本例,有3個輸入量,每個變量有5個水平數(shù),這樣訓練樣本的數(shù)目就為53=125個。

我們的實驗,是以工人的經(jīng)驗為參考依據(jù),發(fā)現(xiàn)點焊時間范圍為2~8s,電極力范圍為500~3000n,點焊電流范圍為5~20ka時,焊接質(zhì)量比較好。我們先取點焊電流,電極力為定量,在合理的范圍內(nèi)不斷改變點焊時間,得到抗拉剪載荷。如此,可以得到不同點焊電流和電極力的抗拉剪載荷。根據(jù)點焊數(shù)據(jù)的情況,我們共選用200組數(shù)據(jù)。部分測試數(shù)據(jù)如表1:

神經(jīng)網(wǎng)絡建模的關鍵是訓練,而訓練時隨著輸入?yún)?shù)個數(shù)的增加樣本的排列組合數(shù)也急劇增加,這就給神經(jīng)網(wǎng)絡建模帶來了很大的工作量,甚至于無法達到訓練目的。

3神經(jīng)網(wǎng)絡

我們用200組訓練樣本對進行神經(jīng)網(wǎng)絡訓練,以err_goal=0.01為目標。調(diào)用matlab神經(jīng)網(wǎng)絡工具箱中的函數(shù)編程計算,實現(xiàn)對網(wǎng)絡的訓練,訓練完成后便得到一個網(wǎng)絡模型。

程序如下:

x1=[2.1 2.5 3 3.5 4……]; %點焊時間輸入,取200組

x2=[1.3 1.5 1.9 2.1 2.3……];%電極力輸入,取200組

x3=[9 10 11 12 13……];%點焊電流輸入,取200組

y=[2756 3167 3895 3264 2877……]; %輸出量,取200組

net=newff([1 10;0.5 3;5 20],[10 10 1],{'tansig''tansig''purelin'});

%初始化網(wǎng)絡

net.trainparam.goal = 0.01;%設定目標值

net=train(net,[x1;x2;x3],y);%訓練網(wǎng)絡

figure; %畫出圖像

選取不同的s1,s2,經(jīng)過不斷的神經(jīng)網(wǎng)絡訓練,發(fā)現(xiàn)當s1=8,s2=6時,神經(jīng)網(wǎng)絡可以達到要求。工具箱示意圖如下圖1。

圖 1工具箱示意圖

工具箱示意圖非常清晰地表示了本實驗的神經(jīng)網(wǎng)絡的輸入,輸出以及訓練的過程。

神經(jīng)網(wǎng)絡的訓練結(jié)果,如圖2所示:

圖2神經(jīng)網(wǎng)絡的學習過程

圖中可以看出雙層網(wǎng)絡訓練的sse在訓練100次時,已經(jīng)接近0.0001,效果較理想。

為了驗證經(jīng)過訓練的網(wǎng)絡模型的泛化能力,在輸入變量所允許的區(qū)域內(nèi)又另選多個樣本進行了計算。發(fā)現(xiàn):利用bp神經(jīng)網(wǎng)絡模型計算的測試輸出與期望輸出值相符,誤差小于2%。

在已經(jīng)訓練好的網(wǎng)絡中找出最大值:

for i=2:10 %點焊時間選擇

for j=0.5:0.1:3%電極力選擇

fork=5:0.1:20%點焊電流選擇

a=sim(net,[i,j,k]);%仿真

ifa>n %比較仿真結(jié)果與最大值,取最大值n=a;

i(1)=i;%最大值的時間

j(1)=j;%最大值的電極力

k(1)=k; %最大值的電流

end

end

end

end

將i(1),j(1),k(1)以及n輸出,n為最大值。得到點焊時間為3.4s,電極力為12.7kn,點焊電流為11.8ka,此時的抗剪拉剪載荷為4381n,為訓練結(jié)果的最大值。將點焊時間為3.4s,電極力為12.7kn,點焊電流為11.8ka在點焊機上進行實驗,得到結(jié)果為4297n。并且通過與實際的結(jié)果相比較,發(fā)現(xiàn)誤差也在2%以內(nèi)。

4結(jié)論

1)本文采用了插值法作為選取bp神經(jīng)網(wǎng)絡訓練樣本的方法。并且在數(shù)據(jù)變化劇烈的地方多選取了75組數(shù)據(jù),這樣可以得到較高精度的網(wǎng)絡模型,使點焊模型的可行性。

2)基于此方法建立了三個點焊參數(shù)的bp神經(jīng)網(wǎng)絡模型,而且所建的bp模型具有較高的精度,可以很好的描述了這三個點焊參數(shù)與點焊質(zhì)量的映射關系。

3)由于神經(jīng)網(wǎng)絡模型將系統(tǒng)結(jié)構(gòu)參數(shù)與傳統(tǒng)動態(tài)特性參數(shù)之間的物理關系,反映為神經(jīng)網(wǎng)絡模型的網(wǎng)絡輸入與網(wǎng)絡輸出的數(shù)學關系,因此,在神經(jīng)網(wǎng)絡模型上進行結(jié)構(gòu)修正與優(yōu)化比在其他模型上更直接,簡單與高效。

本文采用神經(jīng)網(wǎng)絡的方法優(yōu)化復合消音鋸片的點焊工藝參數(shù),為分析點焊質(zhì)量提供了很好的輔助手段。通過與以前工藝相比較,提高了點焊質(zhì)量。

參考文獻:

[1] 方平,熊麗云.點焊電流有效值神經(jīng)網(wǎng)絡實時計算方法研究.[j].機械工程學報,2004(11).148-152.

篇2

歐陽亮(1984―),女,湖南大學工商管理學院(長沙,410082)。研 究方向:金融工程與風險管理。

[關鍵詞]匯率預測;匯率波動;神經(jīng)網(wǎng)絡

匯率作為一個重要的經(jīng)濟變量,其變動對國民收入的增減、工農(nóng)業(yè)的發(fā)展、國內(nèi)利率、就業(yè) 等各方面都有著重要的影響。因此,匯率預測受到廣泛的關注,大量的計量經(jīng)濟模型和時間 序列模型被用于匯率預測。其中,人工神經(jīng)網(wǎng)絡(Artificial Neural Networks, ANN)作為 一種非參數(shù)的數(shù)據(jù)驅(qū)動型的方法,不需要對數(shù)據(jù)特征進行事先假設,通過合理的樣本訓練, 學習專家的經(jīng)驗、模擬專家的行為,并引入非線性轉(zhuǎn)換函數(shù)來求解各種復雜的非線性問題, 具有很強的模式識別能力和高速信息處理能力,從而在時間序列數(shù)據(jù)預測方面有獨特的優(yōu) 勢。[1]

利用神經(jīng)網(wǎng)絡方法預測匯率波動,國內(nèi)外學者已經(jīng)進行了比較廣泛的研究??偨Y(jié)國內(nèi)外學者 的研究成果,用神經(jīng)網(wǎng)絡預測匯率有3個層次。它們分別是同質(zhì)神經(jīng)網(wǎng)絡模型、 異質(zhì)神經(jīng)網(wǎng)絡模型和神經(jīng)網(wǎng)絡組合模型。

一、匯率預測的同質(zhì)神經(jīng)網(wǎng)絡模型

同質(zhì)神經(jīng)網(wǎng)絡預測模型是用神經(jīng)網(wǎng)絡根據(jù)歷史匯率數(shù)據(jù)來預測未來匯率,這是作為一種匯 率預測的非參數(shù)方法提出來的。由于匯率波動具有非線性相關性和 長效記憶性,因此通過歷史數(shù)據(jù)進行匯率預測是一種可行的方法。同質(zhì)神經(jīng)網(wǎng)絡預測模型認 為;匯率有一個隱含的生成機制,歷史匯率和未來的匯率都由這個機制生成,通過對歷史數(shù) 據(jù)的觀測,識別這個生成機 制,就可用這個生成機制預測未來的匯率。由于神經(jīng)網(wǎng)絡是一個數(shù)據(jù)驅(qū)動的自適應的非參數(shù) 方法,不基于假設,即使產(chǎn)生數(shù)據(jù)的過程是未知的,或者很復雜,神經(jīng)網(wǎng)絡也能識別。

用同質(zhì)神經(jīng)網(wǎng)絡進行匯率預測,是根據(jù)匯率的歷史數(shù)據(jù)加上輸入延遲來預測匯率的變化或變 化趨勢。用于匯率預測的神經(jīng)網(wǎng)絡模型很多,其中最常用的是多層后向神經(jīng)網(wǎng)絡模型,即BP 神經(jīng)網(wǎng)絡。BP神經(jīng)網(wǎng)絡一般采用三層結(jié)構(gòu):輸入層、隱含層、輸出層。BP神經(jīng)網(wǎng)絡的算法 和訓練如圖1。

以t時刻匯率種類R的預測為例,滯后期為n,預測長度為L。輸入層的數(shù)據(jù)是從時刻t開始前n 期的歷史匯率觀測值序列,yt,…, yt-n,輸入才由長度n的滑動窗口產(chǎn)生。輸出層 依次輸出從t時刻開始的L個匯率預測值,yt+1,…, yt+L。相鄰匯率的時間間 隔是等長的。匯率預測的同質(zhì)神經(jīng)網(wǎng)絡模型的結(jié)構(gòu)如上圖2。

用同質(zhì)神經(jīng)網(wǎng)絡預測匯率的研究很多,1993年,Refenes等人采用神經(jīng)網(wǎng)絡方法預測匯率變 動,他們將數(shù)據(jù)分成訓練組(Training Subsample)、測試組(Testing Subsample)和預測組( Forecasting Subsample),先用訓練組和測試組數(shù)據(jù)訓練神經(jīng)網(wǎng)絡,然后用預測組數(shù)據(jù)進行 預測,這種嘗試以及隨后的評議肯定了神經(jīng)網(wǎng)絡在一定的情況下比“標準”的預測方法表現(xiàn) 要好。[2]Kuan和Liu(1995)用神經(jīng)網(wǎng)絡對5個不同幣種兌美元的匯率進行預測。這5 種貨幣包括英鎊、加拿大元、德國馬克、日元以及瑞士法郎。研究發(fā)現(xiàn)神經(jīng)網(wǎng)絡對日元和英 鎊的預測的均方差(MSE)很低,但對其余3個幣種的預測效果一般。[3]De Matos(19 94)通過對日元期貨預測比較了多層后向神經(jīng)網(wǎng)絡(MLFN)和重復網(wǎng)絡的預測效果。[4]Zhang和Hu(1998)用多層后向神經(jīng)網(wǎng)絡對英鎊和美元的匯率進行預測,發(fā)現(xiàn)神經(jīng)網(wǎng)絡的預 測效果明顯優(yōu)于線性模型,尤其在預測期比較短的時候。[5]

雖然研究表明神經(jīng)網(wǎng)絡的預測效果比其他方法好,但是其預測精度和可靠性仍然不盡人意。 對此,學者們對神經(jīng)網(wǎng)絡進行了改進,提出了諸如聚類神經(jīng)網(wǎng)絡、重復神經(jīng)網(wǎng)絡、廣義回歸 神經(jīng)網(wǎng)絡、模糊神經(jīng)網(wǎng)絡等經(jīng)改進的神經(jīng)網(wǎng)絡進行匯率預測,或者將其他方法與神經(jīng)網(wǎng)絡結(jié) 合,以改善神經(jīng)網(wǎng)絡的預測能力。例如,Shazly等(1999)用遺傳算法訓練神經(jīng)網(wǎng)絡的權(quán)值。 惠曉 峰和胡運權(quán)等(2002)結(jié)合遺傳算法,提出了基于實數(shù)編碼的GA-BP神經(jīng)網(wǎng)絡匯率預測人民幣 兌美元匯率的模型。姚洪興, 盛昭瀚和陳洪香(2002)提出了一種改進的小波神經(jīng)網(wǎng)絡結(jié)構(gòu)。

這些研究在一定程度上提高了神經(jīng)網(wǎng)絡的預測效果,但是神經(jīng)網(wǎng)絡的結(jié)構(gòu)、訓練算法、閥值 函數(shù)的選擇以及滯后期的確定等問題仍然難以解決。而且,匯率由歷史匯率唯一決定這一 前提也缺乏足夠的理論支持。

二、匯率預測的異質(zhì)神經(jīng)網(wǎng)絡模型

用異質(zhì)神經(jīng)網(wǎng)絡模型進行匯率預測,是指在預測過程中,考慮影響匯率的各種因素,如利率 、通貨膨脹率、原油價格、貨幣供應、貿(mào)易收支差額、消費價格指數(shù)、消費信心指數(shù)等,根 據(jù)這些影響因素來預測匯率。Shazly(1997)選取一個月歐洲美元存款利率、一個月歐洲外幣 存款利率、即期匯率 和一個月的遠期匯率作為輸入變量,預測一個月后的即期匯率。結(jié)果表明,神經(jīng)網(wǎng)絡的預測 效果比通過遠期匯率進行的預測效果要好。[6]楊火斤 和馬洪波(1999)選取GNP、CPI、工業(yè)股 票價格指數(shù)、短期利率、貨幣供應量、長期利率6個影響因素,將這些變量作為神經(jīng)網(wǎng)絡的 輸入變量,訓練神經(jīng)網(wǎng)絡根據(jù)這些變量預測匯率。[7]Hui Xiao-feng等(2005)也用 模糊神經(jīng)網(wǎng) 絡進行匯率預測,輸入的變量包括兩國的CPI和GDP、兩國的利率差、貨幣供應比、凈出口額 等。[8]

異質(zhì)神經(jīng)網(wǎng)絡模型的網(wǎng)絡結(jié)構(gòu)和訓練算法與同質(zhì)神經(jīng)網(wǎng)絡相似。區(qū)別在于同質(zhì)神經(jīng)網(wǎng)絡的輸 入是一段時滯的歷史匯率數(shù)據(jù),是一維的數(shù)據(jù),而異質(zhì)神經(jīng)網(wǎng)絡的輸入數(shù)據(jù)是多個變量的數(shù) 據(jù),是二維的數(shù)據(jù)。令x1, x2,…, xn分別表示影響匯率變動的各個因素,異質(zhì)神經(jīng) 網(wǎng)絡的結(jié)構(gòu)如圖3所示。

圖3 異質(zhì)神經(jīng)網(wǎng)絡模型

隨著布雷頓森林體系的崩潰,各國紛紛采用浮動匯率制度,影響匯率變動的因素更加多樣化 、復雜化,難以確定。因此,學者們開始用神經(jīng)網(wǎng)絡與其他預測方法結(jié)合使用。一種是與基 本因素分析模型如購買力平價模型、利率平價模型等相結(jié)合。根據(jù)這些模型確定的影響因素 作為神經(jīng)網(wǎng)絡的輸入變量,通過神經(jīng)網(wǎng)絡訓練優(yōu)化變量的權(quán)值,從而進行匯率預測。例如, Qi和Wu(2003)用基于貨幣理論的神經(jīng)網(wǎng)絡對英鎊和馬克1個月、6個月、12個月的匯率進行預 測,輸入變量為貨幣供應量M1,各個國家的實際工業(yè)生產(chǎn)收入、利率作為輸入變量。Lee和W ong(2007)用微觀結(jié)構(gòu)理論和宏觀經(jīng)濟的6個變量作為神經(jīng)網(wǎng)絡的輸入,預測匯率波動。

另一種方法是用神經(jīng)網(wǎng)絡與協(xié)整方法結(jié)合。先通過協(xié)整分析確定影響匯率變動的因素,再用 神經(jīng)網(wǎng)絡確定各變量的權(quán)值。Inc和Trafalis(2006)構(gòu)建了一個結(jié)合協(xié)整方法和人工神經(jīng)網(wǎng) 絡的匯率預測模型方法,先用協(xié)整方法確定對匯率有影響作用的變量,然后用ANN對這些變 量進行非線性組合,預測匯率。[9]

異質(zhì)神經(jīng)網(wǎng)絡模型將匯率視為整體經(jīng)濟系統(tǒng)中的一個變量,匯率波動受眾多因素的影響,因 此匯率的波動是根據(jù)這些影響因素的波動來預測的,與同質(zhì)神經(jīng)網(wǎng)絡模型相比有更強的理論 支持。但是,它的預測效果取決于影響因素的選擇,因此匯率的影響因素的選擇是異質(zhì)神經(jīng) 網(wǎng)絡預測模型的關鍵。

三、匯率預測的神經(jīng)網(wǎng)絡組合模型

神經(jīng)網(wǎng)絡進行匯率非線性組合預測是一個兩步組合預測模型。Bates和Granger(1969)證明了 預測方法的線性組合比單模型能產(chǎn)生更小的誤差。[10]此后,一些學者在這方面做 了很多研 究。在眾多的組合方法中,神經(jīng)網(wǎng)絡非線性組合是最廣泛使用的方法。Hu和Tsoukalas(1999 )用不同的GARCH模型預測條件波動,并對這些預測值分別進行線形和非線性組合,結(jié)果表明 用神經(jīng)網(wǎng)絡進行非線性組合的預測效果是最好的。[11]Tseng等(2002)用BP神經(jīng)網(wǎng) 絡和時間 序列模型――SARIMA模型進行組合,用SARMIA(Seasonal Autoregression Moving Integrat e Average)對匯率進行線性預測,再用神經(jīng)網(wǎng)絡處理SARMIA模型預測的殘差,進行匯率預測 。[12]用同樣的方法還有Zhang(2003)用ARIMA和ANN組和對英鎊和美元匯率進行預 測。[13]Yu, Wang和Lai(2005)組合廣義線性自回歸模型(GLAR)和神經(jīng)網(wǎng)絡進行 匯率預測。[14]

用神經(jīng)網(wǎng)絡對匯率進行非線性組合預測時,是將匯率數(shù)據(jù)分解成線性部分和非線性部分。先 用基本因素模型或者參數(shù)模型對匯率進行第一步預測;然后用神經(jīng)網(wǎng)絡對第一步預測殘差進 行非線性組合;再根據(jù)兩步的預測結(jié)果進行匯率預測?;蛘哂蒙窠?jīng)網(wǎng)絡對不同的參數(shù)模型的 預測結(jié)果進行非線性組合。下面以神經(jīng)網(wǎng)絡和ARIMA模型的非線性組合為例,說明神經(jīng)網(wǎng)絡 組合模型的基本原理。

(3)用神經(jīng)網(wǎng)絡mode殘差:[AKn^]t=f(et-1,et-2,…,et-n)[JY](4)

其中,f表示神經(jīng)網(wǎng)絡的預測的非線性函數(shù),et是隨機誤差。

(4)組合ARIMA和神經(jīng)網(wǎng)絡:[AKy^]=[AKl^]+[AKn^]t[JY](5)

神經(jīng)網(wǎng)絡組合模型使用神經(jīng)網(wǎng)絡和線性方法進行非線性組合,考慮了匯率作為一個復雜系統(tǒng) 同時具有線性和非線性特征的實際,充分利用了參數(shù)方法和非參數(shù)方法的優(yōu)勢,并綜合了各 種匯率理論的分析結(jié)果。大量的實際研究表明,組合預測的效果比單獨用線性模型或單獨用 神經(jīng)網(wǎng)絡預測的效果要好。

四、比較與結(jié)論

同質(zhì)神經(jīng)網(wǎng)絡預測模型是根據(jù)歷史數(shù)據(jù)進行匯率預測,是用一維的數(shù)據(jù)訓練神經(jīng)網(wǎng)絡。它沒 有 考慮匯率作為經(jīng)濟系統(tǒng)中的一個變量,受到眾多因素的影響,而僅僅把匯率視為一系列沒有 經(jīng)濟含義的無規(guī)則數(shù)據(jù)。而異質(zhì)神經(jīng)網(wǎng)絡模型則把匯率視為復雜經(jīng)濟系統(tǒng)中的一個變量,認 為在統(tǒng)計上無規(guī)則的匯率數(shù)據(jù)是由眾多因素共同決定的。異質(zhì)神經(jīng)網(wǎng)絡模型用二維數(shù)據(jù)進行 訓練,與同質(zhì)神經(jīng)網(wǎng)絡模型相比,其預測有更充分的理論支持。但是,影響匯率的因素至今 沒有定論也沒有統(tǒng)一的選取法則。

同質(zhì)神經(jīng)網(wǎng)絡預測模型和異質(zhì)神經(jīng)網(wǎng)絡預測模型都將匯率視為單純的非線性變化的時間序列 ,而實際匯率的波動不是單純的線性或非線性的,而是同時包含線性和非線性模式,因此單 純的線性模型和非線性模型都不能很好地預測匯率。而神經(jīng)網(wǎng)絡組合預測模型則與前兩種方 法有本質(zhì)的不同,它同時考慮了匯率的線性和非線性特征,在線性預測的基礎上再進行非線 性組合,充分利用參數(shù)方法和非參數(shù)方法的優(yōu)勢。一方面,研究表明線性預測有很多效果很 好 的方法,如ARIMA,GARCH等參數(shù)模型;另一方面,這些模型都基于很強的假設條件,不同的 條 件下預測效果有很大差別。因此,在實際預測時候,很難確定某個模型比其他模型有更好的 樣本外預測效果。最優(yōu)模型的選擇是件很困難的事情。用神經(jīng)網(wǎng)絡組合模型,避免了 最優(yōu)模型選擇的問題,又綜合了不同的匯率理論的分析結(jié)果。

另外,同質(zhì)神經(jīng)網(wǎng)絡預測模型和異質(zhì)神經(jīng)網(wǎng)絡預測模型都是單模型的一步預測的方法,研究 表明單一的模型往往只能適應某一特定的情況或者反映一部分的信息,而實際匯率是一個復 雜的系統(tǒng),組合不同的參數(shù)模型或者參數(shù)模型不同參數(shù)的預測結(jié)果,能夠較大限度地利用各 種預測樣本信息,比單個預測模型考慮的問題更系統(tǒng)、更全面,從而提高了預測的精度。

自2005年7月21日起,中國實行匯率改革以來,央行入市干預的力度明顯減弱。由市場供求 關系決定的人 民幣匯率受到眾多因素的影響,波動幅度較以往明顯加大。用神經(jīng)網(wǎng)絡組合模型對人民幣匯 率進行預測,充分考慮了匯率波動的復雜性。結(jié)合線性方法和非線性方法的優(yōu)勢,能抓住匯 率波動的線性和非線性特征,并能全面挖掘和反映樣本信息,有較好的樣本外預測效果。因 此,神經(jīng)網(wǎng)絡組合模型是人民幣匯率預測的最佳選擇。

但是,用神經(jīng)網(wǎng)絡組合模型進行匯率預測也存在一些難以解決的問題。首先是神經(jīng)網(wǎng)絡自身 的優(yōu)化問題,如隱藏層數(shù)及隱藏層結(jié)點數(shù)的確定、激活函數(shù)的確定、局部最優(yōu)等,神經(jīng)網(wǎng)絡 的結(jié)構(gòu)直接影響著預測效果。其次,在神經(jīng)網(wǎng)絡進行組合預測時,如何選擇被組合的模型以 及模型的個數(shù),是另外一個難以解決的問題。第三,神經(jīng)網(wǎng)絡可以根據(jù)殘差最小的原則不斷 地調(diào)整參數(shù)來改變預測效果,但是它不能改變輸入數(shù)據(jù),而匯率數(shù)據(jù)往往是劇烈波動,存在 噪音的。因此,如何對數(shù)據(jù)進行除噪,優(yōu)化神經(jīng)網(wǎng)絡的輸入數(shù)據(jù)是另一個值得研究的問題。

主要參考文獻:

[1]Guoqiang Zhang, Eddy Patuwo, Michael Hu. Forecasting with artificialneural networks: The state of the art[J]. International Journal of Forecastin g, 1998, 14: 35-62.

[2]Refenes. Constructive learning and its application to currency excha nge rate forecasting. In: Neural networks in finance and investing: using artifi cial intelligence to improve real world performance, 1993, 465-493.

[3]CM Kuan, T Liu. Forecasting exchange rates using feedforward and rec urrent neural networks[J]. Journal of Applied Econometrics, 1995, 10(4): 347-6 4.

[4]De Matos. Neural networks for forecasting exchange rates: [disserta tion n]. Canada: The University of Manitoba, 1994.

[5]Gioqinang Zhang, Michael Y. Hu. Neural Network Forecasting of the Br itish Pound/US Dollar Exchange Rate[J]. Omega, Int. J. Mgmt Sci, 1998, 26(4):495-506.

[6]Mona R. El Shazly, Hassan E. El Shazly. Comparing the forecasting pe rformance of neural networks and forward exchange rates[J]. Journal of Multina tional Financial Management, 1997(7): 345-356.

[7]楊 火斤, 馬洪波. 人工神經(jīng)網(wǎng)絡在中長 期匯率預側(cè)中的應用[J]. 系統(tǒng)工程, 1999, 17(1): 18-24.

[8]HUI Xiao-feng, LI Zhe, WEl Qing-quan. Using fuzzy neural networks fo r RMB/USD real exchange rate forecasting[J]. Journal of Harbin Institute of Te chnology (New Series), 2005, 12(2): 189-192.

[9]Huseyin Ince, Theodore B. Trafalis. A hybrid model for exchange rateprediction[J]. Decision Support Systems, 2006, 42(10): 1054-1062.

[10]Bates JM, Granger CWJ. The combination of forecasts[J]. Operation s Research Quarterly, 1969, 20: 451-68.

[11]Michael Y. Hu, Christos Tsoukalas. Combining conditional volatilityforecasts using neural networks: an application to the EMS exchange rates[J].Journal of International Financial Markets, Institutions and Money, 1999, (9):407-422.

[12]Fang-Mei Tseng, Hsiao-Cheng Yub, Gwo-Hsiung Tzeng. Combining neuralnetwork model with seasonal time series ARIMA model[J]. Technological Forecas ting & Social Change, 2002, 69: 71-87.

[13]G peter Zhang. Time series forecasting using a hybrid ARIMA and neu ral network model[J]. Neuro computing, 2003, 50: 159-175.

[14]LeanYu, Shouyang Wang, K. K. Lai. A novel nonlinear ensemble foreca sting model incorporating GLAR and ANN for foreign exchange rates[J]. Computer s & Operations Research, 2005, 32: 2523-2541.

Forecasting Exchange Rate with ANN: A Comparative Anal ysis

Xie Chi1 Ouyang Liang2 Abstract:With the popularity of floating exchange rate system,a lot of methods with parameter and non-parameter are adopted to forecast the ex change rate, and ANN is one of them. There are three types of ANN for exchange r ate forecasting, namely the homogenous ANN model, the heterogeneous ANN model an d the hybrid ANN model. This paper researches on the three models, specificallytheir characteristics and limitations, and draw the conclusion that both ANN mod el give full consideration to the linearity and nonlinearity characters of the e xchange rate. The ANN model can offer better results in a more systematic and co mprehensive way, because it adopts the thoughts integrating the analysis of diff erent exchange rate theories, and broadly utilizes the forecast samples.

Key words:Exchange Rate Forecasting; Exchange Rate Fluctuation;ANN

篇3

Abstract: In order to further improve the ability of BP neural network fitting with complex functions, this paper further optimizes the genetic algorithm by changing the weights and threshold of BP neural network and applies this design model to the prediction system of vehicle sales. In order to compare its prediction effect with that of the traditional BP neural algorithm, this paper carries out the prediction simulation to compare the accuracies of the two. The simulation results show that the improved algorithm has better fitting ability and higher prediction precision for the data which has obvious linear correlation.

關鍵詞:預測;神經(jīng)網(wǎng)絡;線性相關;遺傳算法

Key words: prediction;neural network;linear correlation;genetic algorithm

中圖分類號:F224 文獻標識碼:A 文章編號:1006-4311(2016)12-0074-04

0 引言

以時間序列預測汽車銷量的方法在當今的預測汽車銷售領域中占了絕大多數(shù),比如我們所熟悉的有線性回歸法、季節(jié)預測法[1]等等。線性回歸法[2](如AR、MA、ARIMA模型等)能夠體現(xiàn)銷售量數(shù)據(jù)隨時間變化的趨勢,季節(jié)預測法能夠有效地反映銷售量隨季節(jié)波動的特點。然而,除了汽車市場的內(nèi)部影響因素之外,汽車銷售量還受到市場環(huán)境變化等外部因素影響,如經(jīng)濟危機、限購政策、油價上漲、小排量購置稅優(yōu)惠政策等等[3]。在常見的預測模型中對非線性因素的處理方法存在著“自身的缺陷”,比如在外部因素引起市場一定的波動時,僅僅是靠時間序列模型的預測方法則很難做到精確。因此,在有效地收集、分析、掌握外部因素信息的基礎上,將這些因素甄別和量化,反映到整個預測過程中,提高預測模型可使用的總體信息量,提高預測模型的預測質(zhì)量,尤其在當市場環(huán)境有變化的情況之下,銷售預測精確性將會獲得較大的提高,并且更加趨近合理。

1 系統(tǒng)模型

1.1 系統(tǒng)分析

在不同的系統(tǒng)分析中,我們有時會采取不同的算法,每個算法都有各自的優(yōu)勢。遺傳算法、BP神經(jīng)網(wǎng)絡和多元回歸等算法也有著不同的優(yōu)點[4],如遺傳算法的全局尋優(yōu)性, BP神經(jīng)網(wǎng)絡的優(yōu)秀學習能力,從而避免了它們在各自單獨使用時所存在的不足。我們把數(shù)據(jù)分為兩個部分:線性相關和非線性相關,對這兩部分采取相關性分析法進行處理。緊接著,充分利用BP神經(jīng)網(wǎng)絡與多元回歸在處理數(shù)據(jù)方面的優(yōu)勢,分次處理數(shù)據(jù)的非線性和線性部分;最后,利用遺傳算法所擁有的特性,即尋優(yōu)特性,將已由BP神經(jīng)網(wǎng)絡和多元回歸算法處理的數(shù)據(jù)整合在一起,最終的目的是使各項值得到進一步優(yōu)化,如多元回歸的權(quán)值、BP神經(jīng)網(wǎng)絡的連接權(quán)值以及閾值。

在這里,我們先暫定待處理的數(shù)據(jù)為DATA,DATA中包含的記錄條數(shù)為U條。DATA的第k個記錄含有M+N個自變量,記為X 其中:

k∈{1,2,…U},i∈{1,2,…M+N};1個因變量(期望值),記為Yk其中k∈{1,2,…U}。

1.2 相關性分析

當我們要判定如國民收入和居民儲蓄存款或者身高和體重,這些變量之間的關系時,我們首先會去判定這兩個變量或兩個數(shù)據(jù)集合間是否存在線性相關時,這里就引出了我們所要用到的判定相關系數(shù)Pearson[5]。Pearson相關系數(shù)的作用最重要的是用來判定定距變量間的線性關系和兩個數(shù)據(jù)集合是否在一條線上。某些情況下我們會用到Pearson簡單相關系數(shù)r。其計算公式為:

我們根據(jù)所得r的數(shù)值來判斷兩者相關度的強弱。一般說來,當相關系數(shù)的絕對值越大或者相關系數(shù)越接近于1或-1的情況下,相關度是越來越強的;而相關系數(shù)越趨近于0,相關度就會變得越來越弱。

若相關系數(shù)r>0.6,認定自變量Xi與Y線性相關,否則為線性不相關。根據(jù)文獻[6]可知,本文研究的BP神經(jīng)網(wǎng)絡中,輸入數(shù)據(jù)Xi i∈{1,2,…N}與輸出數(shù)據(jù)Y在Xi i∈{1,2…N}與Y線性相關,在Xi i∈{N+1,N+2…N+M}與Y線性不相關。

1.3 BP神經(jīng)網(wǎng)絡

輸入層、輸出層和隱含層[6]是BP神經(jīng)網(wǎng)絡的三個組成部分,其中輸入層和輸出層各一個,而對于隱含層,在理論上,它的數(shù)量是不會受到任何限制的,但BP神經(jīng)網(wǎng)絡在一般情況下僅設置一個或者兩個隱含層。在這個神經(jīng)網(wǎng)絡中,輸入信號經(jīng)過作用函數(shù)的作用之后,在其信號傳至隱層節(jié)點之時隨即把它得到的輸出信號傳遞到輸出層節(jié)點上,同樣經(jīng)過處理后而得到的輸出便是最終的結(jié)果。作用函數(shù)S型函數(shù)在本文中的節(jié)點之間會被用到,它的計算公式為:f(x)= 。

本文構(gòu)建的神經(jīng)網(wǎng)絡模型如圖1所示。

由圖1可知,我們這個神經(jīng)網(wǎng)絡模型共有四層。模型的第一層X即是輸入層,它是以非線性相關的Xi i∈{N+1,N+2…N+M}的數(shù)據(jù)作為其輸入的;神經(jīng)網(wǎng)絡包括的兩個隱含層分別是第二層J和第三層I;神經(jīng)網(wǎng)絡模型的輸出層就是第四層BY。例如圖1上的J層第1節(jié)點,當它和第I層的第2個節(jié)點連接時,權(quán)值的計算值則為W 。如若模型采用的節(jié)點作用函數(shù)為f(x)= ,則可以得到該節(jié)點的輸出為Y =f( W Y -B )。該式中W 、Y 和B 分別表示某一節(jié)點與其上層節(jié)點之間的連接權(quán)值、上層各節(jié)點的輸出值和節(jié)點的閾值。根據(jù)公式:E=(t-BY)*BY(1-BY),它表示的含義是網(wǎng)絡誤差的計算,在式中t的含義是輸出的期望值。將網(wǎng)絡誤差與最大允許誤差進行比較:

BP神經(jīng)網(wǎng)絡在模式匹配、模式分類、模式識別和預測分析等方面[7],性能優(yōu)勢十分明顯。

雖然BP算法是網(wǎng)絡結(jié)構(gòu)中應用比較普遍的算法之一,而且BP算法在應用上也取得了一定的成功,但是BP算法本身還是存在著不可避免的局限性:

①在BP神經(jīng)網(wǎng)絡算法中,它為了不使加權(quán)值過大,通常選取較小的隨機數(shù)(如0~0.2之間)作為初始權(quán)值,同時設置網(wǎng)絡在初始階段就處于S型函數(shù)的飽和區(qū),就是在這樣給定初值的范圍內(nèi),有些取值也會使算法的結(jié)果值陷入局部極小,一旦有了某些局部極小點[8]的牽累,就會引起訓練的振蕩而達不到我們所想要的穩(wěn)定,同樣也會陷入局部極值的不利情況。

②在BP算法中,我們需要設置一些參數(shù)的初始值,以便網(wǎng)絡訓練得以進行。如初始權(quán)重值,隱層節(jié)點個數(shù)值,當我們在設置沒有任何參考時,可能會致使網(wǎng)絡訓練的失敗或者說執(zhí)行的并不如我們所預料的結(jié)果那樣,與理想有所差別。但是這些參數(shù)的選取過程又缺乏嚴格的理論依據(jù),需要根據(jù)我們過往的經(jīng)驗以及一定的實驗來選取,才可保證它的選取值合適與否。

③在BP算法中,它存在一個遺忘所學樣本的趨勢,就是在每當其輸入一個的權(quán)重值時,會導致閾值不斷地修改,所以前面已學的學習樣本必然會受到后面每次所輸入樣本的影響。

2 一種BP神經(jīng)網(wǎng)絡和線性回歸優(yōu)化的遺傳雜合算法

為了實現(xiàn)網(wǎng)絡訓練的過程并得到全局相應的最優(yōu)化的解,我們提出一種基于BP神經(jīng)網(wǎng)絡和線性回歸優(yōu)化的遺傳雜合算法。在文章的前面我們知道,傳統(tǒng)的BP神經(jīng)的學習過程存在一些不足,我們提出的這種算法會把BP神經(jīng)網(wǎng)絡和遺傳算法結(jié)合起來,利用遺傳算法的全局尋優(yōu)特性,來實現(xiàn)網(wǎng)絡的訓練,得到全局相應的最優(yōu)解。改進的算法模型如圖2。

待處理數(shù)據(jù)Xi i∈{1,2…N}和Y,我們假定兩者是呈線性相關的。首先對線性不相關數(shù)據(jù)進行BP神經(jīng)網(wǎng)絡處理輸出為BY,BY與存在線性相關的數(shù)據(jù)進行多元線性回歸。

模型誤差:

2.1 改進算法模型的遺傳優(yōu)化

在生物進化機制的搜索方法中有自然選擇和自然遺傳,而本文改進的遺傳算法就是基于這些內(nèi)容的。現(xiàn)如今有一種算法正趨于發(fā)展成為自適應啟發(fā)式概率性迭代式全局搜索算法[9]。某個優(yōu)化問題的解集,也就是它的搜索空間,并且映射搜索空間為遺傳空間。我們隨機產(chǎn)生的一組初始解,在遺傳算法中稱作此初始解為群體,它所產(chǎn)生的后代中不斷地傳下去并且一代一代地進化,我們稱之為遺傳。我們找到收斂為最佳的染色體,即是最優(yōu)解。

將以上改進的遺傳優(yōu)化算法運用到BP神經(jīng)網(wǎng)絡的權(quán)重、閾值以及回歸系數(shù)上,可以達到優(yōu)化這些參數(shù)的目的,使網(wǎng)絡誤差值最小。在本文的實驗中,由生物種群的概念,我們視BP神經(jīng)網(wǎng)絡和回歸系數(shù)的所有權(quán)值為一個種群。本文的實驗是基于遺傳代數(shù)1000、種群60所進行的遺傳算法優(yōu)化訓練過程。即為圖3所示過程。

2.2 算法詳細流程

①樣本值歸一化處理。

對原始樣本值X,Y按照公式X′= -1,Y′= -1歸一化處理作為模型輸入數(shù)據(jù),歸一化處理后數(shù)據(jù)在[-1,1]之間。式中X′、Y′為歸一化后的數(shù)值,Ymin、Xmin為原始數(shù)據(jù)最小值,Ymax、Ymax為原始數(shù)據(jù)最大值。

②參數(shù)集。

將模型中待優(yōu)化參數(shù)BP網(wǎng)絡權(quán)重W 、閾值B 與回歸系數(shù)?孜組成一個參數(shù)集C={W ,B ,?孜},C作為染色體,Ci為單個基因。

③編碼。

編碼方式中有一種稱為實數(shù)編碼的,它是指個體編碼的長度與決策變量的個數(shù)相等,在合理具體的條件范圍內(nèi),用一個實數(shù)表示某個體的每個基因值。該方法中用到的值是決策變量的真實值,因此我們又稱它為:真值編碼方法??紤]我們實驗過程所需要的算法,這種編碼方式對于我們的實驗十分合適。

④初始化種群。

種群大小N=60,隨機生成第一代個體C 其中t為代數(shù)t=1,i表示個體編號i∈{1,…, },C 表示第一代的第五個個體。

⑤個體適應度。

我們以f =Emax-E(C )為個體適應度函數(shù),能夠滿足我們的要求。式中f 表示第t代的第i個個體的適應度計算值,Emax為最大系統(tǒng)誤差,E(C )為C 個體的系統(tǒng)誤差。

⑥選擇操作。

在試驗中我們需要知道選擇概率值,所以由前公式f =Emax-E(C )和公式P = 兩者結(jié)合便可以計算出選擇概率。我們在pop(t)代中根據(jù)所計算得到的概率值隨機的選擇一部分個體染色體遺傳到下一代,為pop(t+1)代。將選擇出的個體染色體暫且稱為一個中間代mespop(t),并將其作為下面遺傳操作(交叉、變異)的對象。

⑦交叉算法。

我們先假設要交叉的兩個父體對象分別為Pi=(p ,

⑧變異算法。

在選擇交叉的遺傳過程中,我們也需要考慮到遺傳變異這一情況。所以我們采取了一種特殊的變異算法:邊界變異。它在遺傳的后代種群中選擇中間代mespop(t)代,又在其中選擇N對個體,當交叉概率為Pc時,以此概率值指導個體進行遺傳變異。邊界變異的取值方法的多樣性也正是后代種群群體多樣性的特點。其變異位的值往往是在它的邊界上,因為在邊界上,通常存在著許多約束優(yōu)化的最優(yōu)值,也就是其編碼位取值范圍的邊界之一。在中間代mespop(t)完成交叉和變異所形成的下一代中pop(t+1)進行個體適應度值計算的操作。

3 仿真結(jié)果和分析

仿真實驗中,分別采用多元線性回歸、傳統(tǒng)BP神經(jīng)網(wǎng)絡和本實驗算法對多元線性方程、多元非線性方程、含有線性和非線性部分的方程進行擬合。

多元線性方程:

多元非線性方程:

含有線性和非線性部分的方程:

3.1 樣本數(shù)據(jù)

樣本輸入數(shù)據(jù)是在考慮影響汽車銷售多方面因素的前提下,如:經(jīng)濟危機、限購政策、油價上漲、小排量購置稅優(yōu)惠政策等,在Matlab平臺下擬合而成。樣本輸入數(shù)據(jù)為xi∈[-1,1],樣本總數(shù)為20,隨機生成20組數(shù)據(jù)作為樣本值(圖4)。

選用第一行到第四行作為式(8)的輸入函數(shù)值,如圖5。

選用第一行到第二行作為式(9)的輸入函數(shù)值,如圖6。

選用第一行到第二行作為式(10)的輸入函數(shù)值,如圖7。

3.2 仿真結(jié)果

式(8)多元線性回歸、BP神經(jīng)網(wǎng)絡、改進算法仿真結(jié)果(圖8)。

式(9)多元線性回歸、BP神經(jīng)網(wǎng)絡、改進算法仿真結(jié)果(圖9)。

式(10)多元線性回歸、BP神經(jīng)網(wǎng)絡、改進算法仿真結(jié)果(圖10)。

多元線性回歸、BP神經(jīng)網(wǎng)絡、改進算法擬合三種方程誤差平方和如表1所示。

3.3 仿真結(jié)果分析

由結(jié)合改進算法的特點和對比分析所得到的實驗結(jié)果,我們可以得到以下三點結(jié)論:①多元線性回歸在擬合線性方程時所產(chǎn)生的誤差比較小,而在擬合非線性方程時,產(chǎn)生的誤差略大。②BP神經(jīng)網(wǎng)絡在擬合存在非線性數(shù)據(jù)時,誤差較小,在擬合線性方程時存在明顯的不足。③三種算法在擬合非線性和線性結(jié)合方程時,本實驗的誤差要比單純擬合非線性方程小很多,與理論預期明顯相悖。對于這種情況的原因,結(jié)合理論,本文總結(jié)出可能存在的兩小點:1)數(shù)據(jù)的輸入值范圍在[-1,1],范圍太小,對函數(shù)值得影響不顯著;2)由于實驗采用擬合函數(shù)的形式,函數(shù)關系內(nèi)部過于簡單。

4 結(jié)論

用改進算法擬合復雜函數(shù)的能力比單純依靠線性回歸和BP神經(jīng)網(wǎng)絡存在明顯的優(yōu)勢。影響商品銷售的因素有很多,各種因素對銷售的影響也各不相同,傳統(tǒng)的BP神經(jīng)算法可以很好的預測效果。但是BP算法在處理那些同銷售值存在較大相關性的因素時,不能突出它的優(yōu)勢。我們通過把影響銷售較大的因素與其他因素直接加權(quán)相加得到銷售值,最后通過遺傳算法來優(yōu)化權(quán)值。這也就是我們研究本文算法的目的之所在。

參考文獻:

[1]張彥鐸,李哲靖,魯統(tǒng)偉.機器人世界杯足球錦標賽中多機器人對目標協(xié)同定位算法的改進[J].武漢工程大學學報,2013(02):69.

篇4

關鍵詞:電力系統(tǒng); 短期負荷預測; 預測方法; 實際應用

隨著計算機應用技術(shù)與電力系統(tǒng)短期負荷預測快速發(fā)展,在自組織灰色神經(jīng)網(wǎng)絡的非線性動力學性質(zhì),主要采用動力學系統(tǒng)理論來分析電力系統(tǒng)短期負荷預測自組織灰色神經(jīng)網(wǎng)絡的演化過程和吸引子的性質(zhì),促進自組織灰色神經(jīng)網(wǎng)絡的協(xié)同行為和集體計算功能和電力系統(tǒng)短期負荷預測以及電力系統(tǒng)發(fā)電計劃的重要組成部分,也是電力系統(tǒng)經(jīng)濟運行的基礎管理。促進國家電網(wǎng)運行的安全性、穩(wěn)定性及經(jīng)濟性,優(yōu)化電能質(zhì)量控制及準確的優(yōu)化電力系統(tǒng)短期負荷預測效果。因此,在電力系統(tǒng)短期負荷預測的關鍵是提高定位精確度。在當前電力發(fā)展迅速和供應緊張的情況下,合理優(yōu)化電力系統(tǒng)短期負荷預測也是我國實現(xiàn)電力市場的必備條件,具有重要的自組織灰色神經(jīng)網(wǎng)絡中的實用價值。

1 大規(guī)模電力系統(tǒng)短期負荷預測原理研究

短期負荷預測包括兩方面的含義對未來需求量的預測和未來用電量的預測。電力需求量的預測決定發(fā)電、輸電、配電系統(tǒng)新增容量的大小;電能預測決定發(fā)電設備的類型。短期負荷預測的目的就是提供短期負荷發(fā)展狀況及水平,同時確定各供電區(qū)、各規(guī)劃年供用電量、供用電最大短期負荷和規(guī)劃地區(qū)總的短期負荷發(fā)展水平,確定各規(guī)劃年用電短期負荷構(gòu)成不同的預測目的,短期負荷預測可分為超短期、短期和中長期的預測。一般說來,一小時以內(nèi)的短期負荷預測為超短期負荷預測,用于安全監(jiān)視、預防性控制和緊急狀態(tài)處理;日短期負荷和周短期負荷預測為短期負荷預測,分別用于安排日調(diào)度計劃和周調(diào)度計劃和月至年的短期負荷預測為中期短期負荷預測,主要確定電網(wǎng)的運行方式和設備大修計劃。

1.1 大規(guī)模電力系統(tǒng)短期負荷預測中的基于電力系統(tǒng)調(diào)度中的研究

短期負荷預測是電力系統(tǒng)調(diào)度、實時控制、運行計劃和發(fā)展規(guī)劃的前提,是一個電網(wǎng)調(diào)度部門和規(guī)劃部門所必須具有的基本信息。提高短期負荷預測技術(shù)水平,有利于計劃用電管理,有利于合理安排電網(wǎng)運行方式和機組檢修計劃,有利于節(jié)煤、節(jié)油和降低發(fā)電成本,有利于制定合理的電源建設規(guī)劃,有利于提高電力系統(tǒng)的經(jīng)濟效益和社會效益。因此,短期負荷預測已成為實現(xiàn)電力系統(tǒng)管理現(xiàn)代化的重要內(nèi)容。隨著首都經(jīng)濟社會的快速發(fā)展和人民生活水平的不提高,電力需求持續(xù)快速增長,在度冬、度夏及特殊天氣日,極易出現(xiàn)極端短期負荷。在這種情況,為了進一步優(yōu)化輸電和配電等運行方式安排,提高電網(wǎng)運行的安全性和經(jīng)濟性,改善供電質(zhì)量,保證社會的正常生產(chǎn)和生活,提高經(jīng)濟效益和社會效益,將短期負荷預測作為電網(wǎng)調(diào)度機構(gòu)的一項極其重要的工作。短期負荷預測的結(jié)果是電力系統(tǒng)運行的基礎數(shù)據(jù),其精度直接影響運行的安全性和經(jīng)濟性。因此,提高預測精度也是每個短期負荷預測人員追求的最高目標。根據(jù)不同的預測目的,短期負荷預測可分為超短期、短期和中長期的預報。

2大規(guī)模自組織灰色神經(jīng)網(wǎng)絡中的基于自組織灰色系統(tǒng)方法研究

自組織灰色神經(jīng)網(wǎng)絡中的電力系統(tǒng)短期負荷預測是既含有已知的確切的信息又含有未知的非確切的信息的系統(tǒng)。如果將影響短期負荷的各種復雜因素聯(lián)合起來看成一個集成大系統(tǒng),那么它兼有確定性和不確定性,本征性和非本征性自組織灰色系統(tǒng)特征。實際的短期負荷歷史資料能夠清晰的顯示出其自組織灰色系統(tǒng)特征,年月日的短期負荷既有逐年增長趨勢確定的一面,同時又有每年每月每日短期負荷隨機變化的不確定性的一面。自組織灰色系統(tǒng)理論可以用少量的數(shù)據(jù)做微分方程建立起預測的模型,從理論上可以使用于任何非線性的短期負荷預測。將一定范圍內(nèi)變化的歷史短期負荷數(shù)據(jù)列進行累加,使其變成具有指數(shù)增長規(guī)律的新數(shù)列,然后就生成的新數(shù)列建立自組織灰色模型,最后通過累減生成得到短期負荷預測值。對于具有波動性變化的電力短期負荷,可以建立等維新息自組織灰色預測模型,有效提高預測精度。

2.1大規(guī)模自組織灰色神經(jīng)網(wǎng)絡中的基于自組織灰色短期負荷預測模型研究

隨著自組織灰色神經(jīng)網(wǎng)絡模型是指利用神經(jīng)網(wǎng)絡良好的非線性映射能力來求解GM(1,1)模型的自組織灰色微分方程,優(yōu)化自組織灰色電力系統(tǒng)短期預測負荷模型研究(如圖一)。

(圖一)

GM(1,1)模型的自組織灰色短期負荷預測微分方程為:(1)

其解是時間響應模型,用離散形式可表示為:(2)

圖一中,BP網(wǎng)絡隱層B的傳遞函數(shù)取為S型函數(shù):(3)

其它各層的傳遞函數(shù)為線性函數(shù):(4)

對(2)式可進行如下變換:

(5)

設偏置值,是電力系統(tǒng)短期負荷中的神經(jīng)元的權(quán)值,k為短期負荷預測網(wǎng)絡輸入,設,則該自組織灰色短期負荷預測模型的網(wǎng)絡參數(shù)為:

(6)

啟用自組織灰色神經(jīng)網(wǎng)絡短期負荷預測模型權(quán)值的來不斷修正相當于對參數(shù)a、u的不斷修正和完善電力系統(tǒng)短期負荷預測。該模型能夠解決求解參數(shù)a、u算法的缺陷問題。

3 結(jié)束語

綜合上述自組織灰色神經(jīng)網(wǎng)絡搭建的電力系統(tǒng)短期負荷預測模型學習方法和數(shù)據(jù)樣本,使自組織灰色神經(jīng)網(wǎng)絡就可以據(jù)此生成相應的權(quán)系數(shù)矩陣控制系統(tǒng),進而實現(xiàn)期望目標輸出。因此,一旦給定了經(jīng)過訓練的權(quán)系數(shù)矩陣和短期負荷預測自組織灰色神經(jīng)網(wǎng)絡的拓撲結(jié)構(gòu),就可以對被測點進行短期負荷預測[1]。但BP網(wǎng)絡學習、記憶的不穩(wěn)定性以及較慢的學習速度卻影響著它的進一步普及,實踐證明,自組織灰色神經(jīng)網(wǎng)絡有能力優(yōu)化電力系統(tǒng)短期負荷預測應用研究。

參考文獻:

[1]于繁華,劉仁云.計算智能技術(shù)及其工程應用[M].北京:科學出版社,2010.6

[2]施彥等.神經(jīng)網(wǎng)絡設計方法與實例分析[M].北京:北京郵電大學出版社,2009.12

[3]牛東曉.電力短期負荷預測技術(shù)及其應用[M].北京:中國電力出版社,2009,6.

[4]羅云霞、李燕.電力系統(tǒng)基礎[M].鄭州:黃河水利出版社,2009,1.

篇5

關鍵詞:期貨;主成分分析;RBF神經(jīng)網(wǎng)絡;預測

1引言

在對實際問題進行描述和處理中,為了能夠獲得更加全面的信息,我們經(jīng)常需要統(tǒng)計多個變量的數(shù)據(jù)。但是這些多個變量之間經(jīng)常存在一定的相關性,并不是每個變量都是我們所需要的,或者說它們攜帶的信息可能是重復的。因此我們希望用少數(shù)幾個變量來代替原有的多個變量。主成份分析法的基本思想就是通過對原始數(shù)據(jù)的降維,將多個相互關聯(lián)的變量轉(zhuǎn)化為少數(shù)幾個互不相干的變量的統(tǒng)計方法。

由于期貨價格的變化是一個非線性的時間序列,利用傳統(tǒng)的統(tǒng)計方法對期貨的價格直接進行預測,所得到的結(jié)果不是很理想。而神經(jīng)網(wǎng)絡在非線性模式中具有優(yōu)勢,因而它不需要建立復雜的數(shù)學模型就可以完成期貨價格預測?;贐P網(wǎng)絡和RBF網(wǎng)絡的預測都有較好的結(jié)果,但是相對BP網(wǎng)絡而言,利用RBF神經(jīng)網(wǎng)絡不僅解決了常用BP網(wǎng)絡易陷入局部最小的問題,而且訓練時間更短,預測的精度也比BP網(wǎng)絡高得多。本文提出使用基于主成分分析法的RBF神經(jīng)網(wǎng)絡方法對期貨價格進行預測。通過主成分分析法對原始數(shù)據(jù)降維,然后,再用這些個數(shù)較少的新輸入變量作為RBF神經(jīng)網(wǎng)絡的輸入進行模擬預測。由于主成分之間是相互獨立的,所以由各主成分組成的輸入空間不存在自相關性,從而有效地簡化了RBF網(wǎng)絡在高維時難以尋找網(wǎng)絡中心的問題,提高了預測精度。

2主成分分析法簡介及RBF神經(jīng)網(wǎng)絡算法概述

2.1主成分分析法

主成分分析法的步驟如下:

(1)原始數(shù)據(jù)的標準化處理。

主成分分析法的目的就是使用較少的變量代替并綜合反映原來較多的信息,綜合后的變量就是原來多變量的主要成分,利用這些綜合后的主要成分去代替原來的變量去解決實際問題。這里首先利用以下公式對原始變量進行標準化處理。其中原變量為xij,其含義為第j個變量的第i個值,則處理后的變量值為yij,

(3)計算矩陣R的特征根和特征向量。

利用R的特征方程|R-λi|=0求出其特征根,其對應的特征向量利用|R-λi|A=0和AA''''=1求得。然后對所求得的特征根按照大小順序進行排列。

(4)計算方差貢獻率與累計方差貢獻率。

利用公式Ki=λi/∑ni=1代入所求的特征根λi,求出各個主成分的貢獻率Ki,其貢獻率就代表了原數(shù)據(jù)信息量的百分比。

(5)確定主成分計算其得分值。

主成分的確定方法主要有兩種:(1)當前K個主成分的累計貢獻率達到某一特定值的時,則保留前K個主成分。一般采用超過85%以上。(2)選取特征值大于1的主成分。這兩種可視情況進行選取,一般前者取得主成分要多,后者要少,通常情況下是將兩者結(jié)合一起來進行使用。

2.2RBF神經(jīng)網(wǎng)絡算法概述

徑向基(RBF)網(wǎng)絡是以函數(shù)逼近理論為基礎構(gòu)造的一類向前網(wǎng)絡。其網(wǎng)絡結(jié)構(gòu)為三層,隱含層采用高斯函數(shù)為激勵函數(shù),理論上,只要隱含層中有足夠的徑向基神經(jīng)元,徑向基函數(shù)網(wǎng)絡就可以逼近任何非線性函數(shù)。輸出層為簡單的線性加權(quán)函數(shù),其網(wǎng)絡結(jié)構(gòu)如圖所示。

其中W1i為每個隱含層神經(jīng)元與輸入層相連的權(quán)值向量,Xq為輸入矢量,b1i為閾值。則隱含層的第i個神經(jīng)元的輸入為:

kqi=j(w1ji-xqj)2×b1i

輸出為:

rqi=exp((-kqi)2)=exp(-(||w1ji-Xq||×b1i)2)

輸出層的輸入則為各隱含層神經(jīng)元的加權(quán)求和。由于激勵函數(shù)為線性函數(shù),因此輸出為:

yq=∑ni=1ri×w22

RBF網(wǎng)絡首先通過無教師學習確定訓練輸入層與隱含層間的權(quán)值w2。再通過有教師學習,確定訓練隱含層與輸出層間的權(quán)值w1i。在RBF網(wǎng)絡訓練中,隱含神經(jīng)元的數(shù)量確定是一個關鍵的問題。其基本原理是從0個神經(jīng)元開始訓練,通過檢查輸出誤差使網(wǎng)絡自動增加神經(jīng)元。每次循環(huán)使用,使網(wǎng)絡產(chǎn)生的最大誤差所對應的輸入向量作為權(quán)值向量w1i,產(chǎn)生一個新的隱含層神經(jīng)元,然后檢查新網(wǎng)絡的誤差,重復此過程直到達到誤差要求或最大隱含層神經(jīng)元為止。由此可見,徑向基函數(shù)網(wǎng)絡具有結(jié)構(gòu)自適應確定、輸出與初始權(quán)值無關等特點。

3改進的RBF神經(jīng)網(wǎng)絡對期貨價格的實例預測

3.1主成分分析

期貨的價格是受很多因素影響,如國家政策、季節(jié)氣候、供求關系、戰(zhàn)爭等,所以其價格會上下波動,呈現(xiàn)出一個非線性時間序列。其交易價格本文選取2007年6月7日至8月29日燃油0801每個交易日的開盤價、最高價、最低價、收盤價、交易量、持倉量、前5日均價、前10日均價為初始變量,每個變量60個數(shù)據(jù),前59個為訓練樣本,最后一個為檢測樣本。考慮到期貨交易與股票交易的不同,其交易方式是雙向交易,從投資者獲利的角度考慮,其并不像股票市場一樣單純的考慮股票價格增長,加上每個星期正常的期貨交易日僅為5天,所以在這里我們考慮選取后5日均價作為預測目標,這樣的選擇更有實際意義。在這里本文直接利用SPSS軟件包,選擇數(shù)據(jù)降維,再選用主成分分析,可以直接得到各個主成分的方差累計貢獻率,如表1所示:

從表中我們可以看出,第一個主成分主要包含了開盤價、最高價、最低價、收盤價、以及前5日均價共五個變量的信息,第二個主成分主要包含了成交量和持倉量兩個變量的信息,而第三個主成分則主要包含了前十日均價一個變量的信息。由此可以看出,通過數(shù)據(jù)降維,將原來的8個變量,轉(zhuǎn)化為現(xiàn)在的3個變量了。

3.2神經(jīng)網(wǎng)絡的設計及訓練

現(xiàn)設計一個三層的神經(jīng)網(wǎng)絡,輸入層有3個神經(jīng)元,輸出層神經(jīng)元為1個。利用下式對輸入、輸出值進行標準化,可使得輸入、輸出值其均落在[-1,1]區(qū)間。

xn=2*(x-minx)/(maxx-minx)-1

在matlab的神經(jīng)網(wǎng)絡工具箱中用newrb函數(shù)設計這個徑向基函數(shù)網(wǎng)絡,用其作函數(shù)逼近時,可自動增加隱含層神經(jīng)元,直到達到均方誤差為止,利用語句:net=newrb(P,T,GOAL,SPREAD)進行網(wǎng)絡設計,其中GOAL為均方誤差,這里取值為0.0001,SPREAD為徑向基函數(shù)的擴展速度,其值越大,函數(shù)的擬合就越平滑。經(jīng)過試驗,當其取0.058時,其預測效果最好。把2007年6月7日至8月28日的燃油0801選定的主成分作為輸入的訓練樣本,標準化的后5日均價的值作為輸出的訓練樣本,8月29日的數(shù)據(jù)作為測試樣本,計算結(jié)果如下:

4結(jié)語

由此可看出基于主成分分析法的徑向基神經(jīng)網(wǎng)絡較一般的徑向基網(wǎng)絡有更簡潔的網(wǎng)絡結(jié)構(gòu),對于相對比較復雜的期貨價格預測,基于主成分分析法的徑向基神經(jīng)網(wǎng)絡得到的結(jié)果也更加精確。不過徑向基神經(jīng)網(wǎng)絡本身對擴展速度的選擇沒有一個固定的標準,不同的值得到的結(jié)果有較大的偏差,這是該網(wǎng)絡的一個缺陷,也是今后研究的一個方向。

參考文獻

[1]黃穎,白玫,李自珍.基于主成分-BP神經(jīng)網(wǎng)絡的期貨市場預測[J].數(shù)學的實踐與認識.2007,(7):23-26.

[2]劉興彬,萬發(fā)祥.RBF神經(jīng)網(wǎng)絡主成分分析法在交通量預測中的應用[J].山西科技,2001,(1):54-56.

篇6

隨著我國社會主義現(xiàn)代化建設不斷加快發(fā)展的過程中,城市化進程在不斷的推進,而作為我國國民經(jīng)濟中最為重要的電力發(fā)展的建設開始迎來了新的挑戰(zhàn)和壓力,尤其是隨著電力規(guī)模的不斷擴大,建設的周期延長以及范圍的不斷加大,都給電力工程的造價帶來了巨大的挑戰(zhàn)。在這樣的發(fā)展趨勢下,為了有效讓電力建設的發(fā)展具有一定的安全性保障,并在可行性的工程造價的順利開展下,通過數(shù)據(jù)挖掘和神經(jīng)網(wǎng)絡技術(shù)的應用,來促進我國電力建設的發(fā)展。本文也將從這兩個方面的技術(shù)應用來展開較為系統(tǒng)的分析。

【關鍵詞】

數(shù)據(jù)挖掘;神經(jīng)網(wǎng)絡技術(shù);電力工程造價;應用分析

隨著科學技術(shù)的發(fā)展,經(jīng)濟全球化的趨勢,數(shù)據(jù)挖掘已經(jīng)在全世界范圍內(nèi)得到了廣泛的關注和應用,并得以快速發(fā)展起來,而其中最根本的原因在于全球化的科學信息技術(shù)的發(fā)展和快速世界化的感染和流行,使得互聯(lián)網(wǎng)技術(shù)在幾年內(nèi)瞬間發(fā)展起來,造成了數(shù)據(jù)過量和信息膨脹的現(xiàn)象,因此人們在這種形勢下,急需要通過一種新型的技術(shù)來對這些信息進行處理,通過篩選和提取最有效、最有價值的部分出來,因此數(shù)據(jù)挖掘起到了重要作用,而在電力工程的造價應用,通過數(shù)據(jù)挖掘和神經(jīng)網(wǎng)絡技術(shù),實現(xiàn)了其更加系統(tǒng)化的發(fā)展。

1數(shù)據(jù)挖掘的定義

數(shù)據(jù)挖掘的源起與發(fā)展可追溯回到20世紀80年代。這種數(shù)據(jù)的挖掘從不同的角度理解,有不同的含義,而其實最主要的意思是把海量綜合性的數(shù)據(jù)通過挖掘出最有用、最有效的模式和知識的一個過程,并通過這種數(shù)據(jù)的挖掘來對未知的潛在的內(nèi)容進行提取。因此從廣義上來將,這種數(shù)據(jù)挖掘的定義是一個從不完整的、不明確的、大量的并且包含噪聲,具有很大隨機性的實際應用數(shù)據(jù)中,提取出隱含其中、事先未被人們獲知、卻潛在有用的知識或模式的過程。這個過程事實上也即是數(shù)據(jù)挖掘的最根本目的,對復雜而混亂的信息進行分析和處理,并提取最有用的知識和信息給決策者。另一方面,從技術(shù)角度而言,數(shù)據(jù)挖掘的實現(xiàn)是借助一整套全面的數(shù)據(jù)計算,實現(xiàn)對海量數(shù)據(jù)信息的提取過程,并使得這部分被提取出來的信息是對人們在概念、模式以及規(guī)律等方面是最有價值的。它的這種技術(shù)操作主要是對歷史數(shù)據(jù)信息的分析,并把隱藏在潛在中的數(shù)據(jù)和關系分析挖掘出來,從而提供給人們對未來可能發(fā)生的結(jié)果起到協(xié)助分析研究的作用。

2通過神經(jīng)網(wǎng)絡技術(shù)建立數(shù)據(jù)模型

神經(jīng)網(wǎng)絡技術(shù)的實現(xiàn),是通過這種技術(shù)來對人的大腦所具有的結(jié)構(gòu)和功能進行模擬化,并達到具有模式識別的計算模型,其組成部分包括了隱層節(jié)點、輸入節(jié)點以及輸出節(jié)點三個部分。而關于隱層的部分,組成可是一層或多層的形式,一個神經(jīng)網(wǎng)絡的組成包括了非常多的成層排列的節(jié)點,數(shù)字信息的傳輸就依靠這些節(jié)點的存在。輸入信號,最有特點的神經(jīng)網(wǎng)絡是采用一個輸入層和輸入層以及位于中層的很多節(jié)點而組成起來的,并每個節(jié)點把輸入的信息作非線性處理后,然后把輸出的數(shù)字化結(jié)構(gòu)傳送到另外的節(jié)點,從而反復循環(huán)下去,就通過多個節(jié)點的作用函數(shù)之間的共同功能的發(fā)揮來得到最終的結(jié)果。

3數(shù)據(jù)挖掘與神經(jīng)網(wǎng)絡技術(shù)的電力工程造價中的應用

3.1對歷史數(shù)據(jù)的搜集和整理

對數(shù)據(jù)和資料的搜集工作,主要有電力系統(tǒng)的內(nèi)部資料內(nèi)容,以及在互聯(lián)網(wǎng)技術(shù)的幫助下所搜尋獲取到的數(shù)據(jù)資料,而且包括在持續(xù)一周左右的時間被研究用電地區(qū)的電力負荷所使用的歷史數(shù)據(jù)信息,并對所進行搜集的該地區(qū)的時間天氣情況、氣溫高低、濕度大小以及是否是工作日的信息內(nèi)容。然后將這些搜集到的信息資料進行匯總整合,然后篩選出預測所要求的數(shù)據(jù)和信息內(nèi)容。在這個過程中,需要注意的是,篩選數(shù)據(jù)要選擇與當前時間最接近,而且具有較安全和可靠的數(shù)據(jù)來源,只有這樣才能從根本上確保電力負荷預測的質(zhì)量,才能達到電力負荷預測要求的準確度,從而使得所建立的負荷預測模型的使用更加合理,才能真正表現(xiàn)出電力負荷數(shù)據(jù)的有效規(guī)律。

3.2對歷史電力負荷數(shù)據(jù)的預處理

在大多數(shù)情況下,負荷預測所得到的結(jié)果在質(zhì)量上與所選用資料和數(shù)學的質(zhì)量相比較,并沒有絕對的優(yōu)勢,因此如果所搜集的數(shù)據(jù)要進行負荷預測模型的這部分數(shù)據(jù)則要通過預處理的過程才能確保數(shù)據(jù)的質(zhì)量。而這種預處理除了通過比較老式的人工審核的辦法以外,還可以通過數(shù)據(jù)的挖掘來提高對數(shù)據(jù)處理的工作效率和質(zhì)量,并對數(shù)據(jù)中存在的異常值進行及時的發(fā)現(xiàn)和處理修改,這也是一種為工作人員在出現(xiàn)部分數(shù)據(jù)的疏漏時進行填補的作用。

3.3建立負荷預測模型來進行負荷數(shù)據(jù)的預測

為了有效而準確的測出負荷數(shù)據(jù),可通過建立負荷預測的模型,這種模型的種類較為多,包括人工神經(jīng)網(wǎng)絡模型、專家系統(tǒng)模型等,但到底使用哪種模型來對數(shù)據(jù)進行預測才能達到預期的預測效果和質(zhì)量,還需要通過慎重選擇才能實現(xiàn)。

3.4對預測結(jié)果的誤差分析

一個短期的電力負荷預測模型如果已經(jīng)建立完成,那么要判斷其預期的效果是否有效和準確,那么就要對這種預測模型的預測結(jié)果進行誤差分析即可。這種誤差的分析是因為預測模型的輸出結(jié)果相似于預測日的負荷值,因此利用這種與真實數(shù)據(jù)之間的差值進行誤差的大小確立起預測結(jié)果是否準確有效。另外一方面,不僅如此,還可以在這種誤差分析的作用下,來對預測工作和預測的方法積累更多的實用性的經(jīng)驗。尤其是在我國電力改革在快速發(fā)展的狀態(tài)下,電網(wǎng)的運作方式已經(jīng)開始從各個方面包括規(guī)劃、建設、規(guī)模以及范圍都發(fā)生了改變,所以要求電網(wǎng)建設要具備更加規(guī)范化和科學合理化的標準進行更進一步的發(fā)展和完善,并在當前科學技術(shù)的支持作用下,引入科學的管理理念、先進的數(shù)據(jù)分析方法以及信息化技術(shù),在技術(shù)的不斷推動應用下,讓人們對相關數(shù)據(jù)信息的獲取量更多。所以,在預測數(shù)據(jù)方面的技術(shù)還需要不斷得到更加深入的發(fā)展,才能為我國的電力建設提供更加有力的幫助。

3.5數(shù)據(jù)挖掘與神經(jīng)網(wǎng)絡技術(shù)的電力造價應用總結(jié)

在電力造價的應用過程中,其數(shù)據(jù)挖掘和神經(jīng)應用的技術(shù)應用實現(xiàn)了對電力數(shù)據(jù)結(jié)果、運行速度之間的關聯(lián)性,并對我國的電力建設發(fā)揮著重要的積極意義。而通過數(shù)據(jù)挖掘和神經(jīng)網(wǎng)絡技術(shù)的造價預測模型的建立,得出了更加多元化的輸入和輸出,這反映除了在電力工程造價過程中的多元非線性映射問題,所以通過模糊的神經(jīng)網(wǎng)絡來實現(xiàn)對電力工程造價的核心計算辦法。在神經(jīng)網(wǎng)絡的技術(shù)應用下,實現(xiàn)了數(shù)據(jù)信息的搜集和篩選,但實質(zhì)上這個神經(jīng)網(wǎng)絡的推理篩選過程還有一定的無法確切的解釋。而模糊系統(tǒng)則通過邏輯推理和專業(yè)領域的知識讓技術(shù)的應用更加具有一種指向性?;谏窠?jīng)網(wǎng)絡的模糊系統(tǒng)能夠綜合兩者的優(yōu)點,有效的通過這種數(shù)據(jù)挖掘和神經(jīng)網(wǎng)絡技術(shù)的應用,提高了互聯(lián)網(wǎng)技術(shù)應用的容錯性和泛化能力,并提高了模型建立的有效性。

4結(jié)束語

綜上所述,在我國的電力工程造價預測和改革發(fā)展的過程中,數(shù)據(jù)挖掘以及神經(jīng)網(wǎng)絡技術(shù)在其中起到了不可替代的關鍵性作用,并為了電力建設的發(fā)展帶來了非常實用性的價值。通過數(shù)據(jù)挖掘技術(shù)來對大量的綜合信息數(shù)據(jù)進行預處理和篩選,來達到數(shù)據(jù)信息所能起到的最大的作用,并在神經(jīng)網(wǎng)絡技術(shù)對所創(chuàng)建的專業(yè)模型的應用,讓人工預測和審查的被動性得到了解決,并提高了電力工程造價過程中人為因素的消極影響,而更好的保障了信息結(jié)果的有效性。

作者:劉勇華 單位:廣東匯盈電力工程有限公司

參考文獻

[1]歐陽子才.數(shù)據(jù)挖掘和神經(jīng)網(wǎng)絡技術(shù)的電力工程造價應用[J].中華民居,2013,18(21):279~280.

篇7

(浙江交通技師學院,浙江金華321015)

摘要:基于預測控制算法的動態(tài)矩陣控制理論,改進得到了算法模型的誤差相關矩陣,給出約束多變量DMC模型以及神經(jīng)網(wǎng)絡誤差補償?shù)膭討B(tài)矩陣控制驗證,在誤差控制仿真驗證中,應用神經(jīng)網(wǎng)絡誤差補償?shù)念A測控制效果優(yōu)勢明顯,這一研究對模糊預測技術(shù)的進一步推廣應用有一定的促進作用。

關鍵詞 :動態(tài)矩陣控制;預測模型;神經(jīng)網(wǎng)絡;誤差補償

中圖分類號:TN711?34 文獻標識碼:A 文章編號:1004?373X(2015)15?0087?03

收稿日期:2015?01?28

0 引言

隨著社會經(jīng)濟進步與技術(shù)手段的不斷創(chuàng)新,復雜系統(tǒng)的控制技術(shù)已經(jīng)成為國內(nèi)外控制科學研究者的重點研究話題之一。對大型的工業(yè)設備而言,控制主要體現(xiàn)為對系統(tǒng)的非線性和環(huán)境的不可控性的控制,而且受實際環(huán)境影響,各種技術(shù)性的約束問題也越來越明顯。這些問題都使得控制技術(shù)在實際工業(yè)生產(chǎn)中的地位不斷得到提升。而近年來國內(nèi)外科學家一致推崇的模糊預測控制法[1?2]就是一種新的控制技術(shù)和手段。模糊預測控制是一種結(jié)合了模糊思想和預測思想的具體研究方法和手段,并且在現(xiàn)實應用中得到了一定程度的普及和提升。將模糊控制和技術(shù)手段相聯(lián)系有利于提高控制效果。同時,預測作為一種較為傳統(tǒng)和較為典型的控制方法,有利于更好地搭建二者溝通的橋梁。同時,預測控制是一種基于數(shù)學對象模型的優(yōu)化控制方法,但是在實踐中發(fā)現(xiàn),系統(tǒng)的復雜性和精確性往往是負相關關系。一般而言,較為復雜的系統(tǒng),難免影響到其精確性的實現(xiàn),因此,要研究模糊環(huán)境下的預測控制技術(shù)手段的應用,以及其對拓展空間應用范圍和提高其適應不同環(huán)境使用能力的重要意義。

通過實地走訪和查閱相關學術(shù)資料總結(jié)得出:模糊預測的控制技術(shù)主要分為兩大類別[3?4]:一是針對確定性不強的非線性系統(tǒng);二是模糊預測和預測控制方法的結(jié)合使用。實踐證明,前者有利于實現(xiàn)模糊模型和預測模型的相互轉(zhuǎn)化,后者能夠?qū)崿F(xiàn)系統(tǒng)性能的總體提升[5?7]?;谶@一背景,本文將重點分析基于神經(jīng)網(wǎng)絡預測控制模型的誤差補償控制手段,并進一步分析其使用機理和數(shù)學建模過程。相信這一研究對模糊預測技術(shù)的進一步推廣應用有一定的促進作用。

1 預測模型設計

1.1 預測控制算法概述

預測控制算法究其本質(zhì),是一種以模型算法為基礎,采用先進計算機手段進行具體計算的控制算法。這種算法的實際理論體系建立在離散控制系統(tǒng)基礎之上。預測控制需要當前和過去的差距值,也需要應用一些現(xiàn)有的預測模型,以更好地對未來的運行進行預測與控制[8?10]。

模型控制作為一種基于脈沖響應而進行參考的模型具有很大的現(xiàn)實意義,并且是一種較為優(yōu)良的內(nèi)部模型。這種控制手段具體應用到了系統(tǒng)往期和現(xiàn)期的實際輸入輸出數(shù)據(jù),從而代入相關模型中去,以更好地進行模型的預測和控制。這個過程是一個很復雜的過程,需要使用模型的誤差衡量和校正系統(tǒng),并與參考值進行具體比較,從而得出相關結(jié)論。而且,在這個過程中,需要使用二次型指標的具體計算,實現(xiàn)算法的多步驟控制。這個系統(tǒng)具有諸多優(yōu)點,因此在電廠、化工廠等領域有較為廣闊的使用前景。

動態(tài)矩陣控制(DMC)是一種有別于模型算法的新型算法結(jié)構(gòu)。這種控制手段借助于工程上的一些具體手段,通過對運算量的縮減,以達到多變量控制的目的和預期。這個技術(shù)于20世紀70年代在美國殼牌公司率先使用,經(jīng)實踐檢驗證明有很大的作用。目前,已經(jīng)有以該項技術(shù)為手段的商品化軟件在市面上出售,銷量很大。因此,動態(tài)矩陣控制也成為一種具有很大發(fā)展前景和潛力的線性模型。

在參數(shù)和非參數(shù)模型的使用下,有兩種具體的算法可以進行使用。這兩種算法的具體內(nèi)容限于篇幅不做過多闡述。這兩種方法都采用了多部輸出預測和混動控制的相關策略,因此變得十分復雜。這個系統(tǒng)的原理是在20世紀80年代由Carcaia等人提出的,并且在實踐中證明有效。而且,內(nèi)部模型控制的理論和實踐的發(fā)展,極大地促進了輸出反饋擾動估計值的計算和反饋,從而實現(xiàn)對系統(tǒng)的合理預測與評估,進而提高系統(tǒng)的使用效率。

1.2 DMC優(yōu)化模型設計

DMC 優(yōu)化模型設計是一種較為方便的算法,在優(yōu)化確定策略的具體使用中有廣闊的空間和巨大的發(fā)展前景。這個算法的具體數(shù)學表達式如下:

式(1)表達的含義就是在選擇的時刻上,通過增量的計算以實現(xiàn)對系統(tǒng)未來時刻的輸出值的控制與預測。而且,通過這個技術(shù)的使用,能夠盡可能地使輸出值與預期值相近,從而避免因為數(shù)據(jù)的過大差異而導致一系列后續(xù)問題。再有,性能指標中對控制變量變化量的控制程度相對較強,這樣處理的目的十分明確,就是要控制量的變化在一個可預見的范圍內(nèi),不能超過太多。

雖然,不一樣的時間段范圍內(nèi)有不一樣的優(yōu)化指標,但是各個指標的相對形式總體上是一致而不變的,即都具有式(1)的模式。這里介紹一下滾動優(yōu)化的含義:滾動優(yōu)化就是隨著時間的推移而促進優(yōu)化范圍的深入與擴大。

如果考慮將向量和矩陣參與到運算中,則可以得到:

進而,有:

式中:Q,R 分別稱為誤差權(quán)矩陣和控制權(quán)矩陣。

如果將約束條件放寬,取最小的ΔuM (k) 可通過極值條件得到:

1.3 約束多變量DMC設計

對約束條件下的多變量DMC 設計而言,當具體的參數(shù)范圍給定以后,結(jié)合具體的參數(shù)含義,可以計算得到階段相應模型,即:

由式(4)進而推出下式:

根據(jù)數(shù)學知識(尤其是導數(shù)求解函數(shù)極值的相關內(nèi)容),可以計算得到:

式中: Gij 和G 0ij 分別為P × M 和P × (N - 1) 階矩陣,其元素由gsij (s = 1,2,…,N) 決定;hi 為P 維校正列向量,而:

將ΔUj (k) 化成全量形式,有:

1.4 設計動態(tài)矩陣控制仿真效果

對上述的動態(tài)矩陣控制仿真模型,應用數(shù)學模型可以簡化記為:

式中:系統(tǒng)a(k) 是慢時變的,a(k) = 1.2(1 - 0.8e-0.1k) ,輸入指令信號為:rin (k) = 10。由圖1控制效果可知,設計的預測控制模型顯然是合理有效的。

2 基于神經(jīng)網(wǎng)絡誤差補償?shù)膭討B(tài)矩陣控制

基于神經(jīng)網(wǎng)絡誤差補償?shù)膭討B(tài)矩陣控制是一種BP技術(shù)手段模型,而且能夠反映出網(wǎng)絡和計算之間的誤差值:

式中:tpi 為i 節(jié)點的期望輸出值;opi 為i 節(jié)點計算輸出值。

基于BP 神經(jīng)網(wǎng)絡模型的基本原理,應用其在DMC,基于篇幅這里對其理論不進行詳細描述。應用控制對象的近似數(shù)學模型為:

神經(jīng)網(wǎng)絡的結(jié)構(gòu)選擇,學習速度η = 0.5 和慣性系數(shù)α = 0.5,輸入指令信號為rin (k) = 10。

圖2 給出了上述模型的預測模型,從圖中效果可知,其余實際輸出基本類似,表明了這一模型的可用性。

3 控制模型效果的驗證

為了進一步驗證BP誤差補償?shù)念A測控制仿真程序效果,這里對異性控制對象進行進一步驗證:y(k) = 1.5y(k - 1) - 0.7y(k - 2) + u(k - 1) + 1.5u(k - 2),控制信號為方波。

圖3和圖4分別為一般DMC控制和應用BP預測模型誤差補償效果,通過對比驗證了這一模型的合理性與優(yōu)越性。

4 結(jié)語

本文在原有動態(tài)矩陣預測控制的基礎上,利用預測誤差的歷史數(shù)據(jù)建立誤差預測模型的神經(jīng)網(wǎng)絡,經(jīng)過實際對比以及相應的效果對比誤差的預測器,在得到誤差預測值的同時,實現(xiàn)了更簡單的數(shù)學模型來構(gòu)造動態(tài)矩陣預測控制算法,使得對模型失配具有較強的抑制能力,以上仿真結(jié)果驗證了該算法的有效性。本文的這一研究對預測算法的進一步發(fā)展具有重要意義和應用價值。

參考文獻

[1] 王家祥,何信.誤差補償和時滯辨識預測控制算法[J].電子科技大學學報,2005(6):817?820.

[2] 龐中華,金元郁.基于誤差校正的預測控制算法綜述[J].化工自動化及儀表,2005(2):1?4.

[3] 龐中華.廣義預測控制算法及其仿真研究[D].青島:青島科技大學,2005.

[4] 李超.網(wǎng)絡控制系統(tǒng)研究與設計[D].北京:華北電力大學,2012.

[5] 張杰超.預測控制在網(wǎng)絡化自動發(fā)電控制系統(tǒng)中的應用研究[D].北京:華北電力大學,2008.

[6] 莊玲燕.基于預測控制理論的網(wǎng)絡控制系統(tǒng)設計[D].杭州:浙江工業(yè)大學,2009.

[7] 張譯江.神經(jīng)網(wǎng)絡方法在預測控制中的研究[D].無錫:江南大學,2011.

[8] 李肖.基于預測控制的網(wǎng)絡控制系統(tǒng)時延補償控制策略研究[D].濟南:濟南大學,2011.

[9] 劉俊紅,李擎,張維存,等.一種采用神經(jīng)網(wǎng)絡進行預測誤差補償?shù)腄MC 算法[J].中南大學學報:自然科學版,2007,38(z):27?31.

篇8

【關鍵詞】鉆井機械 故障診斷 數(shù)據(jù)挖掘系統(tǒng)結(jié)構(gòu)

數(shù)據(jù)的挖掘技術(shù)是采用一些技術(shù)由比較大型的數(shù)據(jù)庫或者是倉庫里面找到比較有價值的信息與知識,而這些信息與知識大多數(shù)的時候都是隱藏的。這些有價值的信息或是知識可以通過概念、條例以及規(guī)律等方式來進行表示。

1 數(shù)據(jù)的挖掘方式與鉆井設備故障判斷的含義

1.1 設備故障的判斷技術(shù)

設備故障的判斷技術(shù)主要是為了測量提取設備在運轉(zhuǎn)中或者是處在靜止狀態(tài)中的信息,經(jīng)過測量后信號的分析與研究,再將判斷對象的以往情況相結(jié)合,從而通過訂立設備的設備和零件的實際技術(shù)的情況,預測與故障狀況相關的技術(shù)情況,再找到解決問題的措施。

1.2 數(shù)據(jù)挖掘的技術(shù)

數(shù)據(jù)的挖掘技術(shù)是采用一些技術(shù)由比較大型的數(shù)據(jù)庫或者是倉庫里面找到比較有價值的信息與知識,而這些信息與知識大多數(shù)的時候都是隱藏的。這些有價值的信息或是知識可以通過概念、條例以及規(guī)律等方式來進行表示。經(jīng)過很多年數(shù)據(jù)挖掘的技術(shù)研究,用在數(shù)據(jù)的集中分析與提取的信息。從整體來說,數(shù)據(jù)挖掘的技術(shù)主要包括兩種類型:探索性的數(shù)據(jù)挖掘與預測型的數(shù)據(jù)挖掘。探索性的數(shù)據(jù)挖掘技術(shù)主要是在不知道又什么模式出現(xiàn)的狀況中通過數(shù)據(jù)來找尋模型的技術(shù),主要包含了分群與管理的分析,頻度的分析等,而預測型的挖掘技術(shù)主要是通過數(shù)據(jù)來找尋一定的變量和跟別的變量關系的技術(shù)。預測型的挖掘技術(shù)通常使用的是分類與聚類的技術(shù),數(shù)值的預測技術(shù)。數(shù)據(jù)挖掘的技術(shù)所采用的計算方式有很多種,其中包含了統(tǒng)計方面的分析、設備的學習等。

2 鉆井設備故障的判斷數(shù)據(jù)挖掘體系的結(jié)構(gòu)

鉆井器械的故障判斷數(shù)據(jù)挖掘體系可以提供一些訪問安放鉆井器械與故障數(shù)值的數(shù)據(jù)庫、平面的文件和一些外部的接口。通過使用接口,數(shù)據(jù)挖掘的工具能夠經(jīng)過很多的途徑來得到所需要的數(shù)據(jù)。進行數(shù)據(jù)的提取時,一定要對數(shù)據(jù)實行預期的處理,為了確保在數(shù)據(jù)庫中尋找數(shù)據(jù)正確與統(tǒng)一。

挖掘庫主要是數(shù)據(jù)挖掘的工具中的中心環(huán)節(jié),在挖掘庫里放置的使用數(shù)據(jù)挖掘的技術(shù)實行的鉆井故障判斷所需要數(shù)據(jù)、計算庫以及信息庫。計算庫是用作儲存放置能夠?qū)嵭械耐诰蛴嬎愕姆椒ㄩT信息庫是用作儲存并且能夠進行合理管理通過挖掘的引擎所形成的,通過模塊明確評估的信息。數(shù)據(jù)挖掘的引擎主要通過規(guī)范的引導,全面地采用各種數(shù)據(jù)挖掘的工具,針對數(shù)據(jù)來源的至少實行整體的研究與深層次的發(fā)掘,采取有實際意義的方式,并且對評估的模塊實行評估。

挖掘的截面是用作挖掘時候的交互與挖掘完成的可視性。經(jīng)過交互讓使用者對挖掘的程序?qū)嵭辛丝刂?,如,挖掘的命令、對?shù)據(jù)的挑選、數(shù)據(jù)的輸入和計算方法的使用等。數(shù)據(jù)挖掘使用者并不是電子設備與數(shù)據(jù)庫的專業(yè)技術(shù)工作者,他們是維護工作者。所以,為了使用者的方面操作,系統(tǒng)一定要提供比較合理的界面。通過時間的展開、空間的分辨以及運動發(fā)展等一些方式給使用者提供挖掘的結(jié)果。

3 根據(jù)神經(jīng)網(wǎng)絡對鉆井器械故障判斷的研究

3.1 神經(jīng)網(wǎng)絡的模型

神經(jīng)網(wǎng)絡是比較新型模擬人智能的一種方式與技術(shù)。跟以往的研究方式與專家體系不一樣,它不但能夠解決好已經(jīng)知道的計算方式問題,還能夠經(jīng)過自身的組織與學習解決未知技術(shù)方式的問題。進行鉆井設備故障的判斷過程里,使用四層的神經(jīng)網(wǎng)絡,學習計算方法是誤差的反方向的傳播計算方式,也就是BP計算方法。

3.2 構(gòu)建神經(jīng)網(wǎng)絡

如果系統(tǒng)簡單的判斷模型只有六種故障的特點,兩種故障以及三種威脅的方式,對網(wǎng)絡訓練的例子需要挑選出比較適合鉆井機械并且好符合以下的三方面的信息:

(1)故障的特點:對待每一個特點只需要收集有、無和沒有記錄的三種類型;

(2)故障:對于每一種故障也只可以收集有、無和沒有記錄的三種類型;

(3)維修的方法:對于每一種維修方法都只需要收集是或否兩種類型。

3.3 根據(jù)神經(jīng)網(wǎng)絡進行推理

根據(jù)神經(jīng)的網(wǎng)絡推理是經(jīng)過網(wǎng)絡的技術(shù)來實行。將使用者所給出的原始證據(jù)用來輸入網(wǎng)絡,經(jīng)過網(wǎng)絡進行計算,從而獲得輸出的結(jié)果。

4 鉆井機械故障判斷

因為地處具有復雜和隱蔽性,而鉆井機械的搬遷的頻率也比較大,戶外的工作環(huán)境也很惡劣等特征,鉆井機械故障的判斷難度就會隨之而增加。故障判斷的本質(zhì)就是進行故障特點與原因分析,從故障特點來推理出來產(chǎn)生故障的原因,從而明確故障的種類,找到解決的方案。

在沒有進行挖掘計算方法前,實行了多維的分析,經(jīng)過人與計算機交換的操作,使用者可以在整個搜索的空間里控制搜索的程序,并且可以獲得模式,最后產(chǎn)生知識。如,如果鉆井機械的故障特點是由鉆井的數(shù)據(jù)苦等數(shù)據(jù)里面通過計算而獲得的鉆井及其或者產(chǎn)生故障的時候故障的特點。

5 總結(jié)

綜上所述,通過對鉆井機械故障判斷的數(shù)據(jù)挖掘系統(tǒng)結(jié)構(gòu)的分析,主要闡述了數(shù)據(jù)挖掘系統(tǒng)與鉆井機械故障的含義,數(shù)據(jù)挖掘系統(tǒng)的結(jié)構(gòu)以及鉆井機械故障判斷的分析和研究等問題。主要是采用了數(shù)據(jù)的挖掘方式,分析一些比較復雜的有關鉆井方面的機械故障判斷問題,并且給出了有關鉆井設備故障的判斷有關數(shù)據(jù)挖掘的結(jié)構(gòu),還分析了鉆井設備故障判斷的網(wǎng)絡,提供了可以供參考的系統(tǒng)模型。

參考文獻

[1] 張允,張寧生,劉茜,寧剛.鉆井機械故障診斷數(shù)據(jù)挖掘系統(tǒng)結(jié)構(gòu)的研究[J].石油學報,2006,27(1)

[2] Olivia Parr Rud.數(shù)據(jù)挖掘?qū)嵺`[M].機械工業(yè)出版社,2003:1-5

[3] 杜家興,徐宗昌,王鐵寧.裝備保障數(shù)據(jù)倉庫與數(shù)據(jù)挖掘研究[J].計算機工程與應用,2004,40(9)

篇9

關鍵詞:多變量財務預期模型 實證 比較分析

一、引言

隨著我國市場經(jīng)濟體制改革的不斷深化和資本市場的快速發(fā)展,現(xiàn)代企業(yè)由于外部市場競爭的加劇和內(nèi)部經(jīng)營管理的不善,不少公司也出現(xiàn)了財務危機。為了在激烈的市場競爭中求生存謀發(fā)展,企業(yè)有必要對其自身的財務狀況進行預警分析,以應對各方面的風險,并防范財務危機的發(fā)生。

到目前為止,企業(yè)財務預警的研究已經(jīng)積累了豐富的研究成果,即建立了多種財務預警模型對企業(yè)財務危機進行預測,并且已做了大量的實證研究。財務預警模型有單變量財務預警模型和多變量財務預警模型,但由于單變量財務預警模型只對單個財務比率的趨勢分析,沒有哪一個比率能夠概括企業(yè)財務的全貌;另外,某些財務比率有可能被公司管理者進行過粉飾,單一的依靠某一比率做出的預測不一定可靠。因此,多變量財務預警模型逐步取代單變量財務預警模型成為廣泛應用的模型。雖然多種多變量財務預警模型為現(xiàn)代企業(yè)預測財務狀況提供了多種選擇,但由于每種模型有其各自的前提條件以及模型自身的特點,這使得從眾多模型中挑選出一種最具代表性的模型的可能性大大降低了。基于此,本文就國內(nèi)外學者對各種多變量財務預警模型的實證研究情況進行總結(jié)和比較。通過對多種多變量財務預警模型的實證情況進行比較,一方面可以充分展示我國財務預警實證研究的發(fā)展狀況;另一方面對我國財務預警實證研究存在的問題進行總結(jié),就財務預警實證研究的未來發(fā)展方向提出建議。此外,也為多變量財務預警模型的相關使用者選擇一種適合自己的預警模型提供了依據(jù)。

二、多變量財務預警模型的基本原理

國內(nèi)外常用的多變量財務預警模型主要有以下四類:

2.1多元線性判定模型

多元判定模型中最著名的模型是美國 Altman(1968)的Z分數(shù)模型:Z=0.12XI+0.14X2+0.033X3+0.006X4+0.001X5,其中x1、x2、x3、x4、x5是五個財務指標。根據(jù)判別方程可以把單個企業(yè)的各種財務比率轉(zhuǎn)換成單一的判別標準,或稱為Z值,根據(jù)Z值將企業(yè)分為“破產(chǎn)”或“非破產(chǎn)”兩類。國內(nèi)學者周首華等(1996)以Altman的Z分數(shù)模型為基礎構(gòu)建了F分數(shù)模型,該模型加入了現(xiàn)金流量預測指標體系。

2.2主成分模型

該模型是國內(nèi)學者張愛民等(2000)借鑒Altman的多元z值判定模型,運用統(tǒng)計學的主成分分析方法建立的。其主要思想是:通過對原始的財務指標相關矩陣內(nèi)部結(jié)構(gòu)關系的研究,找出影響上市公司的財務狀況的幾個綜合指標,即主成分,使綜合指標為原始指標的線性組合,綜合指標不僅保留了原始指標的主要信息,彼此又完全不相關,同時比原始指標具有某些更優(yōu)越的性質(zhì)。該模型的差別方程式為:PS=V1Z1+V2Z2+V3Z3+V4Z4+V5Z5,其中,V1、V2、V3、V4、V5是系數(shù),Z1、Z2、Z3、Z4、Z5是綜合指標。

2.3多元回歸模型

多元回歸模型包括Logistic回歸模型和Probit回歸模型。Martin(1977)在財務危機預警研究中首次采用了多元邏輯回歸模型。該模型假設企業(yè)破產(chǎn)的概率為P(破產(chǎn)取1,非破產(chǎn)取0),并假設Ln[ P/(1-P)]可以用財務比率線性解釋。假定Ln[P/(1-P)]=a+bx,推導得出P=exp( a+bx)/[ 1+exp(a+bx)],從而計算出企業(yè)破產(chǎn)的概率。判別規(guī)則是: 如果 P>0.5,則判定企業(yè)為即將破產(chǎn)類型;如果P<0.5,則判定企業(yè)財務正常。Probit模型和Logistic模型相似。

2.4人工神經(jīng)網(wǎng)絡模型(ANN)

1990年Odom和Sharda第一次運用神經(jīng)網(wǎng)絡進行財務困境預測問題的探索。該模型由輸入層、輸出層和隱藏層組成,通過網(wǎng)絡的學習和數(shù)據(jù)的修正得出期望輸出,然后根據(jù)學習得出的判別規(guī)則來分類。

三、多變量財務預警模型的應用

目前傳統(tǒng)的統(tǒng)計模型發(fā)展得比較成熟,計算也相對簡單,應用也較為廣泛。Z分數(shù)模型主要用于信用政策、信貸評審、貸款定價以及證券化等方面。主成分模型也相對簡單可行,可以在實踐中廣泛運用,但該模型有一個明顯的缺陷,即綜合評分式權(quán)重的確定以及判定區(qū)間的確定都具有較大的主觀性和不準確性,尤其是后者受樣本數(shù)據(jù)分布的影響很大,從而會影響預測的準確度。Logistic模型與Probit模型的最大優(yōu)點就是不需要嚴格的假設條件,克服了線性方程受統(tǒng)計假設約束的局限性,因而具有更廣泛的適用范圍。而對于人工神經(jīng)網(wǎng)絡模型,從理論上來講,該模型應具有廣泛的應用前景和應用價值,但在實際運用中卻存在這樣一些問題,如模型結(jié)構(gòu)定義的復雜性、計算量過于巨大,而且其在決策方法中表現(xiàn)得像一個黑匣子,以致對它的接受和應用都較困難。另外,這種模型要求擁有大量的學習訓練樣本以供分析,如果樣本數(shù)量積累得不足、沒有足夠的代表性和廣泛的覆蓋面,則會大大地影響系統(tǒng)的分析和預測結(jié)果。

四、多變量財務預警模型實證比較分析

4.1前提條件比較分析

在研究財務預警模型的過程中首先應該考慮各種模型適用的前提條件。多元判定模型和主成分模型通常形成一個線性判定函數(shù)式,據(jù)此判斷待判企業(yè)的歸屬,一般要求數(shù)據(jù)服從正態(tài)分布和兩組樣本間協(xié)方差矩陣相等。Logistic模型和Probit模型均是為了克服簡單線性概率模型的缺陷而建立起來的,一般采用最大似然估計方法進行估計,不需要滿足正態(tài)分布和兩組樣本協(xié)方差矩陣相等的條件,得出的結(jié)論直接表示企業(yè)發(fā)生財務失敗的可能性的大小。人工神經(jīng)網(wǎng)絡模型則對財務指標的分布沒有特別的要求特別適合于變量服從未知分布,且自變量組間協(xié)方差矩陣不相等的情況。

4.2樣本和數(shù)據(jù)選取的比較分析

財務危機預警的國內(nèi)外研究者由于國情不同、研究目的不同,對財務危機含義的界定有所區(qū)別:國外學者大都以提出破產(chǎn)申請的企業(yè)作為研究對象;而國內(nèi)學者則以滬、深兩市因“財務狀況異常”而被ST的上市公司作為研究對象。#p#分頁標題#e#

國外的研究學者通常采用比較樣本建模,即選擇相同數(shù)量的破產(chǎn)企業(yè)和非破產(chǎn)企業(yè)。Altman(1968)則選取了33家1946~1964年間破產(chǎn)的且資產(chǎn)規(guī)模在70~2 590萬美元之間企業(yè)和相同數(shù)量、同一行業(yè)、同等資產(chǎn)規(guī)模的非破產(chǎn)企業(yè)作為樣本企業(yè),數(shù)據(jù)來自《Moody的行業(yè)手冊》。我國學者則大部分是選擇近幾年的ST公司和相應的非ST公司作為研究樣本,其數(shù)據(jù)大部分來源于均來自上市公司公布的財務報表。如吳世農(nóng)、盧賢義(2001)則選擇了1998~2000年期間的70家ST上市公司和相對應的70家非ST公司作為研究樣本。

4.3財務指標選取的比較分析

國外學者Altman(1968)選取了5個具有代表的會計比率類財務指標,構(gòu)建了Z分數(shù)模型,他認為這些財務變量是評價企業(yè)總體財務狀況的最佳指標。國內(nèi)學者周首華(1996)的F分數(shù)模型是在Z分數(shù)模型的基礎上加入了現(xiàn)金流量這一預測指標,證明在短期內(nèi)許多公司財務危機和現(xiàn)金流斷裂有直接關系。張愛民(2000)的主成分分析模型以及楊淑娥、徐偉剛(2003)運用主成分分析方法構(gòu)建的Y分數(shù)模型中也僅涉及到會計比率類財務指標。直到2004年,張友棠引入了現(xiàn)金盈利值(CFV)與現(xiàn)金增加值(CAV)這兩個現(xiàn)在指標概念,雖然這兩個指標并未得到后來學者們的廣泛使用,但這一思想深刻地影響著后來的學者們。在隨后的絕大多數(shù)文獻中就開始出現(xiàn)了現(xiàn)金流量類指標的身影,并且在越來越多的文獻中占據(jù)主要地位。

Marttin(1977)首次構(gòu)建多元邏輯回歸模型時也只選取了25個財務比率。隨后,Ohlson(1980)采用Logistic回歸模型時,不僅以現(xiàn)金流量指標為基礎,而且加入了非財務類指標,即公司規(guī)模、資本結(jié)構(gòu)、業(yè)績和當前的變現(xiàn)能力。隨著財務預警研究與應用成果逐漸引入國內(nèi),基于非財務指標的財務預警思想也同時傳入國內(nèi),非財務指標是在2004年后大量出現(xiàn)的,并且越來越多學者的研究表明非財務類指標與會計比率類指標和現(xiàn)金流量類指標相結(jié)合建立的預警指標體系,能夠很大程度地提高預警模型的預測精度。國內(nèi)學者楊保安(2001)首次應用人工神經(jīng)網(wǎng)絡模型時,只考慮了會計比率類的財務指標,楊淑娥等學者在研究人工神經(jīng)網(wǎng)絡模型時則加入了現(xiàn)金流量類指標。

從上述文獻來看,在研究初期,學者們都只注重會計比率類的財務指標,但指標選取并非與模型是匹配的,而是隨著研究的發(fā)展指標選取也在不斷的進行完善,加進了現(xiàn)金流量類指標和非財務類指標,使模型能夠更加準確預測現(xiàn)代企業(yè)的財務狀況。

4.4模型預測準確度的比較分析

Altman(1994)以意大利工業(yè)企業(yè)為樣本,比較了神經(jīng)網(wǎng)絡方法與線性判別方法,發(fā)現(xiàn)有時神經(jīng)網(wǎng)絡方法要優(yōu)于線性判別方法,但由于神經(jīng)網(wǎng)絡有時過度訓練產(chǎn)生了不合理的權(quán)重,從總體上看線性判別方法要優(yōu)于神經(jīng)網(wǎng)絡方法。陳瑜(2000)對運用主成分分析、回歸分析與判別分析對證券市場ST公司進行財務危機預測,結(jié)果表明:主成分分析方法的預測效果最好,回歸分析法的預測效果次之,判別分析法的預測能力則隨著年份的臨近,正確性逐步提高。吳世農(nóng)、盧賢義(2001)通過應用Fisher線性判定分析、多元線性回歸分析和Logistic回歸分析三種方法,分別建立三種預測財務困境的模型,并比較三種判定模型的效果,表明Logistic模型的判定準確性最高。喬卓等(2002)通過對Fisher判別模型、Logistic回歸模型以及神經(jīng)網(wǎng)絡模型在財務困境預測中的比較研究,發(fā)現(xiàn)提前2年和提前3年神經(jīng)網(wǎng)絡模型的預測精度明顯高于Logistic模型和Fisher判別分析模型。楊淑娥、黃禮(2005)分別采用BP人工神經(jīng)網(wǎng)絡工具和主成分分析法建立財務預警模型,并且對同一建模樣本和檢驗樣本進行預測,BP人工神經(jīng)網(wǎng)絡模型的預測精確度相比主成分分析模型的精確度有很大的提高。呂長江等(2005)分別運用多元判別分析、邏輯線性回歸和人工神經(jīng)網(wǎng)絡對財務狀況處于困境的公司進行預測比較分析。結(jié)果表明:三個主流模型均能在公司發(fā)生財務困境前1年和前2—3年較好地進行預測。其中,多元判別分析要遜色于邏輯線性回歸,人工神經(jīng)網(wǎng)絡的預測準確率最高。

通過以上的比較,人工神經(jīng)網(wǎng)絡模型的預測能力要優(yōu)于統(tǒng)計模型的預測能力,而要統(tǒng)計模型中,主成分模型的預測能力最優(yōu),回歸模型次之,多元線性判別模型相對較差。然而,財務預警模型的優(yōu)劣不能光憑預測能力的高低來判定,因為各種模型的適用的前提條件是有差異的。

五、結(jié)論與啟示

綜觀國內(nèi)外文獻,財務預警研究對多變量財務預警模型的運用主要集中在以上幾種模型上,其中人工神經(jīng)網(wǎng)絡模型在理論上是預測能力最強的模型,但在實務中應用卻有諸多的問題,相比之下,統(tǒng)計模型簡單可行,有更廣泛的適用性。多變量財務預警模型只是為相關使用者提供一種預測財務風險并歸避風險的方法,而不是強調(diào)模型本身的精妙性。加之,財務預警模型只是用財務報表進行財務預警,而不能對財務報告的真?zhèn)芜M行鑒別,很有可能對失真的財務報告進行預警,進而使預測結(jié)果發(fā)生偏差。因此,對財務預警的研究應該與財務失真的研究相結(jié)合,以提高財務預警預測的精確度。

參考文獻:

[1]Altman E.I. Financial Ratio, Discriminate Analysis and the Prediction of Corporate Bankruptcy [J].Journal of Finance,1968,23(9).

[2]周首華. 論財務危機的預警分析—F分數(shù)模式[J]. 會計研究,1996,8.

[3]張愛民,祝春山,許丹健.上市公司財務失敗的主成分預測模型及其實證研究[J].金融研究,2001(3).

[4]Martin D. Early Warning of Bank Failure:A Logistic Regression Approach [J]. Journal of Banking and Finance,1977(7).

[5]Odom M.D and Sharda R. A Neural Network Model for Bankruptcy Prediction. In Proceedings of the International Joint Conference on Neural Network Tool [J]. Financial Management,1990,2(6).

[6]吳世農(nóng)、盧賢義. 我國上市公司財務困境的預測模型研究[J].經(jīng)濟研究,2001(6).

[7]楊淑娥,徐偉剛.上市公司財務預警模型——Y分數(shù)模型的實證研究[J].中國軟科學,2003(1).

[8]楊保安,季海,徐晶等.BP神經(jīng)網(wǎng)絡在企業(yè)財務危機預警之應用[J].預測,2001(2).#p#分頁標題#e#

篇10

關鍵詞:模糊神經(jīng)網(wǎng)絡;擴展卡爾曼濾波;自組織學習

doi:10.3969/j.issn.1001-3695.2010.07.016

fast self-organizing learning algorithm based on ekf for fuzzy neural network

zhou shang-bo,liu yu-jiong

(college of computer science, chongqing university, chongqing 400044, china)

abstract:to construct an effective fuzzy neural network, this paper presented a self-organizing learning algorithm based on extended kalman filter for fuzzy neural network. in the algorithm, the network grew rules according to the proposed growing criteria without pruning, speeding up the online learning process.all the free parameters were updated by the extended kalman filter approach and the robustness of the network was obviously enhanced. the simulation results show that the proposed algorithm can achieve fast learning speed, high approximation precision and generation capability.

key words:fuzzy neural network; extended kalman filter(ekf); self-organizing learning

模糊神經(jīng)網(wǎng)絡起源于20世紀80年代后期的日本,由于其簡單、實用,已經(jīng)被廣泛應用在工業(yè)控制、系統(tǒng)辨識、模式識別、數(shù)據(jù)挖掘等許多領域[1~4]。然而,如何從可用的數(shù)據(jù)集和專家知識中獲取合適的規(guī)則數(shù)仍然是一個尚未解決的問題。為了獲取模糊規(guī)則,研究人員提出了不同的算法,如文獻[5]利用正交最小二乘算法確定徑向基函數(shù)的中心,但是該算法訓練速度比較慢;文獻[6]提出了基于徑向基函數(shù)的自適應模糊系統(tǒng),其算法使用了分層自組織學習策略,但是逼近精度低。擴展卡爾曼濾波(ekf)算法作為一種非線性更新算法,在神經(jīng)網(wǎng)絡中得到了廣泛應用。文獻[7]利用擴展卡爾曼濾波算法調(diào)整多層感知器的權(quán)值,文獻[8]利用擴展卡爾曼濾波算法調(diào)整徑向基函數(shù)網(wǎng)絡的權(quán)值。

本文提出了一種模糊神經(jīng)網(wǎng)絡的快速自組織學習算法(sfnn)。該算法基于無須修剪過程的生長準則增加模糊規(guī)則,加速了網(wǎng)絡學習過程,同時使用ekf調(diào)整網(wǎng)絡的參數(shù)。在該算法中,模糊神經(jīng)網(wǎng)絡結(jié)構(gòu)不是預先設定的,而是在學習過程中動態(tài)變化的,即在學習開始前沒有一條模糊規(guī)則,在學習過程中逐漸增加模糊規(guī)則。與傳統(tǒng)的模糊神經(jīng)網(wǎng)絡學習算法相比,本算法所得到的模糊規(guī)則數(shù)并不會隨著輸入變量的增加而呈指數(shù)增長,特別是本算法無須領域的專家知識就可以實現(xiàn)對系統(tǒng)的自動建模及抽取模糊規(guī)則。當然,如果設計者是領域?qū)<?其知識也可以直接用于系統(tǒng)設計。本算法所得到的模糊神經(jīng)網(wǎng)絡具有結(jié)構(gòu)小、避免出現(xiàn)過擬合現(xiàn)象等特點。

1 sfnn的結(jié)構(gòu)

本文采用與文獻[9]相似的網(wǎng)絡結(jié)構(gòu),如圖1所示。其中,r是輸入變量個數(shù);xi(i=1,2,…,r)是輸入語言變量;y是系統(tǒng)的輸出;mfij是第i個輸入變量的第j個隸屬函數(shù);rj表示第j條模糊規(guī)則;wj是第j條規(guī)則的結(jié)果參數(shù);u是系統(tǒng)總的規(guī)則數(shù)。

下面是對該網(wǎng)絡各層含義的詳細描述。

第一層:輸入層。每個節(jié)點代表一個輸入語言變量。

第二層:隸屬函數(shù)層。每個節(jié)點代表一個隸屬函數(shù),隸屬函數(shù)采用如下的高斯函數(shù):

μij=exp(-(xi-cij)2σ2ij);i=1,2,…,r; j=1,2,…,u(1)

其中:r是輸入變量數(shù);u是隸屬函數(shù)個數(shù),也代表系統(tǒng)的總規(guī)則數(shù);μij是xi的第j個高斯隸屬函數(shù);cij是xi的第j個高斯隸屬函數(shù)的中心;σij是xi的第j個高斯隸屬函數(shù)的寬度。

第三層:t-范數(shù)層。每個節(jié)點代表一個可能的模糊規(guī)則的if-部分,也代表一個rbf單元,該層節(jié)點個數(shù)反映了模糊規(guī)則數(shù)。如果計算每個規(guī)則觸發(fā)權(quán)的t-范數(shù)算子是乘法,則在第三層中第j條規(guī)則rj的輸出為

φj=exp(-ri=1(xi-cij)2σ2ij);j=1,2,…,u(2)

第四層:輸出層。該層每個節(jié)點代表一個輸出變量,該輸出是所有輸入變量的疊加。

y(x)=uj=1wjφj(3)

其中:y是網(wǎng)絡的輸出;wj是then-部分。

2 sfnn的學習算法

如前文所述,第三層的每個節(jié)點代表一個可能的模糊規(guī)則的if-部分或者一個rbf單元。如果需要辨識系統(tǒng)的模糊規(guī)則數(shù),則不能預先選擇模糊神經(jīng)網(wǎng)絡的結(jié)構(gòu)。于是,本文提出一種新的學習算法,該算法可以自動確定系統(tǒng)的模糊規(guī)則并能達到系統(tǒng)的特定性能。

2.1 模糊規(guī)則的產(chǎn)生準則

在模糊神經(jīng)網(wǎng)絡中,如果模糊規(guī)則數(shù)太多,不僅增加系統(tǒng)的復雜性,而且增加計算負擔和降低網(wǎng)絡的泛化能力;如果規(guī)則數(shù)太少,系統(tǒng)將不能完全包含輸入/輸出狀態(tài)空間,將降低網(wǎng)絡的性能。是否加入新的模糊規(guī)則取決于系統(tǒng)誤差、可容納邊界和誤差下降率三個重要因素。

2.1.1 系統(tǒng)誤差

誤差判據(jù):對于第i個觀測數(shù)據(jù)(xi,ti),其中xi是輸入向量,ti是期望輸出,由式(3)計算網(wǎng)絡現(xiàn)有結(jié)構(gòu)的全部輸出yi。

定義:ei=ti-yi;i=1,2,…,n(4)

如果ei>ke ke=max[emax×βi,emin](5)

則說明網(wǎng)絡現(xiàn)有結(jié)構(gòu)的性能比較差,要考慮增加一條新的規(guī)則;否則,不生成新規(guī)則。其中:ke是根據(jù)網(wǎng)絡期望的精度預先選擇的值;emax是預定義的最大誤差;emin是期望的輸出精度;β(0<β<1)是收斂因子。

2.1.2 可容納邊界

從某種意義上來講,模糊神經(jīng)網(wǎng)絡結(jié)構(gòu)的學習是對輸入空間的高效劃分。模糊神經(jīng)網(wǎng)絡的性能和結(jié)構(gòu)與輸入隸屬函數(shù)緊密相關。本文使用的是高斯隸屬函數(shù),高斯函數(shù)輸出隨著與中心距離的增加而單調(diào)遞減。當輸入變量采用高斯隸屬函數(shù)時,則認為整個輸入空間由一系列高斯隸屬函數(shù)所劃分。如果某個新樣本位于某個已存在的高斯隸屬函數(shù)覆蓋范圍內(nèi),則該新樣本可以用已存在的高斯隸屬函數(shù)表示,不需要網(wǎng)絡生成新的高斯單元。

可容納邊界:對于第i個觀測數(shù)據(jù)(xi,ti),計算第i個輸入值xi與已有rbf單元的中心cj之間的距離di(j),即

di(j)=xi-cj;i=1,2,…,n; j=1,2,…,u(6)

其中:u是現(xiàn)有的模糊規(guī)則或rbf單元的數(shù)量。令

di,min=arg min(di(j))(7)

如果di,min>kd,kd=max[dmax×γi,dmin](8)

則說明已存在的輸入隸屬函數(shù)不能有效地劃分輸入空間。因此,需要增加一條新的模糊規(guī)則,否則,觀測數(shù)據(jù)可以由已存在的距離它最近的rbf單元表示。其中:kd是可容納邊界的有效半徑;dmax是輸入空間的最大長度;dmin是所關心的最小長度;γ(0<γ<1)是衰減因子。

2.1.3 誤差下降率

傳統(tǒng)的學習算法把誤差減少率(err)[5]用于網(wǎng)絡生長后的修剪過程,算法會因為修剪過程而增加計算負擔,降低學習速度。本文把誤差減少率用于生長過程形成一種新的生長準則,算法無須經(jīng)過修剪過程,從而加速網(wǎng)絡的學習過程。

給定n個輸入/輸出數(shù)據(jù)對(xi,ti),t=1,2,…,n,把式(3)看做線性回歸模型的一種特殊情況,該線性回歸模型為

t(i)=uj=1hj(i)θj+ε(i)(9)

式(9)可簡寫為

d=hθ+e(10)

d=tt∈rn是期望輸出,h=φt∈rn×u是回歸量,θ=wt∈ru是權(quán)值向量,并且假設e∈rn是與回歸量不相關的誤差向量。

對于矩陣φ,如果它的行數(shù)大于列數(shù),通過qr分解:

h=pq(11)

可把h變換成一組正交基向量集p=[p1,p2,…,pu]∈rn×u,其維數(shù)與h的維數(shù)相同,各列向量構(gòu)成正交基,q∈ru×u是一個上三角矩陣。通過這一變換,有可能從每一基向量計算每一個分量對期望輸出能量的貢獻。把式(11)代入式(10)可得

d=pqθ+e=pg+e(12)

g的線性最小二乘解為g=(ptp)-1ptd,或

gk=ptkdptkpk;k=1,2,…,u(13)

q和θ滿足下面的方程:

qθ=g(14)

當k≠l時,pk和pl正交,d的平方和由式(15)給出:

dtd=uk=1g2kptkpk+ete(15)

去掉均值后,d的方差由式(16)給出:

n-1dtd=n-1uk=1g2kptkpk+n-1ete(16)

由式(16)可以看到,n-1uk=1g2kptkpk是由回歸量pk所造成的期望輸出方差的一部分。因此,pk的誤差下降率可以定義如下:

errk=g2kptkpkdtd,1≤k≤u(17)

把式(13)代入式(17)可得

errk=(ptkd)2ptkpkdtd,1≤k≤u(18)

式(18)為尋找重要回歸量子集提供了一種簡單而有效的方法,其意義在于errk揭示了pk和d的相似性。errk值越大,表示pk和d的相似度越大,且pk對于輸出影響越顯著。利用err定義泛化因子(gf),gf可以檢驗算法的泛化能力,并進一步簡化和加速學習過程。定義:

gf=uk=1errk(19)

如果gf

2.2 參數(shù)調(diào)整

需要注意的是,不管是新生成的隱節(jié)點還是已存在的隱節(jié)點,都需要對網(wǎng)絡參數(shù)進行調(diào)整。傳統(tǒng)的方法是使用lls[10]方法對網(wǎng)絡參數(shù)進行調(diào)整,本文提出使用ekf方法調(diào)節(jié)網(wǎng)絡的參數(shù)。由于lls方法在確定最優(yōu)參數(shù)時計算簡單、速度快,但該方法對噪聲敏感,其學習速度隨著信噪比的增加而下降。另外,與lls方法相關的問題是其求解可能是病態(tài)的,這使得參數(shù)估計變得很困難。ekf方法由于其自適應過程比較復雜,計算速度沒有l(wèi)ls方法快,但是ekf方法在噪聲環(huán)境下具有魯棒性,使用ekf方法可以實現(xiàn)一種健壯的在線學習算法。網(wǎng)絡參數(shù)可以用下面的ekf[11]方法進行調(diào)整。事實上,網(wǎng)絡的參數(shù)向量θ可以看做一個非線性系統(tǒng)的狀態(tài),并用下面的方程描述:

θi=θi-1

ti=h(θi-1,xi)+ei(20)

在當前的估計值i-1處將非線性函數(shù)h(θi-1,xi)展開,則狀態(tài)模型可以重寫為

θi=θi-1

ti=hiθi-1+εi+ei(21)

其中:εi=h(i-1 ,xi)-hii-1+ρi。hi是如下的梯度向量:

hi=h(θ,xi)θ|θ=i-1 (22)

參數(shù)向量θ使用下面的擴展卡爾曼濾波算法更新:

ki=pi-1hti[hipi-1hti+ri]-1

θi=θi-1+ki(ti-h(θi-1,xi))

pi=pi-1-kihipi-1+qi(23)

其中:ki是卡爾曼增益矩陣;pi是逼近誤差方差陣;ri是量測噪聲方差陣;qi是過程噪聲方差陣。

全局擴展卡爾曼濾波算法會涉及大型矩陣運算,增加計算負擔,因此可以將全局問題劃分為一系列子問題從而簡化全局方法。網(wǎng)絡的前件部分具有非線性特性,利用擴展卡爾曼濾波算法對其進行調(diào)整;網(wǎng)絡的后件部分具有線性特性,利用卡爾曼濾波算法對其進行調(diào)整,該方法等同于將全局方法簡化為一系列解耦方法,可以降低計算負擔。由于高斯函數(shù)的中心對系統(tǒng)的性能影響不明顯,為了簡化計算,只對高斯隸屬函數(shù)的寬度進行調(diào)整。

前件參數(shù)使用如下的擴展卡爾曼濾波算法更新:

kδi=pδi-1gti[ri+gipδi-1gti]-1

δi=δi-1+kδi(ti-wi-1φi)

pδi=pδi-1-kδigipδi-1+qi(24)

后件參數(shù)使用如下的卡爾曼濾波算法更新:

kwi=pwi-1φti[ri+φipwi-1φti]-1

wi=wi-1+kwi(ti-wi-1φi)

pwi=pwi-1-kwiφipwi-1+qi(25)

2.3 模糊規(guī)則的增加過程

在sfnn學習算法中,模糊規(guī)則增加過程如下:

a)初始參數(shù)分配。當?shù)玫降谝粋€觀測數(shù)據(jù)(x1,t1) 時,此時的網(wǎng)絡還沒有建立起來,因此這個數(shù)據(jù)將被選為第一條模糊規(guī)則:c0=x0,δ1=δ0,w1=t1。其中δ0是預先設定的常數(shù)。

b)生長過程。當?shù)玫降趇個觀測數(shù)據(jù)(xi,ti)時,假設在第三層中已存在u個隱含神經(jīng)元,根據(jù)式(4)(7)和(19),分別計算ei、di,min、gf。如果

ei>ke,di,min>kd,且gf

則增加一個新的隱含神經(jīng)元。其中ke、kd分別在式(5)和(8)中給出。新增加的隱含神經(jīng)元的中心、寬度和權(quán)值賦值為:cu+1=xi,δu+1=k0di,min,wu+1=ei,其中k0(k0>1)是重疊因子。

c)參數(shù)調(diào)整。當增加新神經(jīng)元后,所有已有神經(jīng)元的參數(shù)通過式(24)(25)描述的算法調(diào)整。

3 仿真研究

時間序列預測在解決許多實際問題中是非常重要的。它在經(jīng)濟預測、信號處理等很多領域都得到了廣泛應用。

本文采用的時間序列由mackey-glass差分延遲方程產(chǎn)生,其方程定義為[5]

x(t+1)=(1-a)x(t)+bx(t-τ)1+x10(t-τ)(27)

為了能夠與文獻[5,6]在相同的基礎上進行比較,取值δt=p=6,式(27)中的參數(shù)選擇為:a=0.1,b=0.2,τ=17。預測模型表示為

x(t+6)=f[x(t),x(t-6),x(t-12),x(t-18)](28)

為了獲得時間序列,利用式(27)生成2 000個數(shù)據(jù),式(27)的初始條件為:x(0)=1.2。為了訓練和測試,在t=124和t=1 123之間選擇1 000個樣本作為式(28)的輸入/輸出樣本數(shù)據(jù)。使用前500個數(shù)據(jù)對作為訓練數(shù)據(jù)集,后面的500個數(shù)據(jù)對驗證該模型的預測性能。圖2顯示了sfnn生成的模糊規(guī)則數(shù);圖3顯示了從t=124到t=623的訓練結(jié)果;圖4顯示了sfnn良好的預測性能。表1列出了sfnn與其他算法的比較結(jié)果。表1顯示,與ols、rbf-afs算法相比,sfnn具有最少的規(guī)則數(shù)、最小的誤差和良好的泛化能力,同時具有快速的學習速度。sfnn的快速性就在于:采用無須修剪過程的生長準則,加速了網(wǎng)絡學習過程;利用擴展卡爾曼濾波調(diào)整網(wǎng)絡的參數(shù),可以縮短網(wǎng)絡的學習周期。從上面的分析可以看出,sfnn具有緊湊的結(jié)構(gòu)、快速的學習速度、良好的逼近精度和泛化能力。

4 結(jié)束語

sfnn采用在線學習方法、參數(shù)估計和結(jié)構(gòu)辨識同時進行,提高了網(wǎng)絡的學習速度?;谠摲椒ㄉ傻哪:窠?jīng)網(wǎng)絡具有緊湊的結(jié)構(gòu),網(wǎng)絡結(jié)構(gòu)不會持續(xù)增長,避免了過擬合及過訓練現(xiàn)象,確保了系統(tǒng)的泛化能力。

參考文獻:

[1]

huang huan,wu cong-xin.approximation capabilities of multilayer fuzzy neural networks on the set of fuzzy-valued functions[j].information sciences,2009,179(16):2762-2773.

[2]deng xing-sheng,wang xin-zhou.incremental learning of dynamic fuzzy neural networks for accurate system modeling[j].fuzzy sets and systems,2009,160(7):972-987.

[3]韋玉科,汪仁煌,李江平,等.一種新的數(shù)據(jù)智能化處理算法[j].計算機應用研究,2008,25(5):1328-1329.

[4]chen sheng,hong xia,luk b l,et al.orthogonal-least-squares regression:a unified approach for data modeling[j].neurocompu-ting,2009,72(10-12):2670-2681.

[5]chen s,cowan c f n,grant p m.orthogonal least squares learning algorithm for radial basis function networks[j].ieee trans on neural networks,1991,2(2):302-309.

[6]cho k b,wang b h.radial basis function based adaptive fuzzy systems and their applications to system identification and prediction[j].fuzzy sets and systems,1996,83(3):325-339.

[7]rivals i,personnaz l.a recursive algorithm based on the extended kalman filter for the training of feedforward neural models[j].neurocomputing,1998,20(1):279-294.

[8]simon d.training radial basis neural networks with the extended kalman filter[j].neurocomputing,2002,48(1):455-475.

[9]wu shi-qian,er m j,gao yang.a fast approach for automatic generation of fuzzy rules by generalized dynamic fuzzy neural networks[j].ieee trans on fuzzy systems,2001,9(4):578-594.