Monday, October 17, 2016

Bewegende Gemiddelde Eviews

Wanneer die berekening van 'n lopende bewegende gemiddelde, die plasing van die gemiddelde in die middel tydperk sinvol In die vorige voorbeeld het ons bereken die gemiddeld van die eerste 3 tydperke en sit dit langs tydperk 3. Ons kan die gemiddelde geplaas in die middel van die tyd interval van drie tydperke, dit is, langs tydperk 2. dit werk goed met vreemde tydperke, maar nie so goed vir selfs tydperke. So waar sou ons plaas die eerste bewegende gemiddelde wanneer M 4 Tegnies, sou die bewegende gemiddelde op t 2.5, 3.5 val. Om hierdie probleem wat ons glad Mas using 2. So glad ons die stryk waardes As ons gemiddeld 'n gelyke getal terme te vermy, moet ons die stryk waardes glad Die volgende tabel toon die resultate met behulp van M 4.A tydreeks is 'n reeks waarnemings van 'n periodieke ewekansige veranderlike. Voorbeelde hiervan is die maandelikse vraag na 'n produk, die jaarlikse eerstejaars inskrywing in 'n departement van die Universiteit en die daaglikse vloei in 'n rivier. Tydreeks is belangrik vir operasionele navorsing, want hulle is dikwels die bestuurders van beslissing modelle. 'N inventaris model ramings van toekomstige eise vereis, 'n kursus skedulering en personeel model vir 'n universiteit departement vereis ramings van toekomstige student invloei, en 'n model vir die verskaffing van waarskuwings aan die bevolking in 'n rivier bekken vereis skattings van riviervloei vir die onmiddellike toekoms. Tydreeksanalise bied gereedskap vir die kies van 'n model wat die tydreeks beskryf en met behulp van die model om toekomstige gebeure te voorspel. Modellering van die tydreeks is 'n statistiese probleem omdat waargeneem data word gebruik in berekeningsprosedures die koëffisiënte van 'n vermeende model skat. Modelle aanvaar dat waarnemings wissel lukraak oor 'n onderliggende gemiddelde waarde wat 'n funksie van tyd. Op hierdie bladsye beperk ons ​​aandag aan die gebruik van historiese tydreeksdata 'n tyd afhanklik model skat. Die metodes is geskik vir 'n outomatiese, korttermyn voorspelling van dikwels gebruik inligting waar die onderliggende oorsake van tyd variasie is nie merkbaar verander in die tyd. In die praktyk word die voorspellings afgelei deur hierdie metodes daarna gewysig deur menslike ontleders wat inligting nie beskikbaar by die historiese data te inkorporeer. Ons primêre doel van hierdie artikel is om die vergelykings te bied vir die vier voorspelling metodes gebruik in die vooruitskatting add-in: bewegende gemiddelde, eksponensiële gladstryking, regressie en dubbel eksponensiële gladstryking. Dit is genoem glad metodes. Metodes nie oorweeg sluit kwalitatiewe vooruitskatting, meervoudige regressie, en outoregressiewe metodes (ARIMA). Diegene wat belangstel in meer uitgebreide dekking moet die voorspelling Beginsels webwerf te besoek of lees een van die verskeie uitstekende boeke oor die onderwerp. Ons gebruik die boek vooruitskatting. deur Makridakis, wielmaker en McGee, John Wiley amp Sons, 1983. Om die Excel Voorbeelde werkboek gebruik, moet jy die vooruitskatting add-in geïnstalleer. Kies die opdrag Herskakel om die skakels na die add-in te stel. Hierdie bladsy beskryf die gebruik van eenvoudige voorspelling en die notasie wat gebruik word vir die analise modelle. Dit eenvoudigste vooruitskatting metode is die bewegende gemiddelde skatting. Die metode eenvoudig gemiddeldes van die laaste m waarnemings. Dit is nuttig vir tydreekse met 'n stadig veranderende gemiddelde. Hierdie metode van mening dat die hele verlede in sy voorspelling, maar weeg onlangse ervaring swaarder as minder onlangse. Die berekeninge is eenvoudig omdat slegs die raming van die vorige tydperk en die huidige data die nuwe skatting bepaal. Die metode is nuttig vir tydreekse met 'n stadig veranderende gemiddelde. Die bewegende gemiddelde metode nie goed reageer op 'n tydreeks wat die styging of daling met tyd. Hier sluit ons 'n lineêre tendens term in die model. Die regressie benaderde model deur die bou van 'n lineêre vergelyking wat die kleinste kwadrate geskik is om die laaste m observations. EViews Oorsig bied: Data Management Deel 3: Gesofistikeerd Databestuur kragtige analitiese gereedskap is net nuttig as jy maklik kan werk met jou data. EViews bied die wydste verskeidenheid van data bestuur gereedskap wat beskikbaar is in 'n ekonometriese sagteware. Van sy uitgebreide biblioteek van wiskundige, statistiese, datum, string, en tydreeks operateurs en funksies, om omvattende ondersteuning vir numeriese, karakter, en datum data, EViews bied die data hantering funksies youve gekom om te verwag van moderne statistiese sagteware. Uitgebreide funksie Biblioteek EViews sluit 'n uitgebreide biblioteek van funksies vir die werk met data. Behalwe die standaard wiskundige en trigonometriese funksies, EViews bied funksies vir beskrywende statistiek, kumulatiewe en beweeg statistieke, deur-groep statistieke, spesiale funksies, gespesialiseerde datum en tyd reeks operasies, workfile, waarde kaart, en finansiële berekeninge. EViews maak ook voorsiening ewekansige getal kragopwekkers (Knuth, LEcuyer of Mersenne-Twister), funksies digtheid en kumulatiewe verdelingsfunksies agtien verskillende distributions. These gebruik kan word in die skep van nuwe reeks, of in die berekening van skalaar en oorsig uitdrukkings. EViews bied 'n uitgebreide biblioteek van funksies. Gesofistikeerde Expression Hantering EViews kragtige instrumente vir die hantering uitdrukking beteken dat jy uitdrukkings kan gebruik feitlik oral sal jy 'n reeks gebruik. Jy hoef nie te nuwe veranderlikes om te werk met die logaritme van Y, die bewegende gemiddelde van W, of die verhouding van X na Y (of enige ander geldige uitdrukking) te skep. In plaas daarvan, kan jy die uitdrukking gebruik in die berekening van beskrywende statistiek, as deel van 'n vergelyking of model spesifikasie, of in die bou van grafieke. Wanneer jy voorspel met behulp van 'n vergelyking met 'n uitdrukking vir die afhanklike veranderlike, sal EViews (indien moontlik) toelaat om die onderliggende afhanklike veranderlike te voorspel en sal die beraamde vertrouensinterval dienooreenkomstig aan te pas. Byvoorbeeld, as die afhanklike veranderlike is gespesifiseer as log (G), kan jy kies om óf die log of die vlak van G voorspel, en om die toepaslike, moontlik asimmetriese, vertrouensinterval bereken. Werk direk met uitdrukkings in die plek van veranderlikes. Links, formules en Waardes Maps Link voorwerpe kan jy reeks wat verwys na data wat in ander workfiles of workfile bladsye te skep. Links toelaat om data te kombineer op verskillende frekwensies, of pas saamsmelt in die data van 'n opsomming bladsy in 'n individu bladsy so dat die data dinamiese opgedateer wanneer die onderliggende data verandering. Net so, binne 'n workfile, formules kan toegeskryf word aan datareeks sodat die datareeks outomaties herbereken wanneer die onderliggende data is verander. Waarde vir etikette (bv quotHighquot, quotMedquot, quotLowquot, wat ooreenstem met 2, 1, 0) toegepas kan word om numeriese of alfa-reeks sodat kategoriese data kan vertoon met betekenisvolle etikette. Ingeboude funksies toelaat dat jy om te werk met óf die onderliggende of die gekarteer waardes wanneer berekeninge. Links kan gebruik word vir dinamiese frekwensie sukses of wedstryd samesmelting. Datastrukture en tipes EViews kan hanteer komplekse datastrukture, insluitend gereelde en ongereelde gedateer data, deursnit data met sigbare tekens identifiseerders, en gedateer en ongedateerde paneel data. Benewens numeriese data, kan 'n EViews workfile ook alfanumeriese (karakterstring) data, en reekse met datums, wat almal kan gemanipuleer word met behulp van 'n uitgebreide biblioteek van funksies bevat. EViews bied ook 'n wye verskeidenheid van instrumente vir die werk met datastelle (workfiles), data, insluitend die vermoë om reeks kombineer deur komplekse wedstryd saamsmelt kriteria en workfile prosedures vir die verandering van die struktuur van jou data: aansluit, voeg, subset, die grootte, soort, en hervorm (stapel en unstack). EViews workfiles kan hoogs gestruktureer. Enterprise Edition Ondersteuning vir ODBC, FAME TM. DRIBase, en Haver Analytics Databasisse As deel van die EViews Enterprise Edition ( 'n ekstra koste opsie oor EViews Standard Edition), ondersteuning word verskaf om toegang tot data wat in relasionele databasisse (via ODBC bestuurders) en om databasisse in 'n verskeidenheid van eie strukture gebruik deur kommersiële data en databasis verkopers. Open Database Connectivity (ODBC) is 'n standaard deur baie relasionele databasis stelsels insluitend Oracle, Microsoft SQL Server en IBM DB2. EViews kan jy om te lees of te skryf hele tafels van ODBC databasis, of om 'n nuwe workfile van die resultate van 'n SQL navraag te skep. EViews Enterprise Edition ondersteun ook toegang tot roem TM formaat databasisse (beide plaaslike en bediener-gebaseerde) Global insigte DRIPro en DRIBase databanke, Haver Analytics DLX databasisse, Data Stream, FactSet, en Moodys Ekonomie. Die bekende, maklik-om-te gebruik EViews databasis koppelvlak is uitgebrei om hierdie data formate, sodat jy kan werk met buitelandse databasisse so maklik soos moedertaal EViews databasisse. Frekwensie sukses Wanneer jy data van 'n databasis of van 'n ander workfile of workfile bladsy in te voer, is dit outomaties omgeskakel word na die frekwensie van jou huidige projek. EViews bied baie opsies vir frekwensie sukses, en sluit in steun vir die omskakeling van die daaglikse, weeklikse, of onreëlmatige-frekwensie data. Reeks kan 'n voorkeur omskakeling metode word toegeken, sodat jy verskillende metodes vir verskillende reeks gebruik sonder om die omskakeling metode spesifiseer elke keer as 'n reeks is aangevra. Jy kan selfs links sodat die frekwensie omskep data reeks word outomaties herbereken wanneer die onderliggende data is verander. Gee 'n reeks spesifieke outomatiese omskakeling of kies 'n spesifieke metode. Vir verkope inligting stuur 'n epos saleseviews vir tegniese ondersteuning kan jou stuur supporteviews Sluit asb jou reeksnommer met alle e-pos korrespondensie. Vir meer kontak besonderhede, sien ons omtrent page. A Rima staan ​​vir outoregressiewe geïntegreerde bewegende gemiddelde modelle. Eenveranderlike (enkele vektor) ARIMA is 'n vooruitskatting tegniek wat die toekomstige waardes van 'n reeks ten volle gebaseer op sy eie traagheid projekte. Die belangrikste aansoek is op die gebied van korttermyn voorspelling wat ten minste 40 historiese data punte. Dit werk die beste wanneer jou data toon 'n stabiele of konsekwent patroon met verloop van tyd met 'n minimum bedrag van uitskieters. Soms genoem word Posbus-Jenkins (ná die oorspronklike skrywers), ARIMA is gewoonlik beter as gladstrykingstegnieke eksponensiële wanneer die data is redelik lank en die korrelasie tussen die verlede waarnemings is stabiel. As die data is kort of baie volatiel, dan kan 'n paar smoothing metode beter te presteer. As jy nie ten minste 38 datapunte het, moet jy 'n ander metode as ARIMA oorweeg. Die eerste stap in die toepassing van ARIMA metode is om te kyk vir stasionariteit. Stasionariteit impliseer dat die reeks bly op 'n redelik konstante vlak met verloop van tyd. As 'n tendens bestaan, soos in die meeste ekonomiese of besigheid aansoeke, dan is jou data nie stilstaan. Die data moet ook 'n konstante stryd in sy skommelinge oor tyd te wys. Dit is maklik gesien met 'n reeks wat swaar seisoenale en groei teen 'n vinniger tempo. In so 'n geval, sal die wel en wee van die seisoen meer dramaties met verloop van tyd. Sonder hierdie stasionariteit voorwaardes voldoen word, baie van die berekeninge wat verband hou met die proses kan nie bereken word nie. As 'n grafiese plot van die data dui stationariteit, dan moet jy verskil die reeks. Breukmetodes is 'n uitstekende manier om die transformasie van 'n nie-stationaire reeks om 'n stilstaande een. Dit word gedoen deur die aftrekking van die waarneming in die huidige tydperk van die vorige een. As hierdie transformasie slegs een keer gedoen word om 'n reeks, sê jy dat die data het eers differenced. Hierdie proses elimineer wese die tendens as jou reeks groei teen 'n redelik konstante tempo. As dit groei teen 'n vinniger tempo, kan jy dieselfde prosedure en verskil die data weer aansoek doen. Jou data sal dan tweede differenced. Outokorrelasies is numeriese waardes wat aandui hoe 'n data-reeks is wat verband hou met self met verloop van tyd. Meer presies, dit meet hoe sterk datawaardes op 'n bepaalde aantal periodes uitmekaar gekorreleer met mekaar oor tyd. Die aantal periodes uitmekaar is gewoonlik bekend as die lag. Byvoorbeeld, 'n outokorrelasie op lag 1 maatreëls hoe waardes 1 tydperk uitmekaar gekorreleer met mekaar oor die hele reeks. 'N outokorrelasie op lag 2 maatreëls hoe die data twee periodes uitmekaar gekorreleer regdeur die reeks. Outokorrelasies kan wissel van 1 tot -1. 'N Waarde naby aan 1 dui op 'n hoë positiewe korrelasie, terwyl 'n waarde naby aan -1 impliseer 'n hoë negatiewe korrelasie. Hierdie maatreëls is meestal geëvalueer deur middel van grafiese plotte genoem correlagrams. A correlagram plotte die motor - korrelasie waardes vir 'n gegewe reeks by verskillende lags. Dit staan ​​bekend as die outokorrelasie funksie en is baie belangrik in die ARIMA metode. ARIMA metode poog om die bewegings in 'n stilstaande tyd reeks beskryf as 'n funksie van wat is outoregressiewe en bewegende gemiddelde parameters genoem. Dit is waarna verwys word as AR parameters (autoregessive) en MA parameters (bewegende gemiddeldes). 'N AR-model met slegs 1 parameter kan geskryf word as. X (t) 'n (1) X (t-1) E (t) waar x (t) tydreekse wat ondersoek word 'n (1) die outoregressiewe parameter van orde 1 X (t-1) die tydreeks uitgestel 1 periode E (t) die foutterm van die model beteken dit eenvoudig dat enige gegewe waarde X (t) kan verduidelik word deur 'n funksie van sy vorige waarde, X (t-1), plus 'n paar onverklaarbare ewekansige fout, E (t). As die beraamde waarde van A (1) was 0,30, dan is die huidige waarde van die reeks sal wees met betrekking tot 30 van sy waarde 1 periode gelede. Natuurlik, kan die reeks word wat verband hou met meer as net 'n verlede waarde. Byvoorbeeld, X (t) 'n (1) X (t-1) A (2) X (t-2) E (t) Dit dui daarop dat die huidige waarde van die reeks is 'n kombinasie van die twee onmiddellik voorafgaande waardes, X (t-1) en X (t-2), plus 'n paar random fout E (t). Ons model is nou 'n outoregressiewe model van orde 2. bewegende gemiddelde modelle: 'n Tweede tipe Box-Jenkins model is 'n bewegende gemiddelde model genoem. Hoewel hierdie modelle lyk baie soortgelyk aan die AR model, die konsep agter hulle is heel anders. Bewegende gemiddelde parameters verband wat gebeur in tydperk t net om die ewekansige foute wat plaasgevind het in die verlede tyd periodes, naamlik E (t-1), E (t-2), ens, eerder as om X (t-1), X ( t-2), (xt-3) as in die outoregressiewe benaderings. 'N bewegende gemiddelde model met 'n MA termyn kan soos volg geskryf word. X (t) - B (1) E (t-1) E (t) Die term B (1) genoem word 'n MA van orde 1. Die negatiewe teken voor die parameter is slegs vir konvensie en word gewoonlik gedruk uit motor - dateer deur die meeste rekenaarprogramme. Bogenoemde model eenvoudig sê dat enige gegewe waarde van X (t) direk verband hou net aan die ewekansige fout in die vorige tydperk, E (t-1), en die huidige foutterm, E (t). Soos in die geval van outoregressiemodelle, kan die bewegende gemiddelde modelle uitgebrei word na 'n hoër orde strukture wat verskillende kombinasies en bewegende gemiddelde lengtes. ARIMA metode kan ook modelle gebou word dat beide outoregressiewe en gemiddelde parameters saam beweeg inkorporeer. Hierdie modelle word dikwels na verwys as gemengde modelle. Hoewel dit maak vir 'n meer ingewikkelde voorspelling instrument, kan die struktuur inderdaad die reeks beter na te boots en produseer 'n meer akkurate skatting. Suiwer modelle impliseer dat die struktuur bestaan ​​slegs uit AR of MA parameters - nie beide. Die ontwikkel deur hierdie benadering modelle word gewoonlik genoem ARIMA modelle omdat hulle 'n kombinasie van outoregressiewe (AR) te gebruik, integrasie (I) - verwys na die omgekeerde proses van breukmetodes die voorspelling te produseer, en bewegende gemiddelde (MA) operasies. 'N ARIMA model word gewoonlik gestel as ARIMA (p, d, q). Dit verteenwoordig die orde van die outoregressiewe komponente (p), die aantal breukmetodes operateurs (d), en die hoogste orde van die bewegende gemiddelde termyn. Byvoorbeeld, ARIMA (2,1,1) beteken dat jy 'n tweede orde outoregressiewe model met 'n eerste orde bewegende gemiddelde komponent waarvan die reeks is differenced keer om stasionariteit veroorsaak. Pluk die reg spesifikasie: Die grootste probleem in die klassieke Box-Jenkins probeer om te besluit watter ARIMA spesifikasie gebruik - i. e. hoeveel AR en / of MA parameters in te sluit. Dit is wat die grootste deel van Box-Jenkings 1976 is gewy aan die identifikasieproses. Dit was afhanklik van grafiese en numeriese eval - uation van die monster outokorrelasie en gedeeltelike outokorrelasiefunksies. Wel, vir jou basiese modelle, die taak is nie te moeilik. Elk outokorrelasiefunksies dat 'n sekere manier te kyk. Maar wanneer jy optrek in kompleksiteit, die patrone is nie so maklik opgespoor. Om sake nog moeiliker maak, jou data verteenwoordig slegs 'n voorbeeld van die onderliggende proses. Dit beteken dat steekproeffoute (uitskieters, meting fout, ens) die teoretiese identifikasie proses kan verdraai. Dit is waarom tradisionele ARIMA modellering is 'n kuns eerder as 'n science. Spreadsheet implementering van seisoenale aanpassing en eksponensiële gladstryking Dit is maklik om seisoenale aanpassing voer en pas eksponensiële gladstryking modelle met behulp van Excel. Die skerm beelde en kaarte hieronder is geneem uit 'n sigblad wat is opgestel om multiplikatiewe seisoenale aanpassing en lineêre eksponensiële gladstryking op die volgende kwartaallikse verkope data van Buitenboord Marine illustreer: Om 'n afskrif van die sigbladlêer self te bekom, kliek hier. Die weergawe van lineêre eksponensiële gladstryking wat hier gebruik sal word vir doeleindes van demonstrasie is Brown8217s weergawe, bloot omdat dit geïmplementeer kan word met 'n enkele kolom van formules en daar is net een glad konstante te optimaliseer. Gewoonlik is dit beter om Holt8217s weergawe dat afsonderlike glad konstantes vir vlak en tendens het gebruik. Die vooruitskatting proses verloop soos volg: (i) die eerste keer die data is seisoenaal-aangepaste (ii) dan voorspellings gegenereer vir die seisoenaal-aangepaste data via lineêre eksponensiële gladstryking en (iii) Ten slotte het die seisoensaangesuiwerde voorspellings is quotreseasonalizedquot om voorspellings vir die oorspronklike reeks te verkry . Die aanpassingsproses seisoenale word in kolomme gedoen D deur G. Die eerste stap in seisoenale aanpassing is om te bereken 'n gesentreerde bewegende gemiddelde (hier opgevoer in kolom D). Dit kan gedoen word deur die gemiddelde van twee een-jaar-wye gemiddeldes wat geneutraliseer deur 'n tydperk relatief tot mekaar. ( 'N kombinasie van twee geneutraliseer gemiddeldes eerder as 'n enkele gemiddelde nodig vir sentrering doeleindes wanneer die aantal seisoene is selfs.) Die volgende stap is om die verhouding te bereken om bewegende gemiddelde --i. e. die oorspronklike data gedeel deur die bewegende gemiddelde in elke tydperk - wat hier uitgevoer word in kolom E. (Dit is ook die quottrend-cyclequot komponent van die patroon genoem, sover tendens en besigheid-siklus effekte kan oorweeg word om almal wat bly nadat gemiddeld meer as 'n geheel jaar se data. natuurlik, maand-tot-maand veranderinge wat nie as gevolg van seisoenale kan bepaal word deur baie ander faktore, maar die 12-maande-gemiddelde glad oor hulle 'n groot mate.) die na raming seisoenale indeks vir elke seisoen word bereken deur die eerste gemiddeld al die verhoudings vir daardie spesifieke seisoen, wat gedoen word in selle G3-G6 behulp van 'n AVERAGEIF formule. Die gemiddelde verhoudings word dan verklein sodat hulle som presies 100 keer die aantal periodes in 'n seisoen, of 400 in hierdie geval, wat gedoen word in selle H3-H6. Onder in kolom F, word VLOOKUP formules wat gebruik word om die toepaslike seisoenale indeks waarde in elke ry van die datatabel voeg, volgens die kwartaal van die jaar wat dit verteenwoordig. Die gesentreerde bewegende gemiddelde en die seisoensaangepaste data beland lyk soos hierdie: Let daarop dat die bewegende gemiddelde lyk tipies soos 'n gladder weergawe van die seisoensaangepaste reeks, en dit is korter aan beide kante. Nog 'n werkblad in dieselfde Excel lêer toon die toepassing van die lineêre eksponensiële gladstryking model om die seisoensaangepaste data, begin in kolom G. 'n Waarde vir die glad konstante (alfa) bo die voorspelling kolom ingeskryf (hier, in sel H9) en vir gerief dit die omvang naam quotAlpha. quot (die naam is opgedra deur die opdrag quotInsert / naam / Createquot.) die LES model is geïnisialiseer deur die oprigting van die eerste twee voorspellings gelyk aan die eerste werklike waarde van die seisoensaangepaste reeks toegeken. Die formule wat hier gebruik word vir die LES voorspelling is die enkel-vergelyking rekursiewe vorm van Brown8217s model: Hierdie formule is in die sel wat ooreenstem met die derde tydperk (hier, sel H15) aangegaan en kopieer af van daar af. Let daarop dat die LES voorspelling vir die huidige tydperk verwys na die twee voorafgaande waarnemings en die twee voorafgaande voorspelling foute, sowel as om die waarde van alfa. So, die voorspelling formule in ry 15 slegs verwys na data wat beskikbaar is in ry 14 en vroeër was. (Natuurlik, as ons wou eenvoudig in plaas van lineêre eksponensiële gladstryking te gebruik, kan ons die SES formule hier vervang in plaas. Ons kan ook gebruik Holt8217s eerder as Brown8217s LES model, wat nog twee kolomme van formules sou vereis dat die vlak en tendens bereken wat gebruik word in die vooruitsig.) die foute word bereken in die volgende kolom (hier, kolom J) deur die aftrekking van die voorspellings van die werklike waardes. Die wortel beteken kwadraat fout is bereken as die vierkantswortel van die variansie van die foute plus die vierkant van die gemiddelde. (Dit volg uit die wiskundige identiteit. MSE afwyking (foute) (gemiddeld (foute)) 2) By die berekening van die gemiddelde en variansie van die foute in hierdie formule, is die eerste twee periodes uitgesluit omdat die model vooruitskatting nie eintlik nie begin totdat die derde tydperk (ry 15 op die sigblad). Die optimale waarde van alfa kan óf gevind word deur die hand verander alfa tot die minimum RMSE is gevind, of anders kan jy die quotSolverquot gebruik om 'n presiese minimering. Die waarde van alfa dat die Solver gevind word hier (alpha0.471) getoon. Dit is gewoonlik 'n goeie idee om die foute van die model (in omskep eenhede) te plot en ook om te bereken en stip hul outokorrelasies by lags van tot een seisoen. Hier is 'n tydreeks plot van die (seisoenaangepaste) foute: Die fout outokorrelasies word bereken deur gebruik te maak van die funksie CORREL () om die korrelasies van die foute te bereken met hulself uitgestel word deur een of meer periodes - besonderhede word in die sigblad model . Hier is 'n plot van die outokorrelasies van die foute by die eerste vyf lags: Die outokorrelasies by lags 1 tot 3 is baie naby aan nul, maar die pen op lag 4 (wie se waarde is 0.35) is 'n bietjie lastig - dit dui daarop dat die seisoenale aanpassing proses het nie heeltemal suksesvol. Maar dit is eintlik net effens betekenisvol. 95 betekenis bands om te toets of outokorrelasies is aansienlik verskil van nul is min of meer plus-of-minus 2 / SQRT (N-k), waar n die steekproefgrootte en k is die lag. Hier N 38 en k wissel van 1 tot 5, so die vierkant-wortel-van-n-minus-k is ongeveer 6 vir almal, en vandaar die perke vir die toets van die statistiese betekenisvolheid van afwykings van nul is min of meer plus - of-minus 2/6, of 0.33. As jy die waarde van alfa wissel met die hand in hierdie Excel model, kan jy die effek op die tydreeks en outokorrelasie erwe van die foute in ag te neem, sowel as op die wortel-gemiddelde-kwadraat fout, wat onder sal wees geïllustreer. Aan die onderkant van die sigblad, is die voorspelling formule quotbootstrappedquot in die toekoms deur bloot vervang voorspellings vir werklike waardes by die punt waar die werklike data loop uit - d. w.z. waar quotthe futurequot begin. (Met ander woorde, in elke sel waar 'n toekomstige datawaarde sou plaasvind, 'n selverwysing is ingevoeg wat daarop dui dat die voorspelling gemaak vir daardie tydperk.) Al die ander formules is eenvoudig van bo af gekopieer: Let daarop dat die foute vir voorspellings van die toekoms is al bereken as nul. Dit beteken nie dat die werklike foute sal nul wees nie, maar eerder dit weerspieël bloot die feit dat vir doeleindes van voorspelling is ons veronderstelling dat die toekoms data die voorspellings sal gelyk gemiddeld. Die gevolglike LES voorspellings vir die seisoenaal-aangepaste data soos volg lyk: Met hierdie besondere waarde van Alpha, wat is optimaal vir een-periode-vooruit voorspellings, die geprojekteerde tendens is effens opwaarts, wat die plaaslike tendens wat oor die afgelope 2 jaar is waargeneem of so. Vir ander waardes van Alpha dalk 'n heel ander tendens projeksie verkry. Dit is gewoonlik 'n goeie idee om te sien wat gebeur met die langtermyn-tendens projeksie wanneer Alpha is uiteenlopend, omdat die waarde wat die beste vir 'n kort termyn vooruitskatting sal nie noodwendig die beste waarde vir die voorspelling van die meer verre toekoms wees. Byvoorbeeld, hier is die resultaat wat verkry word indien die waarde van alfa hand is ingestel op 0,25: Die geprojekteerde langtermyn-tendens is nou negatiewe eerder as positiewe Met 'n kleiner waarde van Alpha model plaas meer gewig op ouer data in sy skatting van die huidige vlak en tendens, en sy voorspellings langtermyn weerspieël die afwaartse neiging waargeneem oor die afgelope 5 jaar, eerder as die meer onlangse opwaartse neiging. Hierdie grafiek ook duidelik illustreer hoe die model met 'n kleiner waarde van Alpha is stadiger te reageer op quotturning pointsquot in die data en dus geneig is om 'n fout van die dieselfde teken maak vir baie tye in 'n ry. Die 1-stap-ahead voorspelling foute is groter gemiddeld as dié verkry voordat (RMSE van 34,4 eerder as 27.4) en sterk positief autocorrelated. Die lag-1 outokorrelasie van 0,56 oorskry grootliks die waarde van 0.33 hierbo bereken vir 'n statisties beduidende afwyking van nul. As 'n alternatief vir slingerspoed die waarde van alfa ten einde meer konserwatisme te voer in 'n lang termyn voorspellings, is 'n quottrend dampeningquot faktor soms by die model ten einde te maak die geprojekteerde tendens plat uit na 'n paar periodes. Die finale stap in die bou van die voorspelling model is om die LES voorspellings quotreasonalizequot deur hulle deur die toepaslike seisoenale indekse te vermenigvuldig. So, die reseasonalized voorspellings in kolom Ek is net die produk van die seisoenale indekse in kolom F en die seisoensaangepaste LES voorspellings in kolom H. Dit is relatief maklik om vertrouensintervalle bereken vir een-stap-ahead voorspellings gemaak deur hierdie model: eerste bereken die RMSE (wortel-gemiddelde-kwadraat fout, wat net die vierkantswortel van die MSE) en dan bereken 'n vertrouensinterval vir die seisoensaangepaste voorspel deur optelling en aftrekking twee keer die RMSE. (Oor die algemeen 'n 95 vertrouensinterval vir 'n een-tydperk lig voorspelling is min of meer gelyk aan die punt voorspelling plus-of-minus twee keer die geskatte standaardafwyking van die voorspelling foute, die aanvaarding van die fout verspreiding is ongeveer normale en die steekproefgrootte groot genoeg is, sê, 20 of meer. Hier is die RMSE eerder as die monster standaardafwyking van die foute is die beste raming van die standaard afwyking van toekomstige vooruitsig foute, want dit neem vooroordeel sowel toevallige variasies in ag.) die vertroue perke vir die seisoensaangepaste voorspelling is dan reseasonalized. saam met die voorspelling, deur hulle met die toepaslike seisoenale indekse te vermenigvuldig. In hierdie geval is die RMSE is gelyk aan 27.4 en die seisoensaangepaste voorspelling vir die eerste toekoms tydperk (Desember-93) is 273,2. sodat die seisoensaangepaste 95 vertrouensinterval is 273,2-227,4 218,4 te 273.2227.4 328,0. Vermenigvuldig hierdie perke deur Decembers seisoenale indeks van 68,61. Ons kry onderste en boonste vertroue grense van 149,8 en 225,0 rondom die Desember-93 punt voorspelling van 187,4. Vertroue perke vir voorspellings meer as een tydperk wat voorlê, sal oor die algemeen uit te brei as die voorspelling horison toeneem, as gevolg van onsekerheid oor die vlak en tendens asook die seisoenale faktore, maar dit is moeilik om hulle te bereken in die algemeen deur analitiese metodes. (Die geskikte manier om vertroue perke vir die LES voorspelling bereken is deur die gebruik van ARIMA teorie, maar die onsekerheid in die seisoenale indekse is 'n ander saak.) As jy 'n realistiese vertroue interval vir 'n voorspelling wil meer as een tydperk wat voorlê, met al die bronne van fout in ag, jou beste bet is om empiriese metodes gebruik: byvoorbeeld, 'n vertrouensinterval vir 'n 2-stap vorentoe voorspel verkry, jy kan 'n ander kolom skep op die sigblad om 'n 2-stap-ahead voorspelling bereken vir elke tydperk ( deur Opstarten die een-stap-ahead voorspelling). bereken dan die RMSE van die 2-stap-ahead voorspelling foute en gebruik dit as die basis vir 'n 2-stap-ahead vertroue interval.


No comments:

Post a Comment