Monday, October 24, 2016

Bewegende gemiddelde ontbrekende waardes

Hoe om te bereken Bewegende Gemiddeldes in Excel Excel Data-analise Vir Dummies, 2nd Edition Die Data-analise opdrag gee 'n instrument vir die berekening van bewegende en eksponensieel stryk gemiddeldes in Excel. Veronderstel, ter wille van illustrasie, wat you8217ve ingesamel daaglikse temperatuur inligting. Jy wil die driedaagse bereken bewegende gemiddelde 8212 die gemiddelde van die afgelope drie dae 8212 as deel van 'n paar eenvoudige weervoorspelling. Om te bereken bewegende gemiddeldes vir hierdie datastel, neem die volgende stappe. Om 'n bewegende gemiddelde te bereken, eerste kliek op die data tab8217s Data-analise opdrag knoppie. Wanneer Excel vertoon die dialoog Data-analise boks, kies die bewegende gemiddelde item uit die lys en kliek op OK. Excel vertoon die bewegende gemiddelde dialoog. Identifiseer die inligting wat jy wil gebruik om die bewegende gemiddelde te bereken. Klik op die insette Range tekskassie van die bewegende gemiddelde dialoog. Identifiseer dan die insette reeks, óf deur te tik 'n werkblad verskeidenheid adres of deur die gebruik van die muis om die werkblad verskeidenheid kies. Jou reeksverwysing moet absolute sel adresse gebruik. 'N absolute sel adres voorafgaan die brief kolom en ry getal met tekens, soos in A1: A10. As die eerste sel in jou insette reeks sluit in 'n teks etiket om jou data te identifiseer of beskryf, kies die etikette in eerste ry boks. In die interval tekskassie, vertel Excel hoeveel waardes in die bewegende gemiddelde berekening te sluit. Jy kan 'n bewegende gemiddelde met behulp van 'n aantal waardes te bereken. By verstek, Excel gebruik die mees onlangse drie waardes om die bewegende gemiddelde te bereken. Te bepaal dat 'n ander aantal waardes word gebruik om die bewegende gemiddelde te bereken, te betree wat waarde in die interval tekskassie. Vertel Excel waar die bewegende gemiddelde data te plaas. Gebruik die Uitset Range tekskassie om die werkblad reeks waarin jy die bewegende gemiddelde data plaas identifiseer. In die werkkaart byvoorbeeld het die bewegende gemiddelde data is geplaas in die werkblad verskeidenheid B2: B10. (Opsioneel) Gee aan of u 'n grafiek wil. As jy 'n grafiek wat die bewegende gemiddelde inligting plotte wil, Kies die diagram Uitgawe boks. (Opsioneel) Dui aan of jy wil standaardfout inligting bereken. As jy wil die standaard foute te bereken vir die data, kies die standaard foute boks. Excel plaas standaardfout waardes langs die bewegende gemiddelde waardes. (Die standaard fout inligting gaan in C2:. C10) Nadat jy klaar spesifiseer wat bewegende gemiddelde inligting wat jy berekende wil en waar jy wil dit geplaas word, klik op OK. Excel bereken bewegende gemiddelde inligting. Let wel: As Excel doesn8217t genoeg inligting om 'n bewegende gemiddelde te bereken vir 'n standaard fout, dit plaas die fout boodskap in die sel. Data-analise en statistiese sagteware Nicholas J. Cox, Durham Universiteit, die Verenigde Koninkryk Christopher Baum, Boston College egen, MA () en sy beperkinge Statarsquos mees voor die hand liggend bevel vir die berekening van bewegende: Jy kan 'n paar selle wat hierdie fout boodskap as 'n value. Stata wys sien gemiddeldes is die ma () funksie van egen. Gegewe 'n uitdrukking, dit skep 'n - periode bewegende gemiddelde van daardie uitdrukking. By verstek, is geneem as 3. moet vreemd wees. Maar, soos die handleiding inskrywing dui, egen, MA () mag nie gekombineer word met die varlist:. en, net vir hierdie rede is dit nie van toepassing op paneel data. In elk geval, dit staan ​​buite die stel instruksies wat spesifiek vir tydreekse geskryf sien tydreekse vir meer inligting. Alternatiewe benaderings tot bereken bewegende gemiddeldes vir paneel data, is daar ten minste twee keuses. Beide is afhanklik van die dataset nadat vooraf tsset. Dit is baie moeite werd te doen: nie alleen kan bespaar jy jouself herhaaldelik spesifiseer paneel veranderlike en tyd veranderlike, maar Stata optree slim enige gapings in die data gegee. 1. Skryf jou eie definisie met behulp genereer Gebruik time-reeks operateurs soos L. en F.. gee die definisie van die bewegende gemiddelde as die argument om 'n te genereer verklaring. As jy dit doen, jy, natuurlik, nie beperk tot die gelyke gewigte (ongeweegde) gesentreer bewegende gemiddeldes bereken deur egen, MA (). Byvoorbeeld, ewe-geweeg drie-tydperk bewegende gemiddeldes sal deur gegee word en 'n paar gewigte kan maklik gespesifiseerde: Jy kan natuurlik, spesifiseer 'n uitdrukking soos log (myvar) in plaas van 'n veranderlike naam soos myvar. Een groot voordeel van hierdie benadering is dat Stata doen outomaties die regte ding vir paneel data: voorste en agter waardes uitgewerk binne panele, net soos logika dikteer hulle behoort te wees. Die mees noemenswaardige nadeel is dat die command line eerder lank kan kry as die bewegende gemiddelde behels verskeie terme. Nog 'n voorbeeld is 'n eensydige bewegende gemiddelde wat slegs gebaseer is op vorige waardes. Dit kan nuttig wees vir die opwekking van 'n aangepaste verwagting van wat 'n veranderlike sal suiwer gebaseer op inligting tot op hede: wat kan iemand voorspelling vir die huidige tydperk gebaseer op die afgelope vier waardes, met behulp van 'n vaste gewig skema (A 4-tydperk lag kan wees veral algemeen gebruik met kwartaallikse tijdreeksen.) 2. gebruik egen, filter () van SSC gebruik die gebruiker geskryf egen funksie filter () van die egenmore pakket op SSC. In Stata 7 (opgedateer na 14 November 2001), kan jy die pakket installeer deur waarna help egenmore punte om besonderhede oor filter (). Die twee voorbeelde hierbo sou word gelewer (In hierdie vergelyking genereer die benadering is dalk meer deursigtig, maar ons sal 'n voorbeeld van die teenoorgestelde in 'n oomblik sien.) Die lags is 'n numlist. lei dat negatiewe lags: in hierdie geval -1/1 brei om -1 0 1 of lei 1, lag 0, lag 1. Die Coëf ficients, 'n ander numlist, vermeerder die ooreenstemmende sloerende of leidende items: in hierdie geval die items is F1.myvar. myvar en L1.myvar. Die effek van die opsie normaliseer is aan elke koëffisiënt skaal deur die som van die koëffisiënte sodat Coëf (1 1 1) normaliseer is gelykstaande aan koëffisiënte van 1/3 1/3 1/3 en Coëf (1 2 1) normaliseer is gelykstaande om koëffisiënte van 1/4 1/2 1/4. Jy moet nie net die lags, maar ook die koëffisiënte spesifiseer. Omdat egen, MA () gee die ewe geweegde geval, die belangrikste rasionaal vir egen, filter () is om die ongelyk geweegde geval, waarvoor jy moet koëffisiënte spesifiseer ondersteun. Dit kan ook gesê word dat die verpligting om gebruikers te koëffisiënte spesifiseer 'n bietjie ekstra druk op hulle om te dink oor wat koëffisiënte wat hulle wil. Die belangrikste rede vir gelyke gewigte is, ons dink, eenvoud, maar gelyke gewigte het gemeen frekwensiedomein eienskappe, om net 'n oorweging te noem. Die derde voorbeeld hierbo kan óf waarvan net omtrent so ingewikkeld as die genereer benadering. Daar is gevalle waar egen, filter () gee 'n eenvoudiger formulering as genereer. As jy 'n nege-termyn binomiaal filter, wat klimatoloë nuttig vind wil, kyk dan miskien minder aaklig as, en makliker om reg as kry, net soos met die genereer benadering, egen, filter () werk behoorlik met paneel data. Trouens, soos hierbo genoem, dit hang af van die dataset nadat vooraf tsset. 'N Grafiese punt Na die berekening van jou bewegende gemiddeldes, sal jy waarskynlik wil hê om te kyk na 'n grafiek. Die gebruiker geskrewe tsgraph is slim oor tsset datastelle. Installeer dit in 'n up-to-date Stata 7 deur SSC Inst tsgraph. Wat van subsetting met as een van die bogenoemde voorbeelde maak gebruik van as beperkings. Om die waarheid te egen, sal ma () nie toelaat dat indien gespesifiseer word. Soms mense wil gebruik as die berekening bewegende gemiddeldes, maar die gebruik daarvan is 'n bietjie meer ingewikkeld as wat dit is gewoonlik. Wat sou jy verwag van 'n bewegende gemiddelde bereken met as. Kom ons identifiseer twee moontlikhede: Swak interpretasie: Ek dont wil enige resultate vir die uitgesluit Waarnemings sien. Sterk interpretasie: Ek dont selfs wil hê jy moet die waardes vir die uitgesluit waarnemings. Hier is 'n konkrete voorbeeld. Veronderstel as gevolg van 'n paar as voorwaarde, waarnemings 1-42 ingesluit maar nie Waarnemings 43 op. Maar die bewegende gemiddelde vir 42 sal afhang, onder andere, op die waarde vir waarneming 43 as die gemiddelde strek heen en weer en is van lengte ten minste 3, en dit sal op soortgelyke wyse afhanklik van 'n paar van die waarnemings 44 en verder in sekere omstandighede. Ons raaiskoot is dat die meeste mense sal gaan vir die swak interpretasie, maar of dit korrek is, beteken egen, filter () nie ondersteun as óf. Jy kan altyd ignoreer wat jy donrsquot wil of selfs ongewenste waardes stel om daarna ontbreek deur die gebruik van te vervang. 'N Nota oor vermiste resultate aan die einde van 'n reeks Omdat bewegende gemiddeldes is funksies van sloerings en lei, egen, MA () produseer ontbreek waar die lags en lei nie bestaan ​​nie, aan die begin en einde van die reeks. 'N opsie nomiss dwing die berekening van korter, uncentered bewegende gemiddeldes vir die sterte. In teenstelling hiermee het nie genereer word nie egen, filter () doen, of laat, niks spesiaal ontbreek resultate te vermy. Indien enige van die waardes wat nodig is vir die berekening ontbreek, dan is dit gevolg ontbreek. Dit is aan gebruikers om te besluit of en watter korrektiewe chirurgie nodig is vir sulke waarnemings, vermoedelik na te kyk na die datastel en die oorweging van enige onderliggende wetenskap wat tot bear. A eenvoudige en algemene metode vir die invul van ontbrekende data kan word, as jy lopies van 'n volledige data, is om Lineêre regressie gebruik. Sê jy 1000 lopies van 5 in 'n ry met geen ontbreek. Stel die 1000 x 1 vektor y en 1000 x 4 matriks X: Regressie sal jy 4 nommers A B C D wat 'n beste wedstryd gee vir jou 1000 rye data mdash verskillende data, anders A B C D gee. Dan gebruik jy hierdie A B C D om te skat (voorspel, interpoleer) ontbreek wt0. (Vir menslike gewigte, Id verwag ABCD aan almal rondom 04/01 wees.) (Daar is Honderde boeke en artikels oor regressie, op alle vlakke. Vir die verband met interpolasie, al is, ek weet nie van 'n goeie inleiding iemand) Moving gemiddelde - MA afbreek bewegende gemiddelde - MA As SMA voorbeeld, kyk na 'n sekuriteit met die volgende sluitingsdatum pryse meer as 15 dae: Week 1 (5 dae) 20, 22, 24, 25, 23 Week 2 (5 dae) 26, 28 26, 29, 27 Week 3 (5 dae) 28, 30, 27, 29, 28 A 10-dag MA sou gemiddeld uit die sluitingsdatum pryse vir die eerste 10 dae as die eerste data punt. Die volgende data punt sal daal die vroegste prys, voeg die prys op dag 11 en neem die gemiddelde, en so aan, soos hieronder getoon. Soos voorheen verduidelik, MA lag huidige prys aksie omdat dit gebaseer is op vorige pryse hoe langer die tydperk vir die MA, hoe groter is die lag. So sal 'n 200-dag MA 'n veel groter mate van lag as 'n 20-dag MA het omdat dit pryse vir die afgelope 200 dae bevat. Die lengte van die MA om te gebruik, hang af van die handel doelwitte, met korter MA gebruik vir 'n kort termyn handel en langer termyn MA meer geskik vir 'n lang termyn beleggers. Die 200-dag MA word wyd gevolg deur beleggers en handelaars, met onderbrekings bo en onder hierdie bewegende gemiddelde beskou as belangrike handel seine wees. MA ook mee belangrik handel seine op hul eie, of wanneer twee gemiddeldes kruis. 'N stygende MA dui daarop dat die sekuriteit is in 'n uptrend. terwyl 'n dalende MA dui daarop dat dit in 'n verslechtering neiging. Net so, is opwaartse momentum bevestig met 'n lomp crossover. wat gebeur wanneer 'n korttermyn-MA kruisies bo 'n langer termyn MA. Afwaartse momentum bevestig met 'n lomp crossover, wat plaasvind wanneer 'n kort termyn MA kruisies onder 'n langer termyn MA. I ek probeer om te skep bewegende gemiddeldes deur te kyk na lag - lag 1 en lag2 waardes van belonings verlossing. Hier is die formule huidige (lag - lag2) / (lag2 - lag3). Maar die huidige waarde is nie sequencially in die rye op werk gestoor. Beteken, toe ek vind row4 huidige waarde ontbreek, gebruik ek hierdie formule om vorendag te kom met row4 belonings. Nou, row4 - gt huidige 100 Toe hy na row5 - nuwe belonings bereken row4 isnt beskikbaar. lag1 - gt row4gt huidige 0 (ek dink lag waardes is nie dinamies) DATA vtest SET V10 deur vid groep id lagred1 lag (newredemption1) lag2red1 lag2 (newredemption) lag3red1 lag3 (newredemption) expectedincreasepts (lagred1 (lagred1 / lag2red1)) - lag2red1 previosredeemgrowth (lagred1 - lag2red1) / (lag2red1 - lag3red1) huidige huidige (expectedincreasepts previosredeemgrowth) Dit sal regtig help om te verstaan ​​wat jy probeer as jy 'n paar data voorsien in die vorm van 'n datastep vir insette en wat jy verwag vir die uitset vir daardie voorbeeld data. Ek wonder, want jy sê stroom soms ontbreek wat jy wil huidige som iets om te oorweeg (huidige (expectedincreasepts previosredeemgrowth).): Jy nodig het om al die moontlike ontbrekende waardes aan te spreek voordat jy afdeling met die gesloerde waardes. Lag3 sal nie bestaan ​​nie totdat jy die 4de waarneming. So jy gaan afdeling deur vermiste wat jy dalk wil om te oorweeg nie. En as jou newredemption veranderlike evermissing jy gaan onderbroke ander berekeninge met ontbrekende waardes te kry. Lag waardes is slegs vir veranderlikes gelees deur 'n stel of saamsmelt verklaring. As jy wil 'n berekende veranderlike hou gebruik dan jou behou. Wanneer om te herstel na die aanvanklike waardes of vermis behou veranderlikes is soms interessant. Jy mag dalk wil iets soos: Behou TempCurrent 0 / hierdie stel 'n aanvanklike waarde van 0 / as vermis (huidige) dan currentsum (TempCurrent, (expectedincreasepts previosredeemgrowth)) anders huidige som / en dan weer die behoue ​​(huidige (expectedincreasepts previosredeemgrowth).) waarde /


No comments:

Post a Comment