Monday, October 17, 2016

Masjienleer forex 2012

Masjienleer met algoTraderJo geword Desember 2014 Status: Lid 383 Posts Hallo mede-handelaars, ek begin hierdie draad hoop om saam met jou 'n paar van my ontwikkelings op die gebied van masjienleer deel. Alhoewel ek nie kan deel met jou presiese stelsels of kodering implementering (dont verwag om iets te kry om quotplug-en-playquot en ryk van hierdie draad) Ek sal met jou idees, resultate van my eksperiment en moontlik ook ander aspekte van my werk te deel. Ek begin hierdie draad in die hoop dat ons in staat is om idees te deel en mekaar help om ons implementering sal wees. Ek sal begin met 'n paar eenvoudige masjien leerstrategieë en sal dan gaan in meer komplekse dinge soos die tyd aanstap. Hoop jy geniet die rit geword Desember 2014 Status: Lid 383 Posts Ek wil begin deur te sê 'n paar basiese dinge. Ek is jammer as die struktuur van my poste veel te wense oor, ek hoef nie enige forum plaas ervaring, maar hoop om 'n paar met die tyd te kry. In masjienleer wat ons wil doen, is net 'n voorspelling wat nuttig is vir ons handelsvennote is genereer. Om hierdie voorspelling ons genereer 'n statistiese model met behulp van 'n stel van voorbeelde (bekende uitgange en 'n paar insette wat ons dinge het voorspelbare krag aan dié uitsette voorspel) ons dan 'n voorspelling van 'n onbekende uitset (ons onlangse data) met behulp van die model wat ons met geskep maak die voorbeelde. Om op te som is dit 'n quotsimplequot proses waar ons die volgende: Kies wat ons wil om te voorspel Kies 'n paar insette veranderlikes wat ons dink kan voorspel ons teikens Bou 'n versameling van voorbeelde gebruik te maak van die verlede data (dit sal ons teiken (s) wees) met ons insette en ons doelwitte Skep 'n model met behulp van hierdie voorbeelde. 'N Model is bloot 'n wiskundige meganisme wat die insette verband / teikens Maak 'n voorspelling van die teiken met behulp van die laaste bekende insette Handel met behulp van hierdie inligting wat ek wil sê van die begin af dat dit baie belangrik om te verhoed dat te doen wat baie akademiese referate oor masjienleer doen, wat is om te probeer om 'n model met 'n baie groot skikkings van voorbeelde te bou en dan probeer om 'n langtermyn voorspelling te maak op 'n quotout-van-samplequot stel. Die bou van 'n model met 10 jaar van data en dan toets dit op die laaste twee is nie-sin, onderhewig aan baie verskillende tipes van statistiese vooroordele sal ons later op bespreek. Oor die algemeen sal jy sien dat die masjien leermodelle Ek bou opgelei op elke maat (of elke keer as ek nodig het om 'n besluit te neem) met behulp van 'n bewegende venster van data vir die bou van voorbeelde (slegs onlangse voorbeelde is relevant beskou). Seker, hierdie benadering is geen vreemdeling vir 'n paar vorme van statistiese vooroordele maar ons verwyder die quotelephant in die roomquot by die gebruik van die breë in-sampleout-van-monster benadering van die meeste akademiese referate (wat nie 'n verrassing, dikwels lei tot benaderings wat nie eintlik nuttig om handel te dryf). Daar is hoofsaaklik drie dinge om jouself te bemoei met by die bou van 'n masjien leermodel: Wat om te voorspel (wat teiken) Wat om dit te voorspel met (wat insette) Hoe om die teiken en insette (wat model) Die meeste van wat ek sal noem in verband op hierdie draad sal fokus op hierdie vrae te beantwoord, met werklike voorbeelde. As jy wil skryf enige vrae wat jy mag hê en ek sal probeer om jou 'n antwoord te gee of sommer net laat weet as ek sal antwoord wat later op. Aangesluit Desember 2014 Status: Lid 383 Posts Laat ons regtig begin nou. 'N ware praktiese voorbeeld gebruik van masjienleer. Kom ons veronderstel ons wil 'n baie eenvoudige model met behulp van 'n baie eenvoudige stel insette / teikens te bou. Vir hierdie eksperiment dit is die antwoorde op die vrae: Wat om te voorspel (wat teiken) - gt Die rigting van die volgende dag (lomp of lomp) Wat om dit te voorspel met (wat insette) - gt Die rigting van die vorige 2 dae Hoe om die teiken en insette (wat model) - gt 'n lineêre kaart klassifiseerder betrekking Hierdie model sal poog om die rigting van die volgende daaglikse bar voorspel. Om ons model te bou wat ons neem die afgelope 200 voorbeelde (a dae rigting as teiken en die vorige twee dae rigtings as insette) en ons op te lei 'n lineêre klassifiseerder. Ons doen dit aan die begin van elke dag bar. As ons 'n voorbeeld waar twee lomp dae lei tot 'n lomp dag die insette sal 1,1 wees en die teiken sou 0 (0bearish, 1bullish) wees, gebruik ons ​​200 van hierdie voorbeelde om die model te lei op elke staaf. Ons hoop om in staat wees om 'n verhouding te bou waar die rigting van twee dae lewer 'n hoër-ewekansige waarskynlikheid om die dae rigting korrek voorspel. Ons gebruik 'n stoploss gelyk aan 50 van die tydperk 20 dae Gemiddelde Ware Range op elke handel. Aangeheg Image (Klik om te vergroot) 'n simulasie van hierdie tegniek 1988-2014 op die euro / dollar (data voor 1999 is DEM / USD) hierbo toon dat die model het geen stabiele wins geslag. Om die waarheid te volg hierdie model 'n negatiewe bevooroordeeld ewekansige loop, wat maak dit geld verloor as 'n funksie van die verspreiding (3 pitte in my sim). Kyk na die skynbaar quotimpressivequot prestasie wat ons in 1993-1995 en in 2003-2005, waar blykbaar kon ons suksesvol die volgende dae rigting voorspel met behulp van 'n eenvoudige lineêre model en die afgelope twee dae directional uitkomste. Hierdie voorbeeld wys jou 'n paar belangrike dinge. Byvoorbeeld, wat oor kort tydskale kan jy maklik mislei word deur willekeur (wat kan 'n paar jaar wees) --- jy kan dink jy iets wat werk, wat eintlik nie het nie. Onthou dat die model is herbou op elke maat, met behulp van die afgelope 200 toevoer / teiken voorbeelde. Wat ander dinge te doen wat jy dink jy kan leer uit hierdie voorbeeld Plaas jou gedagtes Wel. sodat jy het voorspel dat kopers of verkopers sal ingryp Hmm, maar wat presies dit te doen het met die prys gaan styg of daal 100 pitte Prys kan reageer op verskeie maniere -. Dit mag dalk net tenk vir 'n geruime tyd (terwyl al limiet bestellings gevul) en dan hou verder beweeg. Dit kan ook ingegaan op 5, 10, 50 of selfs 99 pitte. In al hierdie gevalle was jy kinda reg oor kopers of verkopers versterking in, maar jy moet verstaan ​​dat hierdie analise nie die geval is nie veel om te doen met jou handel gaan uit 90pip om 100pip. Ja, julle reg Dit is 'n groot deel van die rede waarom ons kry swak resultate wanneer die gebruik van die lineêre afbeelding algoritme. Omdat ons winsgewendheid is swak verband met ons voorspelling. Voorspel dat dae is lomp / lomp is van beperkte gebruik as jy dit nie weet hoeveel prys sal beweeg. Miskien is jou voorspellings korrek is net op dae wat jy gee 10 pitte en jy al die dae wat 100 pit rigting totaal verkeerd is. Wat sou jy oorweeg om 'n beter teiken vir 'n masjien leer metode Ja, julle reg Dit is 'n groot deel van die rede waarom ons kry swak resultate wanneer die gebruik van die lineêre afbeelding algoritme. Omdat ons winsgewendheid is swak verband met ons voorspelling. Voorspel dat dae is lomp / lomp is van beperkte gebruik as jy dit nie weet hoeveel prys sal beweeg. Miskien is jou voorspellings korrek is net op dae wat jy gee 10 pitte en jy al die dae wat 100 pit rigting totaal verkeerd is. Wat sou jy oorweeg om 'n beter teiken vir 'n masjien leer metode kan sê as jy 100 pit TP en SL, ek wil om te voorspel wat kom eerste: TP of SL Voorbeeld: TP gekom eerste 1 SL kom eerste 0 (of -1, Maar jy karteer dit) Ek is nie baie seker, as die vraag pas hier. Ek het onlangs begin, lees en leer oor masjienleer. Kan iemand gooi 'n bietjie lig op hoe om te gaan daaroor of eerder kan iemand deel hul ervaring en 'n paar basiese wenke oor hoe om te gaan daaroor of ten minste toe te pas op 'n resultate van datastelle te sien hoe ambisieus klink dit dui daarop dat die noem oor standaard algoritmes wat gevolg moet word probeer of kyk na, terwyl dit te doen. gevra 1 Februarie 11 van die 18:35 Dit lyk of daar 'n basiese denkfout dat iemand saam kan kom en leer 'n paar masjien leer of AI algoritmes, het hulle as 'n swart boks wees, getref gaan, en terug te sit terwyl hulle aftree. My raad aan jou: Hier is statistieke en masjienleer eerste, dan bekommerd wees oor hoe om dit toe te pas om 'n gegewe probleem. Daar is geen gratis middagete hier. Data-analise is harde werk. Lees die elemente van statistiese leer (die pdf is beskikbaar vir gratis op die webwerf), en dont begin probeer om 'n model te bou totdat jy verstaan ​​ten minste die eerste 8 hoofstukke. Sodra jy die statistieke en masjien leer verstaan, dan moet jy leer hoe om backtest en bou 'n handels-model, rekeningkunde vir transaksiekoste, ens Dit is 'n heel ander gebied. Nadat jy 'n handvatsel op beide die ontleding en die finansies, dan sal dit 'n bietjie voor die hand liggend hoe om dit toe te pas. Die hele punt van hierdie algoritmes is probeer om 'n manier om 'n model om data te pas en te produseer lae vooroordeel en variansie in voorspelling (dit wil sê dat die opleiding en toets voorspelling fout sal wees lae en soortgelyke) te vind. Hier is 'n voorbeeld van 'n handel stelsel met behulp van 'n ondersteuning vektor masjien in R. maar net in gedagte dat jy jouself sal ook 'n groot onguns te hou as jy dit nie spandeer die tyd om die basiese beginsels te verstaan ​​voordat jy probeer om iets esoteries toe te pas. Net om 'n vermaaklike update voeg: Ek het onlangs afgekom op hierdie meesters tesis: A Novel Algorithmic Trading raamwerk Aansoek Evolution en masjien Leer vir Portefeuljekomitee Optimization (2012). Dit is 'n omvattende hersiening van verskillende masjien leerbenaderings in vergelyking teen buy-en-hou. Na byna 200 bladsye, bereik hulle die basiese gevolgtrekking: Geen handel stelsel in staat was om die maatstaf presteer by die gebruik van transaksiekoste. Nodeloos om te sê, dit beteken nie dat dit kan nie gedoen word (ek havent het enige tyd te hersien hul metodes om die geldigheid van die benadering te sien), maar dit bied beslis 'n paar meer bewyse ten gunste van die nie-Vrystaat Lunch stelling. antwoord 1 Februarie 11 van die 18:48 Jase As een van die skrywers van die genoemde master39s tesis ek kan my eie werk aan te haal en sê: quotIf iemand eintlik winsgewende resultate bereik is daar geen aansporing om dit te deel, want dit hul advantage. quot sou ontken Alhoewel ons resultate ondersteuning kan gee aan die mark hipotese dit doesn39t verhoed dat die bestaan ​​van stelsels wat werk. Dit kan wees soos waarskynlikheidsleer: quotIt word gespekuleer dat deurbrake op die gebied van waarskynlikheidsteorie 'n paar keer gebeur het, maar nooit gedeel. Dit kan as gevolg van die praktiese toepassing daarvan in gambling. quot wees Dan weer, miskien is dit al die moderne alchemie. â € Andr233 Christ Andersen 30 April 13 aan 10:01 My advies aan jou: Daar is 'n hele paar masjien Leer / Kunsmatige Intelligensie (ML / AI) takke daar buite: www-formal. stanford. edu/jmc/whatisai/node2 ek net probeer genetiese programmering en 'n paar neurale netwerke, en ek persoonlik dink dat die leer uit ondervinding tak lyk die meeste potensiaal het. GP / GA en neurale nette lyk die mees algemene ondersoek metodes vir die doel van aandelemark voorspellings nie, maar as jy dit doen 'n paar data-ontginning op Voorspel Wall Street. jy dalk in staat wees om 'n paar sentiment analise te doen. Spandeer 'n geruime tyd die leer oor die verskillende ML / AI tegnieke, 'n paar mark data en probeer om 'n paar van die algoritmes te implementeer. Elkeen sal sy sterk - en swakpunte, maar jy kan in staat wees om die voorspellings van elke algoritme kombineer in 'n saamgestelde voorspelling (soortgelyk aan wat die wenners van die Netflix prys het). Sommige Hulpbronne: Hier is 'n paar hulpbronne wat jy dalk wil om te kyk na: Die Babbel: Die algemene konsensus onder handelaars is dat Kunsmatige Intelligensie is 'n voodoo wetenskap, jy kan nie 'n rekenaar te voorspel aandeelpryse en julle seker dat jou geld verloor as jy probeer doen dit. Nietemin, sal dieselfde mense jou vertel dat omtrent die enigste manier om geld te maak op die aandelemark is om te bou en te verbeter op jou eie handel strategie en volg dit nou (wat nie eintlik 'n slegte idee). Die idee van AI algoritmes is nie om Chip bou en laat hom handel vir jou, maar om die proses van die skep van strategieë te outomatiseer. Dit is 'n baie moeisame proses en geensins is dit maklik :). Vermindering van Overfitting: As weve voorheen gehoor, is 'n fundamentele probleem met AI algoritmes overfitting (aka Datamining vooroordeel): kry 'n stel data, jou AI algoritme kan 'n patroon wat veral relevant is vir die opleiding stel vind. maar dit mag nie betrokke in die proef gestel word. Daar is verskeie maniere om te verminder overfitting: Gebruik 'n bevestiging stel. dit nie die geval terugvoering aan die algoritme te gee, maar dit laat jou toe om op te spoor wanneer jou algoritme potensieel begin overfit (maw jy kan stop opleiding as jy te veel overfitting). Gebruik aanlyn masjienleer. dit grootliks hoef vir back-toets en dit is baie van toepassing vir algoritmes wat probeer om die mark voorspellings te maak. Ensemble Leer. bied jou met 'n manier om verskeie algoritmes masjienleer neem en kombineer hul voorspellings. Die veronderstelling is dat verskeie algoritmes kan hê overfit die data in 'n gebied, maar die korrekte kombinasie van hul voorspellings sal beter voorspellende krag het. Twee aspekte van statistiese leer is nuttig vir handel 1. Eerste die vroeër genoem kinders: 'n statistiese metodes gefokus op die werk op live datastelle. Dit beteken dat jy weet wat jy waarneem net 'n voorbeeld van data en jy wil om te ekstrapoleer. Jy het dus te doen met in monster en uit monster kwessies, overfitting en so aan. Uit hierdie oogpunt, data-ontginning is meer gefokus op dooie datastelle (dws jy kan byna al die data te sien, moet jy 'n in monster enigste probleem) as statistiek leer. Omdat statistiese leer oor die werk op live dataset, die Toegepaste Wiskunde wat te doen het met hulle gehad het om te fokus op 'n twee skale probleem: links X ampamp Ftheta (Xn, xi) ampamp L (PI (Xn), N) eindig reg. waar X die (multidimensionele) meld ruimte om te studeer (jy daarin jou verklarende veranderlikes en die kinders om te voorspel), F bevat die dinamika van X wat 'n paar parameters theta nodig. Die willekeur van X is afkomstig van die innovasie XI, wat is i. i.d. Die doel van statistiese leer is 'n metode L bou et as insette 'n gedeeltelike waarneming pi van X en 'n skatting hattheta van theta progressief aanpas, sodat ons sal weet al wat nodig is op X. As jy dink oor die gebruik van statistiese leer om uit te vind die parameters van 'n lineêre regressie. Ons kan modelleer die staat ruimte soos hierdie: underbrace yx einde regs) verlaat begin 'n amp b amp 1 1 amp 0 amp 0 einde reg cdot underbrace x 1 epsilon einde regs) wat dit moontlik maak om in ag te neem (y, x) N eniger N hier theta (a, b). Dan moet jy 'n manier om 'n beramer van theta behulp ons waarnemings progressief te bou vind. Hoekom nie 'n helling afkoms op die T2 afstand tussen y en die regressie: C (hoed a, hoed b) n som (yk - (hoed a, xk hoed b)) 2 Hier gamma is 'n gewig skema. Gewoonlik word 'n lekker manier om 'n beramer bou is om behoorlik die kriteria om die minimum te beperk en te implementeer 'n helling afkoms wat die leer skema L. Gaan terug na ons oorspronklike generiese probleem sal produseer skryf. Ons moet 'n paar Toegepaste Wiskunde weet wanneer n paar dinamiese stelsels in (X, hattheta) bymekaar kom, en ons moet weet hoe om te bou beraming skemas L wat konvergeer na die oorspronklike theta. Om jou wenke op so 'n wiskundige resultate te gee: Nou kan ons teruggaan na die tweede aspek van statistiese leer wat is baie interessant vir Quant handelaars / strateë: 2. Die gebruik om die doeltreffendheid van statistiese leermetodes bewys resultate kan gebruik word om die bewys doeltreffendheid van handel algoritmes. Om te sien dat dit genoeg is om weer te lees die gepaardgaande dinamiese stelsel wat dit moontlik maak om statistiese leer skryf: links M ampamp Frho (Mn, xi) ampamp L (PI (Mn), N) eindig reg. Nou M is die mark veranderlikes, rho is onderliggende PNL, L is 'n handel strategie. Net vervang minimaliseer n kriteria deur die maksimering van die PNL. Sien byvoorbeeld Optimal skeuring van bestellings oor likiditeit poele: 'n stochatic algoritme benadering deur: Gilles Pags, Sophie Laruelle, Charles-Albert Lehalle. in hierdie vraestel, skrywers wys wie om hierdie benadering te gebruik om optimaal te verdeel 'n bevel oor verskillende donker poele gelyktydig leer die vermoë van die poele om likiditeit te verskaf en die gebruik van die resultate te handel. Die statistiese leer gereedskap kan gebruik word om iteratiewe handel strategieë te bou (die meeste van hulle is iteratiewe) en bewys hul doeltreffendheid. Die kort en wrede antwoord is: jy hoef. In die eerste plek omdat ML en Statistiek is nie iets wat jy kan ook beveel in een of twee jaar. My aanbevole tyd horison niks nie-triviale leer is 10 jaar. ML nie 'n resep om geld te maak nie, maar net nog 'n manier om die werklikheid in ag te neem. Tweedens, omdat 'n goeie statistikus weet dat die begrip van die data en die probleem domein is 80 van die werk. Dis hoekom jy statistici fokus op fisika data-analise, op genomika, op sabermetrics ens Vir die rekord, Jerome Friedman, mede-skrywer van ESL hierbo aangehaal, is 'n fisikus en nog het 'n vergunning posisie by SLAC. So, studie Statistiek en Finansiële vir 'n paar jaar. Wees geduldig. Gaan jou eie pad. Kilometers kan wissel. beantwoord 9 Februarie 11 van die 04:41 Ek is dit heeltemal eens. Net omdat jy masjienleer en statistieke ken, beteken dit nie dat jy weet hoe om aansoek te doen om dit te finansier. â € Dr. Mike 10 Augustus 11 van die 20:25 ook 'n belangrike ding om te onthou is jy won39t word handel teen mense, sal jy die handel teen ander kunsmatige intelligensie algoritmes wat kyk jou ambagte stapel in, en is woedend berekening van die kans dat die kollektiewe yous sal uit bang word vir vervaardigde agteruitgang en die neem van daardie klein verlies in die skep van 'n skerp styging / daling en flous almal AI39s in stop uit, en dan rol die dip terug in dit en ry die golf, verdien jou verliese. Die aandelemark is 'n nul-som spel, hanteer dit soos begin van 'n pro boksgeveg, as jy 'n 20 jarige veteraan aren39t, you39re gaan verloor uitvoering maak Eric Leschinski 13 Februarie by 01:56 Een basiese aansoek voorspel finansiële nood. Kry 'n klomp van die data met 'n paar maatskappye wat versuim, en ander wat havent, met 'n verskeidenheid van finansiële inligting en verhoudings. Gebruik 'n masjien leer metode soos SVM om te sien of jy kan voorspel watter maatskappye sal die standaard en wat nie. Gebruik dit SVM in die toekoms te kort hoë waarskynlikheid verstek maatskappye en 'n lang lae-waarskynlikheid verstek maatskappye, met die opbrengs van die kort verkope. Daar is 'n gesegde quotPicking pennies in die voorkant van stoom rollersquot. You39re doen die ekwivalent van die verkoop van 'n out-of-the-geld. In hierdie geval, you39ll klein wins te maak vir die jaar, en kry dan heeltemal skoongemaak wanneer die mark smelt af elke 10 jaar of so. Daar is ook 'n soortgelyke strategie wat koop out-of-the-geld sit hulle geld verloor vir die jaar, maak dan 'n moord wanneer die mark smelt af. Sien Talab39s Die Black Swan. â € contango 5 Junie 11 by 22:20 Onthou dat internasionale maatskappye honderde miljarde dollar en die mens ure spandeer het op die heel beste en helderste kunsmatige intelligensie gedagtes oor die afgelope 40 jaar. I39ve gepraat om 'n paar van die torings van die gees wat verantwoordelik is vir die Alfa's oor te Citadel en Goldman Sachs, en die hubris van beginners om te dink hulle kan saam 'n algoritme wat toe tot tone sal saam met hulle, en wen sit, is byna net so dom soos 'n kind wat jy vertel he39s gaan om te spring na die maan. Sterkte kind, en kyk uit vir die ruimte martians. Nie om te sê nuwe kampioene can39t gemaak, maar die kans is teen jou. uitvoering maak Eric Leschinski 13 Februarie om 2:00 Een moontlikheid moeite werd is om die ondersteuning vektor masjien hulpmiddel gebruik op die Meta Trader 5 platform. Eerstens, as jy nie vertroud is met dit, Meta Trader 5 is 'n platform ontwikkel vir gebruikers om algoritmiese handel te implementeer in forex en CFD markte (Ek is nie seker of die platform kan uitgebrei word om aandele en ander markte). Dit is tipies gebruik word vir tegniese ontleding strategieë (bv die gebruik van aanwysers wat gebaseer is op historiese data) en word gebruik deur mense op soek na hul handel te outomatiseer. Die Support Vector Machine Learning Tool is ontwikkel deur een van die gemeenskap van die gebruikers in staat te stel ondersteuning vektor masjiene wat toegepas moet word om tegniese aanwysers en te adviseer oor ambagte. 'N gratis demo weergawe van die instrument kan hier afgelaai word as jy wil verder te ondersoek. Soos ek dit verstaan, die instrument gebruik historiese prys data om te bepaal of hipotetiese ambagte in die verlede suksesvol sou gewees het. Dit neem dan hierdie data saam met die historiese waardes van 'n aantal aanpas aanwysers (MACD, ossillators, ens), en gebruik hierdie om 'n ondersteuning vektor masjien op te lei. Dan gebruik dit die opgeleide ondersteuning vektor masjien om toekomstige koop / verkoop ambagte sein. 'N Beter Desciption kan gevind word by die skakel. Ek het rond gespeel met dit 'n bietjie met 'n paar baie interessante resultate, maar soos met alle algoritmiese handel strategieë beveel ek soliede terug / vorentoe toets voordat dit aan die lewe mark. antwoord 10 Desember 12 aan 11:59 Jammer, maar ten spyte daarvan dat as 'n gewilde voorbeeld in masjienleer, het niemand ooit 'n aandelemark voorspelling bereik. Dit werk nie vir 'n paar redes (kyk ewekansige loop deur Fama en nogal 'n bietjie van ander, rasionele besluitnemingsproses dwaling, verkeerde aannames.), Maar die mees dwingende een is dat indien dit sou werk, iemand sou kon intens ryk te word binne enkele maande, basies besit die hele wêreld. As dit nie gebeur (en jy kan seker wees al die bank het dit probeer), ons het 'n goeie getuienis, dat dit net nie werk nie. Behalwe: Hoe dink jy sal bereik wat tienduisende professionele versuim het om, met behulp van dieselfde metodes wat hulle het, plus beperkte hulpbronne en slegs basiese weergawes van hul metodes geantwoord is nie 4 Junie 15 by 07:47 Net 'n eenkant met betrekking tot jou quotmost compellingquot rede: strategieë het perke kapasiteit, dit wil sê vlakke as wat jou mark impak van die beskikbare alfa sou oorskry, selfs die veronderstelling dat jy onbeperkte kapitaal gehad. I39m nie seker wat jy bedoel met 'n quotstock mark predictionquot (indeks termynmark ETF39s), maar beslis daar is baie van die mense wat kort termyn voorspellings, en voordeel trek uit hulle elke dag in die markte. â € afekz 23 November 15 by 13:19 Ek eggo baie van wat Shane geskryf. Benewens lees ESL, sou ek raai 'n nog meer fundamentele studie van statistiek eerste. Behalwe dat die probleme wat ek uiteengesit in 'n ander vraag oor hierdie ruil is baie relevant. In die besonder, die probleem van Datamining vooroordeel is 'n ernstige padblokkade op enige masjien leer gebaseer strategy. Evaluating masjienleer klassifikasie vir finansiële handel: 'n empiriese benadering 'n ses jaar handel simulasie in USDJPY, EURGPB en EURUSD beoordeel. Periodieke heropleiding, aantal eienskappe en heropleiding stel grootte is gevarieerd en bestudeer. Midde-reeks akkuraathede verkry met 'n hoë finansiële opbrengste oor die lang termyn. Abstract Tegniese en kwantitatiewe analise in finansiële handel gebruik wiskundige en statistiese gereedskap om te help beleggers besluit oor die optimale tyd om te inisieer en naby bestellings. Terwyl hierdie tradisionele benaderings hul doel gedien het tot 'n mate, het nuwe tegnieke wat voortspruit uit die gebied van Computational intelligensie soos masjienleer en data-ontginning na vore gekom om finansiële inligting te analiseer. Terwyl die hoof finansiële ingenieurswese navorsing het gefokus op komplekse bestryk modelle soos neurale netwerke en ondersteuning Vector Machines, is daar ook eenvoudiger modelle wat hul nut in ander programme as finansiële handel het getoon, en is die moeite werd oorweging om hul voordele en inherente beperkings wanneer bepaal gebruik as handel analise-instrumente. Hierdie vraestel ontleed die rol van 'n eenvoudige masjien leermodelle om winsgewend handel te bereik deur middel van 'n reeks van handel simulasies in die forex mark. Dit beoordeel die prestasie van die modelle en hoe besonder setups van die modelle te produseer sistematiese en volgehoue ​​voorspellings vir winsgewende handel. As gevolg van die inherente kompleksiteit van finansiële tydreekse die rol van kenmerk seleksie, periodieke heropleiding en opleiding stel grootte bespreek ten einde 'n kombinasie van die parameters nie net in staat om vir die opwekking van positiewe kumulatiewe opbrengste vir elkeen van die masjien leer modelle, maar ook verkry om aan te toon hoe eenvoudige algoritmes tradisioneel verhinder finansiële vooruitskatting vir verhandeling programme bied soortgelyke optredes as hul meer komplekse eweknieë. Die artikel bespreek hoe 'n kombinasie van eienskappe benewens tegniese aanwysers wat is gebruik as insette van die masjien-leer gebaseer voorspellers soos prys verwante funksies, seisoenaliteit funksies en uitgestel waardes wat in klassieke tydreeksanalise gebruik word om die klassifikasie vermoëns te verbeter wat 'n regstreekse invloed op die finale winsgewendheid. Sleutelwoorde Trading finansiële vooruitskatting Rekenaar intelligensie Data-ontginning masjienleer FOREX markte Ooreenstemmende skrywer by: Elektroniese Departement, Pontificia Universidad Javeriana, Bogotaacute, Colombia. Tel. 5713208320 uitbr 5549.Machine Leer met algoTraderJo wow. ingeskryf waar jy die tegnologie kry om hierdie toetse en modules wat ek gebruik om my masjien leerstrategieë kode deur middel van R uitsluitlik uit te voer, maar dan dinge was 'n pyn om live hardloop as gevolg van probleme met die koppeling van R tot uitvoering platforms en APIs leef. Op die oomblik gebruik ek die ontwikkeling raamwerk wat deur Asirikuy wat jou toelaat om kode masjien leerstrategieë gebruik van Shark / Wafels in C of tot R gebruik as jy so goed wil. Jy kan dan die uitvoering van jou strategieë in verskeie platforms (Ek persoonlik hulle uit te voer met behulp van hul handelaar program wat direk gekoppel is aan site OANDA. Maar stelsels kan ook verhandel in Meta Trader keer gekodeer in hul raamwerk sonder enige behoefte om recode). Ek het gevind dat hierdie 'n baie goeie implementering, vinnig om my stelsel prototipes en idees te kry vir die masjien leer gekodeer wees. Ek produseer simulasies met behulp van hul sagteware so goed en ontleed dit deur middel van R (die beelde wat ek gepos voordat). Ek het gevind dat hierdie programme raamwerk oorspronklik deur die ouens blog, veral deur middel van hierdie post. Maar as jy wil kan jy dieselfde masjienkode leer stelsels met behulp van R maar dit raak baie ingewikkeld wanneer jy wil om akkurate toetse op verskillende forex datastelle te voer met verskillende tydsones of wanneer jy jou strategieë te verander om uitvoering te leef. Alternatiewelik kan jy ook code iets nuuts wat 'n koppelvlak Fann / Shark / Wafels met MT4 of 'n API, ek persoonlik het gevind dat dit beter is om te betaal vir 'n gemeenskap ondersteun oplossing eerder as om te gaan na dit self van nul, maar natuurlik 'n persoon wat jonger as ek of het 'n baie ekstra tyd kan kies om te gaan vir 'n heeltemal uit-kras in-huis oplossing. OP by die Forum soos 30 minute gelede, klink hy baie soos EURUSD hmmmnnn: thinkin g: Jammer om te sê ek is nie EURUSD. Ek het gelees ForexFactory vir 'n rukkie, maar uiteindelik die tyd / energie om aan te sluit en begin plaas, veral omdat ek nou 'n paar vrye tyd en wil graag idees uit te ruil met soos minded handelaars. Ek het veral oor praktiese ware handel aansoeke te min online oor masjienleer gevind, en daarom wou ek om te sien of iemand anders is besig met iets langs die lyne (en probeer om die bietjie wat ek weet aan diegene wat kan gebeur belangstel om te slaag) . Mens sou dink dat egter dit is sterk afhanklik van hoe jou reg / verkeerd antwoorde versprei. Kennis van die netto rigting van kerse wat min beweging is van weinig nut hê, terwyl verkeerd in kerse wat groot waardes is 'n slegte probleem. Dit is eintlik die rede waarom jy sal sien dat twee modelle baie soortgelyk akkuraatheid kan hê in die voorspelling van die volgende dae rigting, maar een model kan veel meer suksesvol as die ander wees. Dit is 'n rede waarom die K-NN en lineêre afbeelding modelle getoon het voordat sulke verskillende resultate. Die akkuraatheid daarvan. As die Model daaglikse kers kan voorspel dit kan ook met dieselfde konsep te voorspel weeklikse kers wat ek dink sal groter kers wees en deur die manier waarop die maandelikse een Im nie 'n programmeerder en i dont wil. maar net probeer ek om na my mening Dankie vang vir die begin van hierdie draad ek is veral geïnteresseerd in ML tegnieke, maar my kodering vaardighede is daar nie te implementeer deur myself. Het jy al enige werk met Bayesiaanse netwerke meeste van wat ek voorheen gelees het op die net gedoen (daar is nie veel ongelukkig) mense is met behulp van onvanpas ML netwerk ontwerpe vir hierdie aansoek. IMHO, belangrikste kenmerk van die suksesvolle ML netwerk is die ontwerp, hakke in die tweede plek deur die voorbereiding / aanbieding van die rou data. Wat is dit alles oor Sy alles oor geld. Hi Jo, Dankie vir die begin van hierdie draad ek is veral geïnteresseerd in ML tegnieke, maar my kodering vaardighede is daar nie te implementeer deur myself. Het jy al enige werk met Bayesiaanse netwerke meeste van wat ek voorheen gelees het op die net gedoen (daar is nie veel ongelukkig) mense is met behulp van onvanpas ML netwerk ontwerpe vir hierdie aansoek. IMHO, belangrikste kenmerk van die suksesvolle ML netwerk is die ontwerp, hakke in die tweede plek deur die voorbereiding / aanbieding van die rou data. Ja, ek het 'n paar dinge probeer met Bayesiaanse netwerke, maar ek vind dit dikwels makliker modelle beter werk (dikwels hang af van wat jy wil sowel voorspel). In my praktiese ervaring kan suksesvol ML swaar afhanklik van jou model parameters / struktuur as jou model is sensitief vir hierdie (dink SMV, neurale netwerke, ens), maar jou model kan robuuste wees om hierdie as dit is baie makliker (soos die K-NN byvoorbeeld ek gegee het). Die mees kritieke aspek wat ek gesien het is die insette / teikens gekies. Die keuse van jou insette voorbereidingstegnieke kan ook belangrik wees, maar dit kan baie minder belangrik wees as jy met behulp van klassifikasie in plaas van regressie. Sedert klassifiseerders algemeen-kategorie gebaseer insette ontvang is dit dikwels makliker om te begin in ML met behulp van klassifiseerders en dan ontwikkel tot regressie gebaseerde tegnieke. Verskillende modelle is almal verskillende wêrelde, afhangende van die model wat jy kies om 'n spesifieke voorspelling probleem wat jy sal verskillende kwessies in die gesig staar (in my ervaring) te bestudeer. Die keuse van modelle is 'n groot deel van doen ML suksesvol sowel (jy kan reeds sien dat in die lineêre kaart vs K-NN voorbeeld wat ek gegee het). Aangesluit Desember 2014 Status: Lid 383 Pos Ons kan nou ons K-NN model en poog om meer inligting te sien of dit die resultate verbeter voeg. Insette kan net so volop wees as wat jy wil en die effek van die insette bepaal kan word deur dit te vergelyk jou stelsels algehele handelsresultate. Wanneer jy insette wat irrelevant is by hulle die voorspelling van waardes harder omdat hulle net geraas of ontslag by jou voorspellings. Die volgende beeld toon 'n vergelyking van die oorspronklike stelsel wat die rigting van die afgelope 2 kerse as insette en 'n stelsel modifikasie wat die rigting van die afgelope 2 kerse plus of die RSI (10) gebruik gebruik was bo 50 (1) of onder 50 (0) vir daardie twee kerse. Die toevoeging van hierdie twee RSI insette om ons ML model maak dinge nog erger, daarom is hulle nie nuttig. Aangeheg Image (Klik om te vergroot) Mense in akademiese literatuur is geneig om voorspeller waarde te meet deur te kyk na die voorspelling doeltreffendheid (in hierdie geval of ons 'n lomp of lomp bar kan voorspel), maar in hierdie geval dit maak min sin omdat ons beswil hoofsaaklik verband hou met die verspreiding van ons voorspelling eerder as hul akkuraatheid. Daarom is ons meer belangstel in wanneer ons reg is as hoe dikwels ons is reg. Soveel op hierdie draad het gewys ons kan modelle wat die voorspelling van veranderlikes wat meer verwante met ons werklike wins doelwitte (handel uitgange) wat ons sal beweeg in nadat ons ons verkenning van die daaglikse kers rigting voorspellings (wat ek graag as voortgaan is teiken te skep 'n begin en eenvoudige oefening). Wanneer jy nuwe inligting wat bydra met voorspellende krag voeg jy eintlik kry beter resultate. Die grafiek hieronder toon jy ons K-NN toets met behulp van 2 bar rigtings as toevoer en 'n tweede toets met behulp van 18 bars as insette. As jy die toevoeging van 16 nuwe insette kan sien voeg genoeg inligting om resultate heeltemal te verbeter. Aangeheg Image (Klik om te vergroot) Dit is ook interessant om te sien hoe die verspreiding van akkuraatheid in voorspellings aansienlik verander het en ons twee stelsels te neem teenoorgestelde rigtings deur middel van verskeie dele van die simulasie. Dit beteken dat ons dalk in staat wees om 'n verbetering in die algehele resultate te verkry as ons verskillende stelle van die masjien leerstrategieë waar die verspreiding van akkuraatheid is verskillende kombineer. Aangesien beide stelsels sal na verwagting rande in voorspelling, maar albei is akkuraat op verskillende tye 'n portefeulje handel beide stelsels kan selfs beter resultate te lewer. Inderdaad, breek risiko in die helfte en doen 'n portefeulje simulasie gee die volgende resultaat: Aangeheg Image (Klik om te vergroot) Die portefeulje het inderdaad 'n gedrag wat nou tussen die twee stelsels, prestasie is gladder as vir die twee afsonderlike strategieë as die variansie tussen die twee van hulle word vergoed. O ja, kan jy probeer om op te lei om handel uitgang teikens te voorspel. En dit is iets baie interessant sowel (hierdie is 'n bietjie hoe sommige van die strategieë wat ek handel live eintlik werk). Ek sal voortgaan om die ondersoek van die saak van die daaglikse bar voorspellings 'n bietjie meer in die wêreld van die masjien leer en dan ook skuif na dinge langs hierdie lyne Ek sien uit daarna om jou uitgang teiken voorspellings .. Ek gebruik genetiese programmering. besluit bome (ewekansige bos ens) SVM en self opleiding NN. My projek is nog in ontwikkeling phase. But uit monster resultate met GP is baie encouraging. It het my n paar jaar met GP baie goeie resultate te kry (GT 85 winnig koers met 'n lae drawdown).So insette is baie important. Dont verwag om baie goeie resultate net die gebruik van RSI, MACD ens insette te kry. Daar is 'n paar baie goeie gratis open source biblioteke: scikit in Python: scikit-learn. org/stable/ lib c. dlib / mL jy sal 'n paar baie vinnige SVM ALGOS in c vind. Met betrekking tot KNN, lees ek dat hulle ly aan vloek van dimensionaliteit in 'n hoë-dimensionele data Een voorsien vol Russiese prof. stel cosinus Gelykvormigheid metode vir die vind van die naaste bure te vloek van dimensionaliteit vermy. Daar is baie hype surrending die diep leer nets. I lees dat hulle traag om op te lei en het net min uitwerking op finansiële tydreekse. My ondervinding is (net halfpad deur) ensemble metodes is die beste metodes vir finansiële tydreekse. Ek sien uit daarna om jou uitgang teiken voorspellings. Ek gebruik genetiese programmering. besluit bome (ewekansige bos ens) SVM en self opleiding NN. My projek is nog in ontwikkeling phase. But uit monster resultate met GP is baie encouraging. It het my n paar jaar met GP baie goeie resultate te kry (GT 85 winnig koers met 'n lae drawdown).So insette is baie important. Dont verwag om baie goeie resultate net die gebruik van RSI, MACD ens insette te kry. Daar is 'n paar baie goeie gratis open source biblioteke: scikit in Python: scikit-learn. org/stable/. Met betrekking tot die open source biblioteke jy voorstel, my grootste probleem met die gebruik van hulle - veral die luislang kinders - is dat gaan handel leef en doen simulasies is nie so eenvoudig. Ek het nie die tyd om te / debug my eie simulator en lewendige handel sagteware program sodat ek verkies om die dinge te Asirikuy kry, wat reeds dié probleme opgelos. Ek het by die C biblioteke om die ontwikkeling raamwerk, wat in werklikheid is 'n paar van die biblioteke ek gebruik vir SVM voorgestel. Dit is egter al 'n groot gereedskap, veral al die beskikbare Python kinders, so vir mense bou hul hele spul van nuuts af is dit beslis iets baie nuttig. Julle reg oor die K-NN en die loop van dimensionaliteit dit ly, maar dit is 'n baie goed presteer tegniek met dien verstande dat die kompleksiteit van die masjien leerprobleem jy los is beperk (soos in die hier gewys voorbeelde). mooi draad. hierdie reg is in my nek van bos. hoop jy dit nie deel te veel :-) j / k wat dink jy van die gebruik van diep leer vir finansiële voorspellings. Soos u waarskynlik gesien het, het DL na vore gekom as 'n wenner vir die meeste leerprobleme en het uit verrig pretty much elke ander metode. navorsers is reeds beweer dat DL alles sal outdate. sien daarna uit om 'n deurdagte bespreking. Diep leer blyk te duur bestryk wees vir my. Die meting van data-ontginning vooroordeel behels dikwels loop uitgebreide computational proewe met behulp van ewekansige data verkry deur Opstarten met vervanging van die oorspronklike data ten einde die waarskynlikheid te meet dat die data-ontginning algoritmes die resultate uit ewekansige kans binne 'n datastel wat nie het sal genereer verlede tot toekomstige korrelasies. Doen dit beteken dat elke deel van die proses moet herhaal word oor die ewekansige datastelle, vir 'n diep leermetodes is dit te duur is om bestryk doen (ondoenlijk vir my ten minste). Diep leermetodes maak ook moeiliker gebruik van die data, sodat hulle gebind om dieper data-ontginning vooroordeel kwessies. Ja, ek het daardie vraestel gesien. die geëis in daardie resultate is werklik indrukwekkend as haalbaar. as vir 'n diep leer, is 'n aansienlik meer belangstelling gegenereer wanneer deepmind verlede jaar demoed algemene intelligensie. sien artikel oor hierdie robohub. org/artificial-genera. eepmind-doen-dit / Dit is geen twyfel, masjienleer is op die punt van die verandering van al die soort van nywerhede. Ek dink diep netwerke sal wyd gebruik word in alle soort van plekke. die probleem acadameics te doen het met (rekenaar visie, ruimtelike bewustheid) is soveel meer kompleks dan vind patrone in finansiële data. natuurlik as genoeg handel gebeur met behulp van ML reeds dan sal dit moeilik wees om betroubare patrone te vind (maar my verbintenis is dit nie die geval is). Die koste om die hardeware te bou om diep netwerke te lei het af heelwat kom. In werklikheid in ongeveer 1000 jy CNA kry hardeware met NVIDIA GPU en doen nogal 'n baie. Ek eksperimenteer met hierdie in HFT ruimte so ons het 'n baie meer wat beslis help beheer data-ontginning. die papier Olsen gekoppel didnt gebruik regtig 'n baie data so ek dink dat al is uitvoerbaar in onder 1000 masjien. Dink. Handel. Leef geword September 2012 Status: Lid 728 Posts Invisible OP dit is 'n baie mooi en Prokureurs draad, ek nodig het om dit weer te lees, im 'n lui leser en haat lees tegniese dinge wat ek het geen begrip van maar dis om te verander. my vrae: 1.how lank het jy al die handel op hierdie manier en hoe lank is jy al suksesvol gewees, as jy suksesvol gewees het. 2. Ek was in gesprek met my vriend die ander dag, het hy vir my gesê hy is die toets van 'n strategie wat fantasticaly goed doen vanjaar afgelope 12 maande is dit 'n baie geld gemaak het, maar toe hulle geskape 'n EA om dit verder backtest back dit actualy was 'n verloor strategie, so hoe sal jy Rekening daarvoor is ek wat baie Droom te wees, maar slegs 'n paar kan bereik, im 'n deel van die 1 geword Desember 2014 Status: lid 383 Posts As ons voortgaan om ons K-NN verken algoritme en poging om die optimale hoeveelheid inligting te vind vir hierdie model vind ons dat die gebruik van 4 bars as insette gee die beste algehele resultaat (onthou dat ons altyd die herstel van die model op elke staaf met behulp van onlangse verlede voorbeelde). Die strategie het 'n baie lineêre log (balans) teenoor tyd kurwe wat praat oor die stabiliteit van die algoritme in suksesvol voorspel groter dae Vs kleiner dae. 500k van hoë frekwensie handel vanaf 2009 tot 2010. Sedert ek was heeltemal onafhanklik handel en is nie meer loop my program Irsquom gelukkig om al te vertel. My handel was meestal in Russel 2000 en DAX termynkontrakte. Die sleutel tot my sukses, glo ek, was nie in 'n gesofistikeerde finansiële vergelyking nie, maar eerder in die algehele algoritme ontwerp wat saam baie eenvoudige komponente en gebruik masjien leer wat gekoppel is aan te optimaliseer vir maksimum winsgewendheid. Jy wonrsquot nodig om enige gesofistikeerde terminologie hier weet, want toe ek die opstel van my program dit alles is gebaseer op intuïsie. (Andrew Ngrsquos ongelooflike masjien leer kursus was nog nie beskikbaar - BTW as jy op die skakel kliek yoursquoll word om my huidige projek: CourseTalk, 'n review site vir MOOCs) In die eerste plek wil ek net om te wys dat my sukses was nie net die gevolg van geluk. My program gemaak 1000-4000 ambagte per dag (half lank, half kort) en het nooit in posisies van meer as 'n paar kontrakte op 'n slag. Dit het beteken die ewekansige geluk van enige een spesifieke handel gemiddeld uit redelik vinnig. Die gevolg was ek nooit meer as 2000 verloor het in 'n dag en nog nooit 'n verlies van maand: (. EDIT Hierdie syfers is na die betaling van kommissie) En herersquos n grafiek gee jou 'n gevoel van die daaglikse variasie gee. Let op hierdie sluit die afgelope 7 maande, want - soos die figure gestop terwyl hulle opgaan - ek my motivering om hulle te gaan verloor. My handel agtergrond Voor die oprigting van my outomatiese handel program Irsquod het 2 jaar ondervinding as 'n ldquomanualrdquo dag handelaar. Dit was terug in 2001 - dit was die vroeë dae van elektroniese handel en daar geleenthede vir ldquoscalpersrdquo om goeie geld te maak. Ek kan net beskryf wat ek doen as wat verwant is aan die speel van 'n video game / dobbel met 'n veronderstelde rand. Om suksesvol te wees beteken om 'n vinnige, gedissiplineer word, en 'n goeie intuïtief patroonherkenning vermoëns. Ek was in staat om rond 250K, afbetaal my studentelenings en het geld oor. Oorwinning oor die volgende vyf jaar sal ek twee startups te loods, pluk 'n paar ontwikkeling vaardighede wat langs die pad. Dit wouldnrsquot wees tot die einde van 2008 dat ek terug in die handel sou kry. Met geld lae hardloop uit die verkoop van my eerste begin, handel aangebied hoop van 'n paar vinnige kontant terwyl ek uitgepluis het my volgende skuif. In 2008 was ek ldquomanuallyrdquo dag handel termynmark gebruik van sagteware genoem T4. Irsquod dit altyd 'n paar persoonlike orde inskrywing sleutelbordkortpaaie, so na die ontdekking van T4 'n API het, het ek op die uitdaging om C (die taal programmering nodig is om die API te gebruik) en voortgegaan en gebou myself 'n paar sleutelbordkortpaaie. Na om my voete nat met die API Ek het gou groter aspirasies: Ek wou die rekenaar te leer om handel te dryf vir my. Die API verskaf beide 'n stroom van die mark data en 'n maklike manier om bestellings by die uitruil stuur - al wat ek moes doen, was die skep van die logika in die middel. Hier is 'n kiekie van 'n T4 handel venster. Wat was cool is dat wanneer ek my program werk kon ek die rekenaar handel te kyk op hierdie presiese dieselfde koppelvlak. Kyk werklike bestellings knal in en uit (deur hulself met my regte geld) was beide opwindend en vreesaanjaend. Die ontwerp van my algoritme uit die staanspoor my doel was om te installeer 'n stelsel soos wat ek redelik vol vertroue Irsquod geld te maak voordat ooit om enige lewendige ambagte kan wees. Om dit te bereik wat ek nodig het om 'n handel simulasie raamwerk wat sou bou - so akkuraat as moontlik - simuleer lewende handel. Terwyl die handel in lewende modus vereis mark updates verwerking gestroom deur die API, simulasie af vereis lees mark updates van 'n data lêer. Om hierdie data Ek opstel in te samel die eerste weergawe van my program om net aan te sluit op die API en rekord mark updates met tyd tempel. Ek het uiteindelik met behulp van 4 weke die moeite werd om van die onlangse data mark op te lei en te toets my stelsel aan. Met 'n basiese raamwerk in plek het ek nog die taak van die uitzoeken hoe om 'n winsgewende handel stelsel te maak. As dit blyk dat sou my algoritme af te breek in twee afsonderlike komponente, wat Irsquoll verken op sy beurt: Die voorspelling van prysbewegings en die maak van winsgewende bedrywe voorspelling prysbewegings Miskien 'n duidelike komponent van enige handel stelsel is in staat om te voorspel waar pryse sal beweeg. En my vrou was geen uitsondering nie. Ek gedefinieer die huidige prys as die gemiddelde van die binnekant bod en binne aanbod en ek stel die doel van die voorspelling van waar die prys in die volgende 10 sekondes sal wees. My algoritme nodig sou wees om vorendag te kom met hierdie voorspelling oomblik-vir-oomblik dwarsdeur die handel dag. Die skep van amp optimalisering aanwysers ek het 'n handvol van die aanwysers wat bewys dat 'n betekenisvolle vermoë om korttermyn prysbewegings te voorspel het. Elke aanwyser het 'n getal wat positief of negatief was. 'N aanduiding was nuttig as meer dikwels as nie 'n positiewe getal ooreengestem met die mark gaan en 'n negatiewe getal ooreengestem met die mark afgaan. My stelsel het my toegelaat om vinnig te bepaal hoeveel voorspellende vermoë enige aanduiding gehad sodat ek in staat was om te eksperimenteer met 'n baie verskillende aanwysers om te sien wat gewerk. Baie van die aanwysers het veranderlikes in die formules wat hulle geproduseer en ek was in staat om die optimale waardes vir daardie veranderlikes te vind deur te doen langs mekaar vergelyk van bereik met wisselende waardes resultate. Die aanwysers wat baie nuttig is almal relatief eenvoudig en is gebaseer op die onlangse gebeure in die mark Ek kon die handel, sowel as die markte van gekorreleer sekuriteite. Die maak van die presiese prys skuif voorspellings Met aanwysers wat bloot voorspel 'n op of af prysbewegings wasnrsquot genoeg. Ek nodig het om te weet presies hoeveel die prys beweging is voorspel deur elke moontlike waarde van elke aanwyser. Ek benodig 'n formule wat 'n aanduiding waarde sal skakel na 'n prys voorspelling. Om dit Ek bijgehouden voorspel prysbewegings in 50 emmers wat afhanklik is van die reeks dat die aanwyser waarde het in te voer. Dit vervaardig unieke voorspellings vir elke emmer wat ek was toe in staat om grafiek in Excel. As jy die verwagte prys verandering neem toe soos die aanwyser waarde toeneem kan sien. Op grond van 'n grafiek soos hierdie Ek was in staat om 'n formule om die kurwe pas te maak. In die begin het ek dit ldquocurve fittingrdquo hand, maar ek het gou 'n paar kode om hierdie proses te outomatiseer. Let daarop dat nie al die aanwyser kurwes het dieselfde vorm. Let ook op die emmers is logaritmies versprei ten einde versprei die data wys daarop eweredig. Ten slotte daarop dat negatiewe aanwyser waardes (en hul ooreenstemmende afwaartse prys voorspellings) is omgekeer en gekombineer met die positiewe waardes. (My algoritme behandel op en af ​​presies dieselfde.) Die kombinasie van aanwysers vir 'n enkele voorspelling 'n belangrike ding om te oorweeg, is dat elke aanwyser was nie heeltemal onafhanklik. Ek couldnrsquot eenvoudig net optel al die voorspellings dat elke aanwyser individueel gemaak. Die sleutel was om uit te vind die bykomende voorspellende waarde wat elke aanwyser het as wat reeds voorspel. Dit wasnrsquot om hard te implementeer, maar dit het beteken dat as ek was ldquocurve fittingrdquo verskeie aanwysers terselfdertyd het ek versigtig die verandering van een van die voorspellings van 'n ander sou bewerkstellig word. Ten einde fitrdquo ldquocurve al die aanwysers op dieselfde tyd Ek opstel van die optimizer te stap net 30 van die pad na die nuwe voorspelling kurwes met mekaar pas. Met hierdie 30 sprong het ek gevind dat die voorspelling kurwes binne 'n paar passe sou stabiliseer. Met elke aanwyser nou gee ons itrsquos bykomende prys voorspelling kon ek net voeg dit tot 'n enkele voorspelling van waar die mark in 10 sekondes sal wees produseer. Hoekom voorspel pryse is nie genoeg Jy mag dalk dink dat hierdie voorsprong op die mark was ek goue. Maar jy moet in gedagte gehou word dat die mark bestaan ​​uit bod en bied te hou - itrsquos nie net een markprys. Sukses in 'n hoë frekwensie handel kom neer op om goeie pryse en itrsquos nie so maklik nie. Die volgende faktore maak die skep van 'n winsgewende stelsel moeilik: Met elke handel moes ek kommissies te betaal om beide my makelaar en die uitruil. Die verspreiding (verskil tussen hoogste bod en laagste aanbod) beteken dat as ek net koop en verkoop lukraak Irsquod verloor 'n ton geld. Die meeste van die volume mark was ander bots wat net 'n handel met my sou voer as hulle gedink het hulle het 'n paar statistiese rand. Aangesien 'n aanbod nie waarborg dat ek dit kan koop. Teen die tyd dat my koop orde gekry om die uitruil was dit baie moontlik dat daardie aanbod sou gewees het gekanselleer. As 'n klein speler in die mark was daar geen manier wat ek kon alleen meeding op spoed. Die bou van 'n volledige handel simulasie So ek het 'n raamwerk wat my toegelaat het om backtest en te optimaliseer aanwysers. Maar ek het om te gaan na hierdie - ek nodig om 'n raamwerk wat jou sal toelaat om my te backtest en te optimaliseer 'n volledige handel stelsel een waar ek bestellings stuur en om in posisies. In hierdie geval Irsquod word optimalisering vir totale PampL en tot 'n mate gemiddelde PampL per handel. Dit sou moeiliker en in sommige maniere onmoontlik om presies te modelleer, maar ek het so goed as wat ek kon. Hier is 'n paar van die kwessies wat ek moes hanteer: Wanneer 'n bevel in simulasie op die mark gestuur moes ek die tydsverloop te modelleer. Die feit dat my stelsel het 'n aanbod nie beteken dat dit dit kan koop dadelik. Die stelsel sal die einde stuur, wag sowat 20 millisekondes en dan slegs indien die aanbod is steeds was daar dit beskou word as 'n uitgevoer handel. Dit was onjuiste omdat die werklike tydsverloop was teenstrydig en aangemeld word nie. Toe ek bod of aanbod geplaas moes ek kyk na die uitvoering handel stroom (wat deur die API) en gebruik die om vas te stel wanneer my einde sou gekry uitgevoer teen. Om hierdie reg ek moes die posisie van my bestelling in die tou op te spoor nie. (Itrsquos n eerste-in-eerste-uit-stelsel.) Weereens, ek couldnrsquot hierdie perfek te doen, maar ek het 'n beste benadering. Om my uitvoering orde simulasie verfyn wat ek gedoen het, was om my log lêers van lewende handel deur middel van die API en vergelyk kan word om lêers wat deur gesimuleerde handel van die presiese dieselfde tydperk aanteken. Ek was in staat om my simulasie kry tot op die punt dat dit was 'n bietjie akkurate en vir die dele wat onmoontlik is om 'n model was presies gemaak ek seker dat ten minste produseer uitkomste wat statisties soortgelyke was (in die statistieke wat ek gedink het belangrik). Die maak van winsgewende handel dryf met 'n bevel simulasiemodel in plek wat ek kon nou bestellings in simulasie af te stuur en sien 'n gesimuleerde PampL. Maar hoe sou my stelsel weet wanneer en waar om te koop en te verkoop Die prys skuif voorspellings was 'n beginpunt, maar nie die hele storie. Wat ek gedoen het, was te skep 'n puntestelsel vir elk van 5 prysvlakke op die bod en aanbod. Dit sluit in 'n vlak bo die binnekant bod (vir 'n koop orde) en een vlak laer as die binnekant aanbod (vir 'n sell volgorde). As die telling op enige vlak gegewe prys bo 'n sekere drumpel dat my stelsel sou beteken moet 'n aktiewe poging / aanbod daar het was - onder die drumpel dan enige aktiewe bestellings gekanselleer moet word. Op grond van hierdie dit was nie ongewoon dat my stelsel 'n poging in die mark sal flits dan onmiddellik te kanselleer dit. (Alhoewel ek probeer om hierdie te verminder as itrsquos irriterende as klink na iemand te kyk na die skerm met menslike oë - insluitend my.) Die prys vlak tellings is bereken gegrond op die volgende faktore: Die prys skuif voorspelling (wat ons vroeër bespreek). Die prys vlak betrokke. (Inner vlakke bedoel groter prys skuif voorspellings is nodig.) Die aantal kontrakte in die voorkant van my bestelling in die tou. (Minder is beter.) Die aantal kontrakte agter my bestelling in die tou. (Meer was beter.) In wese hierdie faktore gedien om ldquosaferdquo plekke te identifiseer om te bie / aanbod. Die prys skuif voorspelling alleen was nie voldoende, want dit het nie rekening vir die feit dat wanneer die plasing van 'n poging was ek nie outomaties gevul - ek het net gevul as iemand daar vir my verkoop. Die werklikheid is dat die blote feit dat iemand verkoop om my op 'n sekere prys verander die statistiese kans van die handel. Die veranderlikes wat in hierdie stap was almal onderworpe aan optimalisering. Dit is gedoen in presies dieselfde manier as ek veranderlikes in die prys skuif aanwysers new behalwe in hierdie geval is ek optimalisering vir bottom line PampL. Wat my program geïgnoreer Wanneer die handel as mense ons dikwels kragtige emosies en vooroordele wat kan lei tot minder as optimale besluite. Dit is duidelik dat ek wou nie hierdie vooroordele te kodifiseer. Hier is 'n paar faktore my stelsel geïgnoreer: Die prys wat 'n posisie is ingevoer - In 'n handel kantoor itrsquos redelik algemeen om gesprek oor die prys waarteen iemand lang of kort asof dit hul toekomstige besluitneming moet bewerkstellig hoor. Terwyl dit het 'n paar geldigheid as deel van 'n strategie risikovermindering dit regtig geen invloed op die toekomstige verloop van die gebeure in die mark. Daarom heeltemal my program geïgnoreer hierdie inligting. Itrsquos dieselfde konsep as ignoreer gesink koste. Gaan kort teen verlaat 'n lang posisie - Tipies van 'n handelaar sou verskillende kriteria wat bepaal waar 'n lang posisie teenoor waar om kort te gaan verkoop. Maar uit my algoritmes perspektief was daar geen rede om 'n onderskeid te maak. As my algoritme verwag 'n afwaartse beweging verkoop was 'n goeie idee, ongeag of dit op die oomblik lank, kort, of plat was. A ldquodoubling uprdquo strategie - Dit is 'n algemene strategie waar handelaars meer voorraad in die geval sal koop dat daar oorspronklike handel gaan teen hulle. Dit lei tot die gemiddelde koopprys wat laer en dit beteken as (of as) die voorraad omdraai yoursquoll ingestel word om jou geld terug in geen tyd. Na my mening is dit regtig 'n verskriklike strategie tensy yoursquore Warren Buffet. Yoursquore om die bos gelei om te dink jy goed doen, want die meeste van jou ambagte sal wees wenners. Die probleem is wanneer jy verloor jou groot verloor. Die ander effek is dit maak dit moeilik om te bepaal of jy eintlik 'n voorsprong op die mark of is net om gelukkig. In staat is om te monitor en bevestig dat my program wel het 'n voorsprong was 'n belangrike doel. Sedert my algoritme gemaak besluite op dieselfde manier, ongeag van waar dit 'n bedryf aangegaan of as dit op die oomblik lank of kort dit het soms sit in (en neem) 'n paar groot verloor ambagte (bykomend tot 'n groot wen ambagte). Maar, shouldnrsquot jy dink daar wasnrsquot enige risikobestuur. Om risiko te bestuur ek afgedwing n maksimum posisie grootte van 2 kontrakte op 'n tyd, soms gestamp het in die hoogte volume dae. Ek het ook 'n maksimum daaglikse verlies limiet te beskerm teen enige onverwagse marktoestande of 'n fout in my sagteware. Hierdie beperkinge is afgedwing in my kode nie, maar ook in die agterkant deur my makelaar. As dit gebeur het ek nooit teëgekom enige noemenswaardige probleme. Die uitvoer van die algoritme Vanaf die oomblik dat ek begin werk aan my program dit het my ongeveer 6 maande voordat ek het dit tot op die punt van winsgewendheid en begin om dit te draai live. Hoewel om eerlik te wees 'n beduidende hoeveelheid tyd was om te leer 'n nuwe programmeertaal. Soos ek gewerk om die program te verbeter sien ek groter winste vir elk van die volgende vier maande. Elke week Ek sal my stelsel lei op grond van die vorige 4 weke die moeite werd om van data. Ek het gevind dat hierdie geslaan die regte balans tussen die opneem van onlangse mark gedrags - tendense en die versekering van my algoritme het genoeg data om sinvolle patrone te vestig. Soos die opleiding begin neem meer en meer tyd ek verdeel dit uit sodat dit kan uitgevoer word deur 8 virtuele masjiene met behulp van Amazon EC2. Die resultate is dan gebind op my plaaslike masjien. Die hoogtepunt van my handel was Oktober 2009 toe ek amper 100k gemaak. Hierna het voortgegaan ek na die volgende vier maande spandeer probeer om my program te verbeter ten spyte van verminderde wins elke maand. Ongelukkig hierdie punt dink ek Irsquod geïmplementeer al my beste idees omdat niks wat ek probeer het voorgekom om te veel te help. Met die frustrasie van nie in staat is om verbeteringe aan te bring en nie 'n gevoel van groei begin ek dink oor 'n nuwe rigting. Ek e-pos 6 verskillende hoë frekwensie firmas om te sien of theyrsquod belangstel in die aankoop van my sagteware en die verhuring van my werk vir hulle te wees. Niemand het geantwoord. Ek het 'n paar nuwe begin idees wat ek wou om te werk, sodat ek nooit opgevolg. UPDATE - ek gepos hierdie op Hacker Nuus en dit het 'n baie aandag gekry. Ek wil net sê dat ek nie iemand probeer om iets self nou doen soos hierdie advokaat. Jy sal 'n span van baie slim mense nodig het met 'n verskeidenheid van ervarings om enige hoop van mededingende het. Selfs wanneer ek dit doen Ek glo dit was baie skaars vir individue om sukses te behaal (al het ek gehoor het van ander.) Daar is 'n kommentaar aan die bokant van die bladsy wat gemanipuleerde statistieke noem en verwys na my as 'n ldquoretail investorrdquo dat kwantitatiewe sou ldquogleefully haal offrdquo. Dit is 'n nogal jammer kommentaar thatrsquos eenvoudig nie gebaseer in die werklikheid. Die opstel wat opsy therersquos 'n paar interessante opmerkings: news. ycombinator / itemid4748624 UPDATE 2 - Irsquove gepos word 'n opvolg vrae wat 'n paar algemene vrae Irsquove ontvang van handelaars oor hierdie post beantwoord.


No comments:

Post a Comment