Io non sono molto sicuro, se questa domanda si inserisce qui. Recentemente ho iniziato, leggere e conoscere apprendimento automatico. Qualcuno può gettare un po 'di luce su come andare su di esso, o meglio tutti possono condividere la loro esperienza e alcune indicazioni di base su come andare su di esso o almeno cominciare ad applicarlo a vedere alcuni risultati di serie di dati come ambizioso funziona questo suono Inoltre, menzionare di algoritmi standard che dovrebbe essere giudicato o consultato la pagina mentre si fa questo. chiesto 1 febbraio 11 alle 18:35 Sembra che ci sia un errore di base che qualcuno possa venire avanti e imparare un po 'di apprendimento automatico o algoritmi di intelligenza artificiale, configurarli come una scatola nera, ha colpito andare, e si deve aspettare che vanno in pensione. Il mio consiglio per voi: Learn statistiche e di apprendimento automatico, poi preoccuparsi di come applicarli ad un dato problema. Non c'è il pranzo libero qui. L'analisi dei dati è un lavoro duro. Leggi The Elements of Learning statistica (il pdf è disponibile gratuitamente sul sito web), E non iniziare a provare a costruire un modello fino a comprendere almeno i primi 8 capitoli. Una volta capito le statistiche e l'apprendimento automatico, allora avete bisogno di imparare di backtest e costruire un modello di trading, che rappresentano i costi di transazione, ecc, che è tutta un'altra zona. Dopo aver ottenuto una maniglia sia l'analisi e la finanza, allora sarà un po 'ovvio come applicarla. L'intero punto di questi algoritmi sta cercando di trovare un modo per adattarsi a un modello per i dati e produrre bassa distorsione e varianza nella previsione (vale a dire che la formazione e l'errore di previsione di prova sarà basso e simili). Ecco un esempio di un sistema commerciale utilizzando una macchina di supporto vettore in R., ma basta tenere a mente che sarete voi stessi facendo un disservizio enorme se non trascorrere il tempo per capire le basi prima di tentare di applicare qualcosa di esoterico. Giusto per aggiungere un aggiornamento divertente: di recente mi sono imbattuto in questo Masters tesi: A Novel Algorithmic Trading quadro Applicando Evoluzione e apprendimento automatico per l'ottimizzazione del portafoglio (2012). La sua una vasta rassegna di machine learning diversi approcci confrontato con buy-and-hold. Dopo quasi 200 pagine, raggiungono la conclusione di base: Nessun sistema di trading è stato in grado di superare il punto di riferimento quando si utilizzano i costi di transazione. Inutile dire che questo non significa che cant essere fatto (io ho mai passato del tempo rivedendo i loro metodi per vedere la validità del metodo), ma fornisce sicuramente un po 'di prove a favore del pranzo teorema di no-libera. ha risposto 1 febbraio 11 alle 18:48 Jase Come uno della tesi master39s citato posso citare il mio lavoro e gli autori dicono: quotIf chiunque raggiunge effettivamente risultati proficui non vi è alcun incentivo per condividere, in quanto sarebbe negare la loro advantage. quot Anche se i nostri risultati potrebbero dare sostegno alla ipotesi di mercato si doesn39t esclude l'esistenza di sistemi che funzionano. Potrebbe essere come teoria della probabilità: quotIt è ipotizzato che le innovazioni nel campo della teoria della probabilità è accaduto diverse volte, ma mai condiviso. Questo potrebbe essere dovuto alla sua applicazione pratica in gambling. quot Poi di nuovo, forse questo è tutto moderno l'alchimia. ndash Andr233 Christoffer Andersen 30 Apr 13 ad 10:01 Il mio consiglio per voi: Ci sono diversi rami della macchina LearningArtificial Intelligence (MLAI) là fuori: www-formal. stanford. edujmcwhatisainode2.html ho provato solo la programmazione genetica e alcune reti neurali, e personalmente ritengo che l'apprendimento dall'esperienza ramo sembra avere le maggiori potenzialità. GPGA e reti neurali sembrano essere le metodologie più comunemente esplorati ai fini delle previsioni del mercato azionario, ma se si fa un po 'di data mining su Prevedere Wall Street. si potrebbe essere in grado di fare qualche analisi sentimento troppo. Passa un po 'di tempo conoscere le varie tecniche MLAI, trovare alcuni dati di mercato e cercare di implementare alcuni di questi algoritmi. Ognuno avrà i suoi punti di forza e di debolezza, ma si può essere in grado di combinare le previsioni di ogni algoritmo in una previsione composito (simile a quello che i vincitori del Premio NetFlix fatto). Alcune risorse: Ecco alcune risorse che si potrebbe desiderare di esaminare: le chiacchiere: Il consenso generale tra i commercianti è che l'intelligenza artificiale è una scienza voodoo, non puoi rendere un computer predire i prezzi delle azioni e sei sicuro di perdere i vostri soldi se si tenta facendolo. Tuttavia, le stesse persone vi diranno che praticamente l'unico modo per fare soldi sul mercato azionario è quello di costruire e migliorare la propria strategia di trading e seguire da vicino (che non è in realtà una cattiva idea). L'idea di algoritmi di intelligenza artificiale, non è quello di costruire chip e fargli commercio per voi, ma per automatizzare il processo di creazione di strategie. Il suo un processo molto noioso e in nessun modo è facile :). Minimizzare overfitting: Come weve sentito prima, una questione fondamentale con algoritmi di intelligenza artificiale è sovradattamento (bias aka datamining): dato un insieme di dati, l'algoritmo AI può trovare un modello che è particolarmente rilevante per il training set. ma non può essere rilevante nel set di test. Ci sono diversi modi per ridurre al minimo sovradattamento: utilizzare un set di validazione. doesnt dare un feedback per l'algoritmo, ma consente di rilevare quando il vostro algoritmo è potenzialmente cominciando a OVERFIT (cioè si può smettere di formazione se sei overfitting troppo). Utilizzare machine learning on-line. elimina in gran parte la necessità di back-testing ed è molto applicabile per gli algoritmi che tentano di fare previsioni di mercato. Learning Ensemble. vi offre un modo per prendere più algoritmi di apprendimento automatico e combinare le loro previsioni. Il presupposto è che i vari algoritmi possono avere sovradattamento i dati in una certa zona, ma la corretta combinazione di loro previsioni avrà una migliore capacità predittiva. Due aspetti dell'apprendimento statistico sono utili per la negoziazione 1. In primo luogo quelli menzionati in precedenza: alcuni metodi statistici incentrati a lavorare sul set di dati in tempo reale. Ciò significa che si sa che si sta osservando solo un campione di dati e si desidera estrapolare. È in tal modo a che fare con in campioni e fuori dei problemi di esempio, overfitting e così via. Da questo punto di vista, data-mining è più focalizzato sul set di dati morti (per esempio, si può vedere quasi tutti i dati, si dispone di un campione in unico problema) di apprendimento statistico. Perché apprendimento statistico è di lavorare su set di dati dal vivo, la matematica applicata che si occupano di loro hanno dovuto concentrarsi su un problema due scale: a sinistra X ampamp Ftheta (Xn, xi) ampamp L (pi (Xn), n) terminare a destra. dove X è il (multidimensionale) spazio degli stati per lo studio (si dispone in esso le variabili esplicative e quelli per prevedere), F contiene le dinamiche di X che hanno bisogno di alcuni parametri theta. La casualità di X viene dal XI innovazione, che è i. i.d. L'obiettivo di apprendimento statistico è quello di costruire una metodologia di L-esimo come input un PI di osservazione parziale di X e regolare progressivamente uno hattheta stima di theta, in modo che possiamo sapere tutto quello che serve a X. Se si pensa di usare l'apprendimento statistico per trovare i parametri di una regressione lineare. siamo in grado di modellare lo spazio degli stati in questo modo: underbrace YX estremità destra) ha lasciato iniziare un amplificatore b amp 1 1 amp 0 amp 0 estremità destra cdot underbrace x 1 fine epsilon destra) che consente quindi di osservare (y, x) n in qualsiasi n qui theta (a, b). Quindi è necessario trovare un modo per costruire progressivamente uno stimatore di theta utilizzando le nostre osservazioni. Perché non una discesa pendenza sulla distanza L2 tra la Y e la regressione: C (cappello una, cappello b) n sum (YK - (cappello a, xk cappello b)) 2 Qui gamma è un sistema di ponderazione. Di solito un bel modo per costruire uno stimatore è quello di scrivere correttamente i criteri per ridurre al minimo e attuare una discesa del gradiente che produrrà il regime di apprendimento L. Tornando al nostro problema generica originale. abbiamo bisogno di qualche matematica applicata a sapere quando paio di sistemi dinamici di (X, hattheta) convergono, e abbiamo bisogno di sapere come costruire la stima schemi L che convergono verso il theta originale. Per darvi indicazioni su tali risultati matematici: Ora possiamo tornare al secondo aspetto dell'apprendimento statistico che è molto interessante per tradersstrategists quant: 2. I risultati utilizzati per dimostrare l'efficacia dei metodi di apprendimento statistici possono essere utilizzati per dimostrare l'efficienza della algoritmi di negoziazione. Per vedere che è sufficiente rileggere il sistema dinamico accoppiato che permette di scrivere apprendimento statistico: sinistra M ampamp Frho (Mn, xi) ampamp L (pi (Mn), n) terminare a destra. Ora M sono variabili di mercato, rho è sotteso PnL, L è una strategia di trading. Basta sostituire minimizzando un criterio massimizzando PNL. Si veda ad esempio ottimale scissione degli ordini attraverso pool di liquidità: un approccio algoritmo stochatic da: Gilles Pags, Sophie Laruelle, Charles-Albert Lehalle. in questo articolo, gli autori mostrano che utilizzare questo approccio per dividere in maniera ottimale un ordine tra le varie dark pool contemporaneamente imparare la capacità delle piscine per fornire liquidità e utilizzare i risultati per il commercio. Gli strumenti di apprendimento statistici possono essere utilizzati per costruire strategie di trading iterativi (la maggior parte di loro sono iterativo) e dimostrare la loro efficienza. La risposta breve e brutale è: voi non. In primo luogo, perché ML e statistiche non è qualcosa che si può comandare bene in uno o due anni. Il mio orizzonte temporale consigliato di imparare qualcosa di non banale è di 10 anni. Non ML una ricetta per fare soldi, ma solo un altro mezzo per osservare la realtà. In secondo luogo, perché ogni buon statistica sa che la comprensione dei dati e il dominio del problema è 80 del lavoro. Ecco perché avete statistici incentrati sull'analisi dei dati Fisica, sulla genomica, sul Sabermetrica ecc per la cronaca, Jerome Friedman, co-autore di ESL citato sopra, è un fisico e detiene ancora una posizione di cortesia a SLAC. Quindi, lo studio Statistica e delle Finanze per alcuni anni. Essere pazientare. Seguire la propria strada. Situazione potrebbe essere diversa. rispose 9 febbraio 11 alle 04:41 Sono assolutamente d'accordo. Solo perché si sa apprendimento e statistiche macchina, non implica che si sa come applicarla a finanziare. ndash Dr. Mike 10 agosto 11 alle 20:25 anche una cosa importante da ricordare è che si won39t essere negoziazione contro le persone, si sarà in negoziazione nei confronti di altri algoritmi di intelligenza artificiale che stanno guardando i tuoi scambi si accumulano in, e sono furiosamente calcolare le probabilità che il collettiva yous sarebbe spaventata da un declino fabbricati e prendendo che la perdita minore nella creazione di un spikedip e ingannare tutti quei AI39s in arresto, e poi a rotazione il tuffo indietro in esso e cavalcare l'onda, guadagnando le perdite. Il mercato azionario è un gioco a somma zero, trattarla come entrare in un incontro di boxe pro, se si aren39t un veterano 20 anni, you39re andando a perdere ndash Eric Leschinski 13 febbraio 16 a 1:56 One domanda di base è la previsione difficoltà finanziarie. Prendi un gruppo di dati con alcune aziende che sono inadempienti, e altri che havent, con una varietà di informazioni finanziarie e rapporti. Utilizzare un metodo di apprendimento automatico, come SVM per vedere se è possibile prevedere che le aziende di default e quali no. Utilizzare che SVM in futuro per brevi aziende predefiniti alta probabilità e lunghe aziende di default a bassa probabilità, con il ricavato delle vendite allo scoperto. C'è un detto centesimi quotPicking di fronte rollersquot vapore. You39re fare l'equivalente di vendere un out-of-the-money messo. In questo caso, you39ll fare piccoli profitti per anni, quindi ottenere totalmente ripulito quando il mercato si scioglie ogni 10 anni o giù di lì. Vi è anche una strategia equivalente che acquista out-of-the-money mette: perdono i soldi per anni, poi fare una strage quando il mercato si scioglie. Vedere Talab39s The Black Swan. ndash Contango 5 giugno 11 alle 22:20 Ricordate che le aziende internazionali hanno speso centinaia di miliardi di dollari e di ore di lavoro sulle migliori e più brillanti menti artificiali di intelligenza nel corso degli ultimi 40 anni. I39ve parlato con alcune delle torri della mente responsabile per le alfa oltre a Cittadella e Goldman Sachs, e l'arroganza dai principianti a pensare di poter mettere insieme un algoritmo che andrà in punta di piedi con loro, e vincere, è quasi altrettanto stupido come un bambino che ti dice he39s intenzione di saltare sulla luna. Buona fortuna ragazzo, e guardare fuori per i marziani spazio. Per non dire nuovi campioni can39t essere fatte, ma le probabilità sono contro di voi. ndash Eric Leschinski 13 febbraio 16 alle 2:00 Una possibilità da esplorare è quella di utilizzare lo strumento di apprendimento automatico supporto vettore sulla piattaforma Metatrader 5. In primo luogo, se non sei familiarità con essa, Metatrader 5 è una piattaforma sviluppata per gli utenti di implementare trading algoritmico nei mercati CFD (Im non sicuro se la piattaforma può essere esteso ad azioni e altri mercati) forex e. Viene in genere utilizzato per strategie basate analisi tecnica (cioè utilizzando indicatori basati su dati storici) ed è utilizzato da persone che cercano di automatizzare il loro commercio. Il Support Vector Machine strumento di apprendimento è stato sviluppato da una delle comunità di utenti per consentire support vector machines da applicare a indicatori tecnici e consigliano sui commerci. Una versione demo gratuita del tool può essere scaricato qui se si vuole approfondire. A quanto mi risulta, lo strumento utilizza dati sui prezzi storici per valutare se ipotetici mestieri del passato, avrebbero avuto successo. Ci vuole allora questo dati con i valori storici da un certo numero di indicatori personalizzabili (MACD, oscillatori, ecc), e la utilizza per formare una macchina di supporto vettore. Poi si utilizza la macchina vettore supporto qualificato per segnalare futuri commerci buysell. Un desciption migliore può essere trovato al collegamento. Ho giocato intorno con esso un po 'con alcuni risultati molto interessanti, ma come per tutte le strategie di trading algoritmico vi consiglio test backforward solido, mette sul mercato dal vivo. risposto 10 dicembre 12 alle 11:59 Ci dispiace, ma nonostante sia usato come un esempio popolare di apprendimento automatico, nessuno ha mai raggiunto una previsione del mercato azionario. Non funziona per diversi motivi (controllo random walk da Fama e un po 'di altri, il processo decisionale fallacia razionale, presupposti errati.), Ma il più interessante è che se avrebbe funzionato, qualcuno sarebbe in grado di diventare follemente ricchi in pochi mesi, fondamentalmente possedere tutto il mondo. Dato che questo non sta accadendo (e si può essere sicuri tutta la banca hanno provato), abbiamo una buona prova, che semplicemente non funziona. Inoltre: Come pensi che si otterrà ciò che decine di migliaia di professionisti non sono riusciti a, utilizzando gli stessi metodi che hanno, oltre a risorse limitate e solo le versioni di base dei loro metodi risposta 4 giugno 15 a 7:47 Solo una parte per quanto riguarda il quotmost compellingquot ragione: le strategie hanno limiti di capacità, ossia i livelli oltre i quali l'impatto di mercato sia superiore alla alpha disponibile, anche supponendo che un capitale illimitato. I39m non sicuro di cosa si intende per un predictionquot mercato quotstock (futures su indici ETF39s), ma certamente ci sono un sacco di persone che fanno previsioni a breve termine, e beneficiando di loro, ogni giorno nei mercati. ndash afekz 23 15 novembre alle 13:19 mi associo molto di ciò che Shane ha scritto. Oltre a leggere ESL, vorrei suggerire uno studio ancora più fondamentale delle statistiche prima. Oltre a ciò, i problemi che ho descritto in a un'altra domanda su questo scambio sono molto importanti. In particolare, il problema della polarizzazione datamining è un serio ostacolo a qualsiasi macchina-apprendimento basato strategy. Machine apprendimento con algoTraderJo Registrato Dicembre 2014 Status: Utente 383 Messaggi Ciao colleghi commercianti, sto iniziando questa discussione nella speranza di condividere con voi alcune delle mie sviluppi nel campo dell'apprendimento macchina. Anche se io non posso condividere con voi i sistemi esatte o implementazioni di codifica (non aspettatevi di ottenere qualcosa da quotplug-e-playquot e arricchirsi da questa discussione) voglio condividere con voi le idee, i risultati del mio esperimento e, eventualmente, altri aspetti del mio lavoro. Sto iniziando questa discussione nella speranza che saremo in grado di condividere idee e aiutare a vicenda a migliorare i nostri implementazioni. Inizierò con alcune semplici strategie di apprendimento della macchina e che poi andare in cose più complesse col passare del tempo. Auguriamo che la corsa di iscrizione Dic 2014 Status: Utente 383 Messaggi voglio iniziare dicendo alcune cose di base. Mi dispiace se la struttura dei miei post lascia molto a desiderare, non ho alcuna esperienza forum distacco, ma la speranza di ottenere qualche tempo. In machine learning quello che vogliamo fare è semplicemente quello di generare una previsione che è utile per il nostro commercio. Per fare questa previsione si genera un modello statistico utilizzando una serie di esempi (uscite noti e alcuni input che le cose devono potere predittivo di prevedere quelle uscite) abbiamo poi fare una previsione di un'uscita sconosciuta (nostri dati recenti) utilizzando il modello che abbiamo creato con gli esempi. Per riassumere si tratta di un processo quotsimplequot dove effettuare le seguenti operazioni: selezionare quello che vogliamo prevedere (questo sarà il nostro obiettivo (s)) Selezionare alcune variabili di input che riteniamo in grado di prevedere i nostri obiettivi di costruire una serie di esempi utilizzando i dati passato con i nostri input e gli obiettivi di creare un modello utilizzando questi esempi. Un modello è semplicemente un meccanismo matematico che mette in relazione le inputstargets fare una previsione della destinazione utilizzando l'ultima ingressi noti commerciale di utilizzare queste informazioni che voglio dire fin dall'inizio che è molto importante per evitare di fare quello che molti documenti accademici su machine learning fanno, che è quello di tentare di costruire un modello con molto grandi array di esempi e quindi tentare di fare una previsione a lungo termine su un insieme quotout-di-samplequot. Costruire un modello con 10 anni di dati e poi testarlo l'ultimo due è non-senso, soggetta a molti tipi di pregiudizi statistici parleremo più avanti. In generale, si vedrà che i modelli di apprendimento automatico che costruisco sono addestrati su ogni bar (o ogni volta che ho bisogno di prendere una decisione) utilizzando una finestra mobile di dati per la costruzione di esempi (solo esempi recenti sono considerati rilevanti). Certo, questo approccio non è estranea ad alcuni tipi di bias statistici ma rimuovere il quotelephant nel roomquot quando si utilizza l'approccio ampio in-sampleout-di-campione della maggior parte dei documenti accademici (che, non è una sorpresa, porta spesso ad approcci che non sono effettivamente utile al commercio). Ci sono principalmente tre cose da preoccuparti di quando la costruzione di un modello di apprendimento macchina: Cosa prevedere (quello di destinazione) Cosa predire con (quali ingressi) Come mettere in relazione il bersaglio e gli ingressi (che modello) La maggior parte di quello che sarà citano in questa discussione si concentrerà su rispondere a queste domande, con esempi concreti. Se si desidera scrivere tutte le domande che potreste avere e cercherò di darvi una risposta o semplicemente sapere se io risponderò che in seguito. Iscritto il dicembre 2014 Status: Utente 383 Messaggi Cerchiamo di metterci al lavoro ora. Un vero e proprio esempio pratico con l'apprendimento automatico. Consente supponiamo di voler costruire un modello molto semplice utilizzando un semplice insieme di inputstargets. Per questo esperimento queste sono le risposte alle domande: Che cosa da prevedere (quello di destinazione) - gt La direzione del giorno successivo (rialzista o ribassista) Cosa predire con (quali ingressi) - gt La direzione dei precedenti 2 giorni Come mettere in relazione l'obiettivo e ingressi (che modello) - gt Una mappa classificatore lineare Questo modello tenterà di prevedere la direzionalità della prossima barra quotidiana. Per costruire il nostro modello prendiamo gli ultimi 200 esemplari (una direzione giorni come bersaglio e le precedenti due direzioni giorno come input) e formiamo un classificatore lineare. Facciamo questo all'inizio di ogni barra quotidiana. Se abbiamo un esempio in cui due giorni di rialzo portano ad una giornata ribassista ingressi sarebbero 1,1 e l'obiettivo sarebbe 0 (0bearish, 1bullish), usiamo 200 di questi esempi per addestrare il modello su ogni barra. Speriamo di essere in grado di costruire un rapporto in cui la direzione di due giorni dà una certa probabilità di sopra-random di prevedere correttamente la direzione di giorni. Usiamo un stoploss pari al 50 del periodo di 20 giorni Average True Range su ogni commercio. Immagine allegata (clicca per ingrandire) Una simulazione di questa tecnica 1988-2014 sul EURUSD (dati prima del 1999 è DEMUSD) di cui sopra dimostra che il modello non ha alcuna generazione di profitto stabile. In realtà questo modello segue un random walk prevenuto negativamente, il che fa perdere denaro in funzione della diffusione (3 pips nella mia sim). Guardate le prestazioni apparentemente quotimpressivequot che abbiamo in 1993-1995 e nel periodo 2003-2005, dove a quanto pare si potrebbe prevedere con successo i prossimi giorni direzionalità utilizzando un modello lineare semplice e gli ultimi due risultati giorno direzionali. Questo esempio mostra diverse cose importanti. Ad esempio, che attraverso brevi tempi (che potrebbe essere un paio di anni) si può essere facilmente ingannare da casualità --- si può pensare di avere qualcosa che funziona, che non fa davvero. Si ricorda che il modello è ricostruito in ogni bar, utilizzando gli ultimi 200 esempi inputtarget. Quali altre cose pensi che si può imparare da questo esempio la tua opinione Bene. quindi è previsto che gli acquirenti o venditori avrebbero intervenire Hmm, ma che cosa esattamente si ha a che fare con il prezzo che va verso l'alto o verso il basso 100 pips prezzo può reagire in vari modi -. Potrebbe essere solo serbatoio per un certo tempo (mentre tutti gli ordini limite sono riempiti) e poi continuare a muoversi ulteriormente. Può anche ripercorrere 5, 10, 50 o anche 99 pip. In tutti questi casi si erano un po ragione su acquirenti o venditori passo-passo, ma si deve capire che questa analisi doesnt hanno molto a che fare con il commercio che va da 90pip a 100pip. Sì, hai ragione questa è una grande parte del motivo per cui stiamo ottenendo risultati scadenti quando si utilizza l'algoritmo di mappatura lineare. Perché la nostra redditività è scarsamente correlato con la nostra previsione. La previsione che i giorni sono bullishbearish è di uso limitato se non sai quanta prezzo si muoverà. Forse le tue previsioni sono corrette solo nei giorni che ti danno 10 pips e si ottengono tutti i giorni che hanno 100 pip direzionalità totalmente sbagliato. Cosa vorresti prendere in considerazione un obiettivo migliore per un metodo di apprendimento automatico Sì, hai ragione questa è una grande parte del motivo per cui stiamo ottenendo risultati scadenti quando si utilizza l'algoritmo di mappatura lineare. Perché la nostra redditività è scarsamente correlato con la nostra previsione. La previsione che i giorni sono bullishbearish è di uso limitato se non sai quanta prezzo si muoverà. Forse le tue previsioni sono corrette solo nei giorni che ti danno 10 pips e si ottengono tutti i giorni che hanno 100 pip direzionalità totalmente sbagliato. Cosa vorresti prendere in considerazione un obiettivo migliore per un metodo di apprendimento automatico consente di dire se si dispone di 100 pip TP e SL, vorrei prevedere che viene prima: TP o SL Esempio: TP è venuto prima 1 SL è venuto prima 0 (o -1, tuttavia lo mappate) machine Learning in Forex Trading: perché molti studiosi stanno facendo tutte le strategie di apprendimento della macchina di costruzione sbagliati che possono ottenere risultati decenti in condizioni di mercato dal vivo è sempre stata una sfida importante nel trading algoritmico. Nonostante la grande quantità di interesse e le incredibili profitti potenziali, non ci sono ancora le pubblicazioni accademiche che sono in grado di mostrare buoni modelli di apprendimento macchina in grado di affrontare con successo il problema di trading nel mercato reale (al meglio delle mie conoscenze, pubblicare un commento se avete uno e I8217ll essere più che felice di leggerlo). Anche se molti lavori pubblicati non sembrano mostrare risultati promettenti, è spesso il caso che questi documenti rientrano in una varietà di diversi problemi di bias statistici che rendono il vero successo di mercato delle loro strategie di apprendimento della macchina altamente improbabili. Sul posto today8217s ho intenzione di parlare dei problemi che vedo nella ricerca accademica in relazione con apprendimento automatico sul Forex e come credo che questa ricerca potrebbe essere migliorata per produrre molto più utili informazioni sia per le comunità accademiche e commerciali. La maggior parte delle insidie in macchina Learning Design strategia quando si fa trading Forex sono inevitabilmente ereditate dal mondo di problemi di apprendimento deterministici. Quando si costruisce un algoritmo di apprendimento automatico per qualcosa come il riconoscimento del volto o il riconoscimento lettera vi è un problema ben definito che non cambia, che è generalmente affrontato con la costruzione di un modello di apprendimento macchina su un sottoinsieme di dati (un training set) e poi testare se il modello era in grado di risolvere correttamente il problema utilizzando il promemoria dei dati (una serie di test). Questo è il motivo per cui si dispone di alcuni insiemi di dati noti e consolidati che possono essere utilizzate per stabilire la qualità delle tecniche di apprendimento automatico di nuova concezione. Il punto chiave qui però, è che i problemi affrontati da inizialmente apprendimento automatico erano per lo più deterministica e indipendente dal tempo. Quando si sposta in commercio, l'applicazione di questa stessa filosofia produce molti problemi legati sia con il carattere parzialmente non deterministica del mercato e la sua dipendenza dal tempo. Il semplice atto di tentare di selezionare formazione e test set introduce una quantità significativa di polarizzazione (bias di selezione di dati) che crea un problema. Se la selezione viene ripetuta per migliorare i risultati del test impostati 8211 che è necessario assumere avviene, almeno in alcuni casi 8211 allora il problema si aggiunge anche una grande quantità di pregiudizi data-mining. L'intera questione di fare un singolo esercizio trainingvalidation genera anche un problema di pertinenza come questo algoritmo deve essere applicato negoziazione sotto tensione. Per definizione il trading dal vivo sarà diversa in quanto la selezione di set trainingtesting deve essere riapplicato a dati diversi (come ora il set di test sono dati veramente sconosciuto). La polarizzazione inerente alla iniziale-sampleout-di-campione di selezione e la mancanza di regole collaudate per la negoziazione in Dati sconosciuto rende tali tecniche a fallire comunemente in trading dal vivo. Se un algoritmo è allenato con i dati 2000-2012 ed è stato croce validato con i dati 2012-2015 non vi è alcuna ragione di credere che lo stesso successo accadrà se addestrato nei dati 2003-2015 e poi vivere scambiato 2015-2017, i set di dati sono di natura molto diversa. Misurare successo algoritmo è anche un problema molto rilevante qui. Inevitabilmente la macchina algoritmi utilizzati per lo scambio di apprendimento dovrebbe essere misurata in merito per la loro capacità di generare rendimenti positivi, ma un po 'di letteratura misura il merito di nuove tecniche algoritmiche tentando di misurare la propria capacità di ottenere previsioni corrette. previsioni corrette non necessariamente uguale redditizio commercio, come si può facilmente vedere quando si costruisce classificatori binari. Se si tenta di prevedere la prossima direzione candle8217s è ancora possibile effettuare una perdita se si è per lo più a destra su piccole candele e sbagliato sulle candele più grandi. È un dato di fatto più di questo tipo di classificatori 8211 maggior parte di coloro che don8217t lavoro 8211 finiscono predire direzionalità con sopra 50 di precisione, ma non al di sopra del livello necessario per superare commissioni che permetterebbero redditizio trading di opzioni binarie. Per costruire strategie che sono per lo più liberarsi dei problemi di cui sopra ho sempre sostenuto per una metodologia in cui l'algoritmo di apprendimento automatico viene riqualificato prima della realizzazione di qualsiasi decisione di formazione. Utilizzando una finestra mobile per la formazione e non fare più di una decisione senza riqualificazione dell'intero algoritmo possiamo eliminare il bias di selezione che è insito nella scelta di un unico insieme in-sampleout-di-campione. In questo modo l'intero test è una serie di esercizi trainingvalidation che finiscono garantire che l'algoritmo di apprendimento automatico funziona anche sotto tremendamente diversi set di dati di addestramento. Sono favorevole anche per la misurazione della performance backtesting reale per misurare il merito di machine learning algorithm8217s e, inoltre, mi spingerei a dire che nessun algoritmo può valere il suo sale senza essere provata in vera out-of-sample condizioni. Lo sviluppo di algoritmi in questo modo è molto più difficile e ho haven8217t trovato un singolo documento accademico che segue questo tipo di approccio (se ho perso tatto per postare un link in modo che possa includere un commento). Questo non significa che questa metodologia è completamente senza problemi tuttavia, è ancora soggetto ai problemi classici relativi a tutti gli esercizi di costruzione strategia, tra pregiudizi curva-montaggio e pregiudizi data-mining. Questo è il motivo per cui è importante utilizzare una grande quantità di dati (io uso 25 anni per testare i sistemi, sempre riqualificazione dopo ogni decisione derivato machine learning) e di effettuare adeguati test di valutazione pregiudizi di data mining per determinare la sicurezza con cui possiamo dicono che i risultati non vengono da casualità. Il mio amico AlgoTraderJo 8211, che avviene anche per essere un membro della mia comunità commerciale 8211 è attualmente in crescita a un filo ForexFactory seguendo questo stesso tipo di filosofia per lo sviluppo di apprendimento automatico, mentre lavoriamo su alcuni nuovi algoritmi di apprendimento automatico per la mia comunità di trading. È possibile fare riferimento al suo filo o messaggi passati sul mio blog per diversi esempi di algoritmi di apprendimento automatico sviluppati in questo modo. Se volete saperne di più sui nostri sviluppi nel machine learning e come anche voi potete anche sviluppare le proprie strategie di apprendimento macchina utilizzando il framework F4 perche non unirsi Asirikuy. un sito web pieno di video educativi, sistemi di trading, sviluppo e un approccio solido, onesto e trasparente verso il trading automatico.
No comments:
Post a Comment