Big data e Data Mining applicati alla strategia di Trend Following
Ultimamente si sente parlare con sempre maggior insistenza di Big Data e Data Mining, anche in relazione al Trend following.
Cosa si intende con il termine Big Data?
Per Big-Data si intendono grandi quantità di dati elaborati per acquisire conoscenza attraverso strumenti non convenzionali.
Sono molte le aziende, dal settore biomedico a quello digitale, che nelle loro attività imprenditoriali sfruttano questi sistemi al fine di estrapolare conoscenza da grandi set di dati. Questo processo viene generalmente definito Business Intelligence.
Vuoi rimanere aggiornato sugli articoli del blog e sui nostri approfondimenti?
Come scritto nell’articolo “Overfitting, il lato oscuro dei modelli quantitativi”, 4Timing SIM in questi ultimi anni di ricerca ha implementato un processo di generazione di modelli quantitativi che sfrutta i più recenti sviluppi nell’ambito del Data Mining.
Si tratta di algoritmi (più raffinati dell’ escavatrice!) che, sfruttando le capacità computazionali dei calcolatori, permettono di estrarre conoscenza dai dati.
Wikipedia ne riporta una chiara definizione:
- Estrazione, con tecniche analitiche all’avanguardia, di informazione implicita, nascosta, da dati già strutturati, per renderla disponibile e direttamente utilizzabile;
- Esplorazione ed analisi, eseguita in modo automatico o semiautomatico, su grandi quantità di dati allo scopo di scoprire pattern (schemi) significativi.
Il processo di Data Mining
- Definizione del problema
- Reperimento dei dati, selezione e controllo degli stessi (attraverso una loro pulizia e integrazione)
- Esplorazione e visualizzazione per verificarne l’ effettiva utilità (analisi della correlazione, valori erratici, ecc, …)
- Data Mine, ovvero associazione per gruppi e ricerca di relazioni
- Costruzione del modello attraverso algoritmi di vario genere (quali la regressione multivariata, le reti neurali, gli alberi decisionali, i programmi genetici, ecc…)
- Generazione delle Regole e classificazione
- Validazione dei risultati, attraverso un test su dati nuovi
Per un approfondimento sul Data Mining, leggi anche il nostro articolo “Data Mining: meglio l’uomo o la macchina? Le riflessioni di 4Timing SIM”.
Data Mining e Trend Following, un’ importante conferma
Abbiamo cercato di classificare i periodi di trend positivi di medio lungo periodo dei mercati per verificare se ci sono modelli alternativi al trend following in generale, oppure al nostro modello trend following, in particolare.
Purtroppo o per fortuna abbiamo ottenuto dei risultati molto simili a quelli della strategia Trend Following 4Timing SIM che abbiamo implementato nell’ ormai lontano 2005.
Questa conclusione per noi è un’ importante conferma, dal momento che anche utilizzando le più sofisticate e moderne tecniche di ricerca si ottengono dei risultati molto simili.
Riportiamo i risultati del test, condotto su un orizzonte temporale di 15 anni e su un set sufficientemente rappresentativo di indici azionari internazionali. Sono state impiegate le serie storiche dei futures relativi ai 16 indici per eliminare qualsiasi distorsione nei risultati, potenzialmente dovute all’impiego di uno strumento finanziario, l’indice appunto, che in realtà non è direttamente investibile.
Indici:
- AEX Amsterdam
- S&P Midcap 400
- Russel 2000
- s&p 500
- DAX INDEX
- Mini Hang Seng
- MIB FTSE
- TOPIX INDEX
- KOSPI 200
- IBEX 35
- S&P CBX Nifty Index
- OMXS30 INDEX
- OBX OSLO
- MSCI SINGAPORE Stock Index
- NIKKEI 225
- S&P CANADA 60
Fasi di lavoro
- Preprocessamento dei dati storici di questo gruppo di futures su indici azionari,
- Trasformazione delle serie dei prezzi in misure che permettono una migliore comprensione del fenomeno e dalla massimizzazione delle informazioni contenute nei dati. In particolare abbiamo utilizzato misure di statistica quali Skewness, Kurtosis, Regressione, scarto quadratico medio ecc…
- Data Mining utilizzando algoritmi di classificazione si è cercata una relazione tra gli attributi (le misure ricavate nella fase di trasformazione) e i periodi di trend positivo discriminando le fasi negative o senza trend. Un classificatore comunemente usato è la rete neurale che, rappresentata graficamente, prevede dei dati di input i (nel nostro caso lo Skewnwss, Kurtosis ecc… ), i pesi w associati a ogni input, la funzione somma. La rete neurale restituirà 1 per i periodi classificati come trend positivo e 0 per gli altri.
- Training Set e Test Set: per la costruzione del modello abbiamo utilizzato il set di dati pre 2007 (Training Set), mentre il periodo successivo 2007-2022 non è stato impiegato ma messo da parte per la fase di Test (applicazione del modello a dati mai visti).
- Risultato: abbiamo confrontato
- la somma delle variazioni percentuali di un portafoglio compra e tieni
- i risultati della nostra strategia Trend Following
- i risultati del modello di Machine Learning ricavato dal processo di data mining.
Dal grafico che segue appare evidente che il modello di Machine Learning (in nero) coglie gli stessi trend di quello 4Timing SIM (periodo 2007 -2022).
Conclusioni
Riteniamo che la tecnologia di Data Mining sia uno strumento fondamentale per ricavare utili informazioni dalle serie storiche dei prezzi dei mercati. La sua validità è dimostrata dal fatto che il modello individuato nella fase di training continui a funzionare su dati mai visti (fase di test).
Per quanto riguarda le tendenze di medio lungo periodo abbiamo raggiunto con il modello in produzione Trend Following 4Timing SIM un risultato a dir poco ottimale. Infatti il processo di Data Mining conferma l’efficacia dei modelli da noi utilizzati da tempo.
La ricerca che stiamo conducendo e che continueremo a portare avanti attraverso il Data Mining orientata su periodi temporali diversi dal medio lungo termine e su strumenti finanziari alternativi agli OICR ci ha permesso di trovare pattern diversi da quelli già individuati dall’ attuale modello Trend Following e di implementare così la strategia di Machine Learning che dal 2020 fa parte dell’offerta 4Timing SIM.
Sei interessato al Machine Learning e vorresti saperne di più?
Scarica il nostro contenuto gratuito pensato appositamente per te.
CIO & Founder 4Timing SIM – Lavoro nel mondo della gestione del risparmio da quasi trent’anni con lo stesso entusiasmo di quando ho iniziato. In questi ultimi venti anni, coadiuvato dal mio staff, mi sono dedicato all’implementazione di modelli sistematici di gestione attraverso l’applicazione del metodo scientifico, sempre pronto a valutare nuove possibilità ma con l’occhio critico della scienza. Mi rispecchio nella frase del filosofo Karl Popper: “Il metodo della scienza è il metodo di audaci congetture e ingegnosi e severi tentativi di confutarle.” Nel 2016 ho deciso di fondare 4Timing SIM per offrire, attraverso i servizi di consulenza finanziaria e gestione del patrimonio, il know-how accumulato in questi anni.