Mifdal, Rachid (2019). Application des techniques d'apprentissage automatique pour la prédiction de la tendance des titres financiers. Mémoire de maîtrise électronique, Montréal, École de technologie supérieure.
Prévisualisation |
PDF
Télécharger (6MB) | Prévisualisation |
Prévisualisation |
PDF
Télécharger (1MB) | Prévisualisation |
Résumé
Ce mémoire examine l'utilisation des algorithmes et des techniques d'apprentissage automatique pour la prédiction de la direction des cours des actifs financiers à très court terme (par exemple, de quelques minutes à quelques heures). L’objectif à la fin est de concevoir un système décisionnel autonome capable d’automatiser la négociation des titres financiers en générant une prédiction de la tendance future du prix, en se basant sur les flux de données des transactions antérieures.
Nous avons étudié comment la distribution des mouvements boursiers peut être asymétrique. Ce biais dans les données ajoute plus de complexité à la tâche de prédiction. On a proposé trois méthodes pour faire face à ce problème. Entre autres, le rééchantillonnage des données, la modification des seuils des probabilités qui servent à générer la classification et l’utilisation des coûts pour pénaliser les mauvaises classifications de la classe majoritaire.
On a aussi constaté l’existence de dépendances temporelles dans les séries des prix des titres boursiers utilisés. Cette composante devra être considérée lors de la génération de nos ensembles d’entrainement et d’évaluation. En effet, l’exactitude de l’inférence faite à partir des données d’entrainement sur de nouvelles données, dépendra de la similarité des propriétés statistiques des deux ensembles de données.
Nous avons aussi illustré que le choix des variables à utiliser, les indicateurs techniques pour ce projet, est une tâche qui nécessite beaucoup de rigueur. Comme nous l’avons démontré, il existe de fortes corrélations entre les indicateurs techniques qui sont dérivés des mêmes séries de données. C’est pourquoi, il faut être prudent dans le choix de ces indicateurs. Utiliser des indicateurs qui reflètent la même information, risque d’introduire beaucoup de bruit dans nos modèles et affecter leurs performances. Nous avons expliqué comment on peut faire face à ce problème et comment on peut réduire la dimensionnalité de nos données ainsi que l’interaction entre les variables explicatives.
L’existence des dérives conceptuelles dans les séries temporelles financières est un phénomène courant. En comparant des données sur des fenêtres temporelles différentes, on peut observer comment la distribution de la variable cible change. Une solution que nous proposons dans ce projet consiste à utiliser une technique d’évaluation dynamique, où chaque nouvelle instance sera prédite à partir d’un historique de données qui est dynamique. À chaque fois, la valeur collectée la plus récente est comparée à notre prédiction et intégrée dans nos données d’entrainement.
À la fin de ce projet nous avons illustré qu’il est possible de prédire les mouvements des titres boursiers en utilisant les techniques d’apprentissage automatique. La performance de nos prédictions était significativement plus élevée que si on suppose que le mouvement boursier suit une marche aléatoire. Nous avons aussi montré qu’il est possible d’implémenter des stratégies de négociation gagnantes basées sur l’apprentissage automatique et qui génèrent beaucoup plus de profits, que si on opte pour une gestion passive.
Titre traduit
Machine Learning techniques for predicting the trend of financial securities
Résumé traduit
This thesis examines the use of machine learning techniques for predicting the trend of financial intraday time series (e.g.: minutes to hours) and explain how we could design an autonomous decision-making system to automate the trading of financial securities.
One of the challenges of financial time series is the asymmetric distribution of the price movements that introduce bias to the data used to train our models. Three methods are proposed in this thesis to deal with this problem. Among other things, resampling the data, modifying the default probability cutoffs used to generate the classifications and the use of cost sensitive learning to penalize the misclassifications of the majority class.
We have observed the existence of time dependencies in the price series of the securities used in this project. This component needs to be considered during the process of training and evaluating our models. Indeed, the accuracy of the inference made from the training data on new unseen data will depend on the similarity of the statistical properties of the two sets of data.
The existence of drifts in financial time series is a common phenomenon. By comparing data on different time windows, we can see how the distribution of the target variable changes over time. One solution we propose in this thesis is to use a dynamic rolling evaluation and forecasting technique, where each new instance is predicted from a dynamic set of data. For each new data point, the most recent collected value is compared to the model prediction and integrated into the training data.
We also illustrated that the selection of features to use in prediction (the technical indicators for this project), is a task that requires a lot of rigor. Strong multicollinearities can be found for technical indicators that are derived from the same series (e.g. price series). Using indicators that reflect the same information may introduce a lot of noise into our models and affect their performance. We have explained how we can deal with this problem and how we can reduce the dimensionality of our data as well as the interaction between the technical indicators.
At the end of this thesis, we demonstrated that it is possible to predict intraday financial time series trend by using machine-learning techniques. From a statistical perspective, the performance of our predictions was significantly better than a random guess, which contradicts the hypothesis of the random walk. We also back-tested our models to see if it is possible to implement winning trading strategies based on machine learning techniques. The results are significantly higher than the expected performance of a passive trading strategy.
Type de document: | Mémoire ou thèse (Mémoire de maîtrise électronique) |
---|---|
Renseignements supplémentaires: | "Mémoire présenté à l'École de technologie supérieure comme exigence partielle à l'obtention de la maîtrise avec mémoire en génie, concentration personnalisée". Comprend des références bibliographiques (pages 173-176). |
Mots-clés libres: | intelligence artificielle, apprentissage automatique, négociation algorithmique, séries temporelles financières, analyse prédictive, indicateurs boursiers techniques, analyse des sentiments des marchés financiers |
Directeur de mémoire/thèse: | Directeur de mémoire/thèse Miresco, Edmond T. |
Programme: | Maîtrise en ingénierie > Génie |
Date de dépôt: | 13 déc. 2019 19:15 |
Dernière modification: | 17 févr. 2020 17:05 |
URI: | https://espace.etsmtl.ca/id/eprint/2422 |
Gestion Actions (Identification requise)
Dernière vérification avant le dépôt |