Lissage exponentiel
Théorie du lissage exponentiel
J'écrirai un article sur les indicateurs techniques et vous parlerai de la moyenne exponentielle mobile. Cependant, il s'est avéré qu'en étudiant la théorie de cet indicateur, j'ai découvert des choses intéressantes plus en lien avec les statistiques que la bourse ou forex.
Comme les statistiques ont déjà été mentionnées sur ce site, j'ai décidé d'écrire un article séparé à ce sujet - l'article sur le lissage exponentiel dans l'analyse des séries temporelles.
Ce sujet a été évoqué dans l'article Fluctuations saisonnières. Indices saisonniers. Méthode des moyennes sumples. Le calcul des indices de saisonnalité moyens des méthodes de moyennes peut être principalement appliqué sur les séries temporelles où il n'y a pas de tendances croissantes/décroissantes, ou lorsqu'elles sont négligeables. En d'autres termes, la valeur observée fluctuait autour d'une valeur permanente.
Qu'est-ce que cela signifie ? Cela signifie que la moyenne est constante, et du fait de cela, elle ne peut pas représenter la tendance.
Illustrons cela avec un graphique
De manière générale, toutes les méthodes de moyennes ont pour but d'éliminer les "bruits" de la diffusion aléatoire des données ce qui permet de mieux identifier la tendance ou la saisonnalité ou les changements de cycles, soit la structure interne des données qui a l'air aléatoire et l'utiliser pour développer le modèle suivi par des analyses et des prévisions des valeurs futures - mais comme nous le voyons, la méthode de moyenne simple ne fonctionne pas s'il y a une tendance prononcée. Nous ne pouvons rien prédire avec son aide. Nous devons pouvoir recevoir non seulement une moyenne mais des séries moyennes. Et la méthode la plus populaire (et la plus simple) pour obtenir ces séries est le lissage exponentiel.
Il peut être décrit comme suit - Lors de la prévision, les valeurs les plus récentes des valeurs observées reçoivent un poids plus important comparées aux valeurs plus anciennes. En même temps, les valeurs plus anciennes reçoivent des poids exponentiellement décroissants.
Maintenant, nous décrivons la définition avec des formules.
Traditionnellement la valeur observée est notée comme , et la moyenne lissée comme .
Ensuite,
non définie
et de manière généralisée
où, prend la valeur dans l'intervalle [0;1)
D'où vient l'expossant - indiquer la moyenne précédente.
et de manière généralisée
, for t > 2
Ainsi, le poids avant - est une suite géométrique infiniment décroissant avec un multiplicateur
Et plus S est éloignée, moins elle est affectée par les valeurs initiales.
Supposons que et voyons comment sa contribution change pour diverses valeurs de S.
Pour S2, elle est prise comme elle est, mais pour S3 avec un coefficient alpha de 0,5, la contribution de y1 est seulement de 250, dans S4 de 125 et ainsi de suite.
Simultanément, le choix du coefficient est important. Si vous jouez avec le paramètre "a" dans le calculateur (voir ci-dessus), il est claire que plus la valeur est élevée, plus le compte à rebours cesse rapidement d'affecter la moyenne lissée, et vice-versa - plus elle est faible, plus son influence perdure.
De même, pour un petit, la méthode d'obtention de S2 influence grandement le résultat. L'affectation de est juste l'une des méthodes. Alternativement, la valeur initiale peut par exemple être une moyenne simple des premières valeurs pour y.
Mais comment choisissez-vous ? Quel indice est le plus appropriée pour cette série ? Il n'y a pas de formules mathématiques pour la calcul exact de . C'est indicateur est le plus souvent choisi par sélection ou par la méthodes des "essais et erreurs"
La méthode consiste en fait en prenant plusieurs valeurs puis à sélectionner la meilleure parmi elles. Quel est le critère de "meilleure" dans notre cas ?
Ce critère est pour minimiser l'erreur quadratique moyenne. L'erreur est la déviation de la valeur actuelle par rapport à la prévision. Pour chaque valeur S, elle est élevée au carré pour éliminer l'influence des signes puis la moyenne de toutes les valeurs est calculée. Cet indice , pour lequel la valeur moyenne et le minimum sont les meilleurs pour plusieurs valeurs.
Maintenant quelques mots concernant la prédiction.
La valeur suivant de la série est directement prédite à partir de la formule
S'il est nécessaire d'avoir une prévision pour un grand nombre d'échantillons, la technique d'amorçage est utilisée. La dernière valeur connue de "y" est prise comme constante et est utilisée dans la formule récursive.
Maintenant, appliquons cette connaissance lorsque du calcul de la moyenne lissée pour le graphique présenté au début de cet article. Pour rendre cela plus intéressant, nous calculons la moyenne lissée pour les trois valeurs pour un , et nous calculons en même temps l'erreur quadratique de la moyenne.
Le graphique montre comme référence la valeur suivante prévue, soit la moyenne mobile étendue à un compte supplémentaire que les données actuelles.
Séries temporelles
| ||
---|---|---|
D'ailleurs, je devrais remarquer que la meilleure valeur par défaut pour le calculateur ci-dessus serait 0,7.
Avec égal à 1, le lissage dégénère en une répétition de l'avant-dernière valeur qui lors de variations importantes des valeurs voisines, ne donne pas toujours l'erreur quadratique oyenne minimale.
commentaires