Lissage exponentiel

Théorie du lissage exponentiel

J'écrirai un article sur les indicateurs techniques et vous parlerai de la moyenne exponentielle mobile. Cependant, il s'est avéré qu'en étudiant la théorie de cet indicateur, j'ai découvert des choses intéressantes plus en lien avec les statistiques que la bourse ou forex.

Comme les statistiques ont déjà été mentionnées sur ce site, j'ai décidé d'écrire un article séparé à ce sujet - l'article sur le lissage exponentiel dans l'analyse des séries temporelles.

Ce sujet a été évoqué dans l'article Fluctuations saisonnières. Indices saisonniers. Méthode des moyennes sumples. Le calcul des indices de saisonnalité moyens des méthodes de moyennes peut être principalement appliqué sur les séries temporelles où il n'y a pas de tendances croissantes/décroissantes, ou lorsqu'elles sont négligeables. En d'autres termes, la valeur observée fluctuait autour d'une valeur permanente.

Qu'est-ce que cela signifie ? Cela signifie que la moyenne est constante, et du fait de cela, elle ne peut pas représenter la tendance.
Illustrons cela avec un graphique

PLANETCALC, Moyenne constante - graphique

Moyenne constante - graphique

Moyenne constante
Le fichier est très volumineux; un ralentissement du navigateur peut se produire pendant le chargement et la création.

Séries temporelles

arrow_upwardarrow_downward
objets par page:

De manière générale, toutes les méthodes de moyennes ont pour but d'éliminer les "bruits" de la diffusion aléatoire des données ce qui permet de mieux identifier la tendance ou la saisonnalité ou les changements de cycles, soit la structure interne des données qui a l'air aléatoire et l'utiliser pour développer le modèle suivi par des analyses et des prévisions des valeurs futures - mais comme nous le voyons, la méthode de moyenne simple ne fonctionne pas s'il y a une tendance prononcée. Nous ne pouvons rien prédire avec son aide. Nous devons pouvoir recevoir non seulement une moyenne mais des séries moyennes. Et la méthode la plus populaire (et la plus simple) pour obtenir ces séries est le lissage exponentiel.

Il peut être décrit comme suit - Lors de la prévision, les valeurs les plus récentes des valeurs observées reçoivent un poids plus important comparées aux valeurs plus anciennes. En même temps, les valeurs plus anciennes reçoivent des poids exponentiellement décroissants.

Maintenant, nous décrivons la définition avec des formules.
Traditionnellement la valeur observée est notée comme y, et la moyenne lissée comme S.
Ensuite,
S_1 non définie
S_2 = y_1
S_3 = \alpha y_2 + (1-\alpha)S_2

et de manière généralisée

S_t = \alpha y_{t-1} + (1-\alpha)S_{t-1}

où, \alpha prend la valeur dans l'intervalle [0;1)

D'où vient l'expossant - indiquer la moyenne précédente.

S_t = \alpha y_{t-1} + (1-\alpha)S_{t-1} = \alpha y_{t-1} + (1-\alpha)[\alpha y_{t-2} + (1-\alpha)S_{t-2}] = \alpha y_{t-1} + (1-\alpha)[\alpha y_{t-2} + (1-\alpha)[\alpha y_{t-3} + (1-\alpha)S_{t-3}]]
S_t = \alpha y_{t-1} + \alpha(1-\alpha)y_{t-2} + \alpha(1-\alpha)^{2}y_{t-3} + (1-\alpha)^{3}S_{t-3}

et de manière généralisée

S_t=\alpha\sum_{i=1}^{t-2}(1-\alpha)^{i-1}y_{t-i} + (1-\alpha)^{t-2}S_2, for t > 2

Ainsi, le poids avant y - est une suite géométrique infiniment décroissant avec un multiplicateur 1-\alpha
Et plus S est éloignée, moins elle est affectée par les valeurs initiales.

Supposons que y_1=1000 et voyons comment sa contribution change pour diverses valeurs de S.

PLANETCALC, Modification des valeurs pondérées pour le lissage exponentiel

Modification des valeurs pondérées pour le lissage exponentiel

Chiffres après la virgule décimale : 4
valeur y1
 
Modification des valeurs pondérées pour le lissage exponentiel
Le fichier est très volumineux; un ralentissement du navigateur peut se produire pendant le chargement et la création.

Pour S2, elle est prise comme elle est, mais pour S3 avec un coefficient alpha de 0,5, la contribution de y1 est seulement de 250, dans S4 de 125 et ainsi de suite.

Simultanément, le choix du coefficient \alpha est important. Si vous jouez avec le paramètre "a" dans le calculateur (voir ci-dessus), il est claire que plus la valeur est élevée, plus le compte à rebours cesse rapidement d'affecter la moyenne lissée, et vice-versa - plus elle est faible, plus son influence perdure.

De même, pour un \alpha petit, la méthode d'obtention de S2 influence grandement le résultat. L'affectation de S_2=y_1 est juste l'une des méthodes. Alternativement, la valeur initiale peut par exemple être une moyenne simple des premières valeurs pour y.

Mais comment choisissez-vous \alpha ? Quel indice est le plus appropriée pour cette série ? Il n'y a pas de formules mathématiques pour la calcul exact de \alpha. C'est indicateur est le plus souvent choisi par sélection ou par la méthodes des "essais et erreurs"
La méthode consiste en fait en prenant plusieurs valeurs \alpha puis à sélectionner la meilleure parmi elles. Quel est le critère de "meilleure" dans notre cas ?

Ce critère est pour minimiser l'erreur quadratique moyenne. L'erreur est la déviation de la valeur actuelle par rapport à la prévision. Pour chaque valeur S, elle est élevée au carré pour éliminer l'influence des signes puis la moyenne de toutes les valeurs est calculée. Cet indice \alpha, pour lequel la valeur moyenne et le minimum sont les meilleurs pour plusieurs valeurs.

Maintenant quelques mots concernant la prédiction.

La valeur suivant de la série est directement prédite à partir de la formule
S_{forecast} = \alpha y_{last} + (1-\alpha)S_{last}

S'il est nécessaire d'avoir une prévision pour un grand nombre d'échantillons, la technique d'amorçage est utilisée. La dernière valeur connue de "y" est prise comme constante et est utilisée dans la formule récursive.

S_{forecast+n} = \alpha y_{origin} + (1-\alpha)S_{forecast+n-1}

Maintenant, appliquons cette connaissance lorsque du calcul de la moyenne lissée pour le graphique présenté au début de cet article. Pour rendre cela plus intéressant, nous calculons la moyenne lissée pour les trois valeurs pour un \alpha, et nous calculons en même temps l'erreur quadratique de la moyenne.

Le graphique montre comme référence la valeur suivante prévue, soit la moyenne mobile étendue à un compte supplémentaire que les données actuelles.

PLANETCALC, Calcul de la moyenne exponentiellement lissée

Calcul de la moyenne exponentiellement lissée

Séries temporelles

arrow_upwardarrow_downward
objets par page:

Chiffres après la virgule décimale : 2
Erreur quadratique moyenne 1
 
Erreur quadratique moyenne 2
 
Erreur quadratique moyenne 3
 
Lissage exponentiel
Le fichier est très volumineux; un ralentissement du navigateur peut se produire pendant le chargement et la création.

D'ailleurs, je devrais remarquer que la meilleure valeur \alpha par défaut pour le calculateur ci-dessus serait 0,7.
Avec \alpha égal à 1, le lissage dégénère en une répétition de l'avant-dernière valeur qui lors de variations importantes des valeurs voisines, ne donne pas toujours l'erreur quadratique oyenne minimale.

URL copiée dans le presse-papiers
Creative Commons Attribution/Share-Alike License 3.0 (Unported) PLANETCALC, Lissage exponentiel

commentaires