Équation de régression - page 8

 
Andrei01:
Qu'y a-t-il de mal à utiliser un zigzag pour trouver le minimum d'une fonction ?
Et comment allez-vous construire un zigzag, par exemple, dans un espace à dix dimensions ? )))))). Et combien de ressources informatiques cela nécessitera-t-il ?
 
alsu:
et comment allez-vous construire un zigzag, par exemple, dans un espace à dix dimensions? )))))) Et combien de ressources informatiques cela nécessitera-t-il ?
pas beaucoup, on ne peut pas fermer l'anneau. un cercle complet est nécessaire ;))
 
alsu:
et comment allez-vous construire un zigzag, par exemple, dans un espace à dix dimensions ? )))))) Et combien de ressources informatiques cela nécessitera-t-il ?
Je pense que les ressources sont secondaires à ce stade, mais si c'est rentable, alors nous pourrons penser à l'optimisation)).
 
j21:

J'étais intéressé par les équations de régression. Cependant, j'ai rencontré un problème pour les décrire de manière adéquate. Les données dont nous disposons : heure (disons M15), HAUT, BAS, OUVERT, FERME, VOLUME. Pour nous, il s'agit d'un ensemble d'observations. Nous avons un indicateur pour lequel nous devons établir une relation fonctionnelle avec les paramètres de l'objet (dans notre cas, la variation du taux de change) - les facteurs. Requis : établir une relation quantitative entre l'indicateur et les facteurs. Dans ce cas, la tâche de l'analyse de régression est comprise comme la tâche consistant à identifier la dépendance fonctionnelle y* = f(x 1, x 2, ..., x t) qui décrit le mieux les données dont nous disposons.

La fonction f(x 1, x 2, ..., x t) qui décrit la dépendance de l'indicateur par rapport aux paramètres est appelée équation (fonction) de régression.

Donc. Question 1 : Parmi les données dont nous disposons, laquelle devons-nous choisir comme indicateur et laquelle devons-nous choisir comme facteur ? Logiquement, l'indicateur est le temps, les facteurs sont H, L, O, C et V.

Dans notre cas, il s'agit d'une série chronologique.

La tâche suivante consiste à choisir la dépendance fonctionnelle. Une équation qui décrit la relation entre la variation de l'indicateur et la variation des facteurs. Il s'agit souvent de fonctions polynomiales. Un cas particulier est le polynôme du 1er degré - une équation de régression linéaire.

Question 2 : Quel est le meilleur polynôme à choisir, et comment le décrire adéquatement en termes de séries temporelles, quels paramètres appliquer, quel est le degré du polynôme. Quelqu'un a-t-il utilisé le polynôme de Chebyshev ? Si oui, quel est l'ordre ?

Notre prochaine tâche consiste à calculer les coefficients de l'équation de régression. La méthode habituelle consiste à utiliser l'ANC.

Question 3 : Quelle est la meilleure méthode pour calculer les coefficients pour notre cas ?

Question 4 : Avez-vous besoin de normaliser les données ?

Le sujet est certainement important et intéressant.

Nous avons donc une série temporelle contenant N échantillons. À ce stade, il n'est pas important de savoir ce que l'on entend exactement par échantillons - ticks, OHLC ou autre chose. Ce qui semble important, c'est la réponse à la question concernant la longueur optimale de l'échantillon d'entraînement n non égal à N, le nombre optimal de paramètres ajustables k<=n (degré du polynôme) et l'horizon de prévision T (mesuré en comptes).

A ce stade, le type particulier de fonction d'approximation et la méthode de son approximation de la série originale ne sont pas importants. Il est important d'obtenir les dépendances des paramètres ci-dessus sur les propriétés de la BP initiale. Il est connu, par exemple, que si BP est une variable aléatoire intégrée, alors la prédiction optimale est une constante égale à la valeur de la dernière lecture (barre zéro). Si la série contient des régularités, il faut rechercher l'optimum en termes de paramètres de régression.

Des considérations de bon sens dans ce contexte ?

 
degré 3. le nombre d'échantillons n est déterminé par l'heure du jour et l'ACF. l'horizon de prévision est déterminé expérimentalement car il dépend de la précision donnée et du modèle (le modèle peut aussi être un polynôme)
 
Neutron:

Le sujet est certainement important et intéressant.

Nous avons donc une série temporelle contenant N comptes. À ce stade, peu importe ce que l'on entend exactement par comptage - ticks, OHLC ou autre. Ce qui semble important est la réponse à la question concernant la longueur optimale de l'échantillon d'entraînement n non égal à N, le nombre optimal de paramètres ajustables k<=n (degré du polynôme) et l'horizon de prévision T (mesuré en comptes).

A ce stade, le type particulier de fonction d'approximation et la méthode d'approximation de la série originale n'ont pas d'importance. Il est important d'obtenir les dépendances des paramètres ci-dessus sur les propriétés de la BP initiale. Il est connu, par exemple, que si BP est une variable aléatoire intégrée, alors la prédiction optimale est une constante égale à la valeur de la dernière lecture (barre zéro). Si la série contient des régularités, il faut chercher un optimum par les paramètres de régression.

Y a-t-il des considérations de bon sens dans cette formulation ?

Pas de merde dans cette formulation. Putain de théorisation. Mettez fin à cette régression polynomiale avec une BP.

Nous avons besoin de maximiser les profits. J'emmerde toutes les régressions univariées. Pourquoi n'utiliser qu'une fraction des informations du marché ? Quand il y a beaucoup d'informations.

L'analyse de régression doit être multivariée, c'est le minimum. Analyse des différentes méthodes d'estimation (IOC, MO des valeurs d'erreur absolue (Laplace ou Lagrange - je ne me souviens plus), signe, quantile, etc.) de la régression sur l'efficacité.

L'estimation de l'horizon de prévision est également un morceau intéressant.

Il a écrit des conneries sur le sujet. Il n'y a pas grand-chose, bien sûr. Juste le tout début. En amont de cela, il y a l'estimation de l'horizon de prévision des bénéfices de BP et beaucoup d'autres choses intéressantes...

 
hrenfx: Pourquoi n'utiliser qu'une partie des informations sur le marché ? Quand il y a beaucoup d'informations.

Il a écrit des trucs sur le sujet.

Qu'est-ce qui t'excite tant ?

Pensez-vous que plus vous empilez les différents, de préférence pas simples et transparents, seront meilleurs ?

L'expérience raconte une histoire différente. Il est juste - plus simple, et de comprendre en profondeur dans le sujet étudié correctement ! Et "régression multivariée", "quantile"... - C'est comme l'analyse du spinor de l'interaction torsionnelle.

 

Merde, je n'ai rien jeté, d'où tu sors ça ? J'ai une régression LINEAR multivariée simple en général. Et la raison d'être de l'utilisation de la régression linéaire réside dans la logique de la constitution d'un portefeuille optimal et de la recherche de corrélations. C'est le point de départ - de la simplicité.

Je ne sais pas ce que vous entendez par régression, j'ai découvert ce que c'était l'autre jour. Je veux dire l'analyse de régression.

 
hrenfx:

... J'ai une régression simple multivariée LINEAR...


mais vous pouvez faire une régression polynomiale multivariée... Est-ce pire que le linéaire ? je ne sais pas, il n'y a qu'une seule vérification - si la précision de la prédiction augmente ou si le temps de prédiction augmente avec la même précision, alors oui c'est mieux .... Mais pour le vérifier, il ne suffit pas de comprendre comment le faire, il faut aussi l'expliquer à la machine ...

 
Prival:


mais vous pouvez faire une régression polynomiale multivariée ... Je ne sais pas, il n'y a qu'une seule vérification - si la précision de la prédiction augmente, ou si le temps de prédiction augmente avec la même précision, alors oui c'est mieux.... Mais pour le vérifier, il ne suffit pas de comprendre comment le faire, il faut aussi l'expliquer à la machine ...

ce sera mieux, bien sûr, mais l'ordinateur sera aussi chargé :)
Raison: