L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 2125

 
Igor Makanu:

? lecture d'actualité ))))

là, le début de l'opus :

http://www.ievbras.ru/ecostat/Kiril/Library/Book1/Content0/Content0.htm#Ref


Tu lis vraiment ça ?

le fait est qu'il a été écrit sans aucune puissance de calcul et logique en premier lieu, et, comme indiqué, il fonctionne) beaucoup d'eau bien sûr, mais vous pouvez passer au crible vous-même. Et le début, eh bien, c'est le moment, sans le début du livre n'aurait pas été. Vous pouvez également en tenir compte)

 
Maxim Dmitrievsky:

http://gmdh.net/articles/theory/bookInductModel.pdf

un gros avantage est que les modèles linéaires convergent toujours vers un minimum local. C'est pourquoi la méthode est toujours pertinente

J'ai vu ce livre il y a quelques années.

Il semble... oui, c'est fascinant, mais quel est l'intérêt réel ? si le but est d'écrire un diplôme ou un doctorat - oui, c'est un livre de bord

si l'objectif est la série chronologique, ce livre traite d'autre chose, de l'invention de la forêt aléatoire à l'aube du développement de l'informatique.

imho, même les ensembles de NS peu habitués à l'application dans la pratique, comment travailler avec BP ? bien, comme une option de mess up un tas de beaucoup de NS, et à la fin vous obtenez autoecoder ? - Je doute que même un réseau convolutif puisse être obtenu avec ce livre.


Vorontsov est plus pertinent pour les connaissances anciennes, et le traitement des données - je suis en train de mâcher quelques cours en ligne sur BP - il y a quelque chose dedans ;)

 
elibrarius:

Si tous les points du test et du train sont classés dans une liste commune (réorganisée selon un certain modèle), cela signifie qu'ils sont mélangés. Voici ce que je comprends. Le test ne doit en aucun cas se mélanger au plateau.

Si les points sont indépendants (pas d'autocorrélation), vous pouvez et devez les mélanger.

En fait, c'est comme ça que fonctionne la forêt aléatoire.

 
Igor Makanu:

J'ai vu ce livre il y a quelques années.

en apparence... oui, c'est fascinant, mais vraiment - pourquoi ? si le but est d'écrire un diplôme ou un doctorat - oui, c'est un livre de bord

si l'objectif est la série chronologique, ce livre traite d'autre chose, de l'invention de la forêt aléatoire à l'aube du développement de l'informatique.

imho, même les ensembles de NS peu habitués à l'application dans la pratique, comment travailler avec BP ? bien, comme une option un tas de beaucoup de NS, et à la fin vous obtenez autoecoder ? - Je doute que même un réseau convolutionnel puisse être obtenu avec ce livre.


les connaissances anciennes, Vorontsov est plus pertinent, et le traitement des données - j'ai fini d'étudier les cours en ligne sur BP - il y a quelque chose dedans ;)

De quoi tu parles ? T'es bourré ou quoi ?

Demandez à Vorontsov qui est Ivakhnenko pour lui...

 
Maxim Dmitrievsky:

si les points sont indépendants (pas d'autocorrélation), le mélange est possible et nécessaire

en fait, c'est comme ça que fonctionne une forêt aléatoire

Il y a 2 ou 3 points très corrélés de chaque côté de la série chronologique avec chaque point. C'est-à-dire que la condition d'indépendance n'est pas remplie.
 
elibrarius:
La série temporelle a 2-3 points très corrélés de chaque côté. C'est-à-dire que la condition d'indépendance n'est pas remplie.

Il existe des méthodes spéciales de sesplicing pour les séries temporelles, qui prennent tout cela en compte.

 
elibrarius:
La série temporelle a 2-3 points très corrélés de chaque côté. C'est-à-dire que la condition d'indépendance n'est pas remplie.

il est possible de supprimer ces doublons, cela fonctionnera immédiatement sur les nouvelles données, mais l'écart ne sera pas couvert.

 
Maxim Dmitrievsky:

Si les points sont indépendants (pas d'autocorrélation), le mélange est possible et nécessaire.

pas de

ce n'est pas le but de l'ACF dans l'estimation BP

l'autocorrélation peut ne pas être présente pour le lag = 1, mais peut être présente pour les autres lags

et l'estimation de l'ACF n'est pas une évaluation des dépendances de décalage mais simplement un moyen d'identifier le modèle de processus - après avoir décidé à quel processus la BP se rapportera, nous commençons le prétraitement des données - soit en utilisant la BP elle-même soit en utilisant son échantillon de décalages

 
Igor Makanu:

pas de

oui

avant

après la décorrélation vers laquelle va le surentraînement. La sérialité des marques doit également être prise en compte.


 
Maxim Dmitrievsky:

il est possible de supprimer ces doublons, cela fonctionnera immédiatement sur les nouvelles données, mais l'écart ne sera pas couvert.

Et quel est l'intérêt si l'écart n'est pas couvert ?
Raison: