L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading

Alexander_K2 2019.01.29 18:31 #12791

Je maintiens mon opinion : il y a deux parents incontestables du vénérable KsanKsanych (Fa). 1) Aliochenka le fils, qui a été rattrapé par des investisseurs en colère, et 2) le petit-fils Kesha, qui promet des milliards à quiconque lira les créations de son grand-père.

Ne confondez pas les deux !

EURUSD - Tendances, prévisions [J'écrirai n'importe quel expert Le papier "AMERO" remplacera

Aleksey Vyazmikin 2019.01.29 19:47 #12792

Opinion intéressante d'un professionnel du jeu StarCraft 2 sur ce qui se passe. Surtout à propos de la tricherie dans le dernier match. Il ne faut pas oublier que l'organisation de tels spectacles par les grandes entreprises est avant tout une démarche marketing. La bonne chose à faire serait d'acheter leurs actions pour cet événement intraday.

Que faire avec le Pas le Graal, juste De la théorie à

Forester 2019.01.30 08:21 #12793

Si cela vous intéresse, vous pouvez comparer les tableaux d'importance par permutation et par suppression du prédicteur réel.

Importance des prédicteurs par force brute (en supprimant 1) caractéristique, valeur absolue, valeur relative * 100 1) 17 0.01097643069603077 99 2) 30 0.006790004907923086 61 3) 61 0.004684715336508855 42 4) 2 -0.0002692516957934765 -2 5) 59 -0.0006465367565449825 -5 6) 34 -0.0006503517167333328 -5 7) 5 -0.001340840857516234 -12 8) 41 -0.001504570905518282 -13 9) 15 -0.001971414359495396 -17 10) 49 -0.002008411960897655 -18 11) 6 -0.002027305543154334 -18 12) 55 -0.002292162160081906 -20 13) 47 -0.002398304141661728 -21 14) 29 -0.003010337993465118 -27 15) 51 -0.004160368206123241 -37 16) 45 -0.004454751375256194 -40 17) 31 -0.004888451443569572 -44 18) 0 -0.00493201061731692 -44 19) 48 -0.005610904510929521 -51 20) 3 -0.005764515487066274 -52 21) 57 -0.005965409431599886 -54 22) 10 -0.006056332510674986 -55 23) 35 -0.006367565963429744 -58 24) 58 -0.006638024809636447 -60 25) 43 -0.007371220115761079 -67 26) 9 -0.007420288551508419 -67 27) 21 -0.007838972444520739 -71 28) 4 -0.007840269966254226 -71 29) 44 -0.008004942292835771 -72 30) 16 -0.008290498838290847 -75 31) 36 -0.008995332552560964 -81 32) 50 -0.009024243316015798 -82 33) 27 -0.009105675807931257 -82 34) 24 -0.01027361001595535 -93 35) 7 -0.01052719088846928 -95 36) 26 -0.01082406611271462 -98 37) 18 -0.01155880619525071 -105 38) 60 -0.01156309946744785 -105 39) 56 -0.01203862169736691 -109 40) 1 -0.01203862169736691 -109 41) 25 -0.0122272134638268 -111 42) 38 -0.01241174339783128 -113 43) 62 -0.01249635462233889 -113 44) 28 -0.01266702047388507 -115 45) 11 -0.01359028620740281 -123 46) 39 -0.01404126970316556 -127 47) 20 -0.01439737068264699 -131 48) 52 -0.01439756725211659 -131 49) 42 -0.01444571512808378 -131 50) 22 -0.01551886866180208 -141 51) 33 -0.01615798882405024 -147 52) 12 -0.01905830020505599 -173 53) 14 -0.01926462731981513 -175 54) 37 -0.01995084300903066 -181 55) 40 -0.020510512124551 -186 56) 19 -0.021415509666178 -195 57) 63 -0.02151966963894812 -196 58) 54 -0.02355949029687353 -214 59) 64 -0.02507021252693609 -228 60) 32 -0.02702794503628224 -246 61) 8 -0.02803580711831312 -255 62) 13 -0.03090123190409769 -281 63) 46 -0.03344678821960098 -304 64) 53 -0.03558721250407129 -324 65) 23 -0.04407219798162174 -401	Importance des prédicteurs selon la méthode de permutation 0) 0.043401, valeur absolue, valeur relative * 100 1) 55 0.04340158682225395 99 2) 61 0.02562763893643727 59 3) 58 0.02546470705535522 58 4) 56 0.02529445125891924 58 5) 59 0.02513377163594621 57 6) 57 0.02208166602125552 50 7) 64 0.02019285632774162 46 8) 60 0.0160907362360114 37 9) 43 0.0125324616278514 28 10) 35 0.01239249171969528 28 11) 13 0.01233138008911674 28 12) 24 0.01170363669371338 26 13) 62 0.01162424331038356 26 14) 63 0.01149019906346291 26 15) 45 0.01127777161657609 25 16) 34 0.01085020622422195 24 17) 46 0.01061844113396632 24 18) 20 0.01007598993178244 23 19) 2 0.009874770749918993 22 20) 19 0.00973881761283335 22 21) 1 0.009100774421598679 20 22) 32 0.009027289557555301 20 23) 9 0.008970631365350451 20 24) 54 0.00802484531062575 18 25) 8 0.007874015748031482 18 26) 53 0.007388216046985141 17 27) 41 0.006952887365763216 16 28) 12 0.0065631543248105 15 29) 21 0.006511968996697037 15 30) 31 0.006445981174562854 14 31) 30 0.005790682414698156 13 32) 42 0.005742446472030011 13 33) 22 0.003590654957257189 8 34) 4 0.003590358440616087 8 35) 38 0.00350243104857792 8 36) 10 0.00350243104857792 8 37) 29 0.003392223030944636 7 38) 5 0.003253553701826867 7 39) 52 0.003019071994331074 6 40) 11 0.002622140078149371 6 41) 15 0.001506974549529611 3 42) 49 0.001178236999850979 2 43) 27 0.000646877104963639 1 44) 23 0.0001088642328799794 0 45) 0 -0.0007427642973199949 -1 46) 36 -0.0008086747680855211 -1 47) 18 -0.001719116017552688 -3 48) 16 -0.003868408494392753 -8 49) 7 -0.004264601904658535 -9 50) 25 -0.004436590312574581 -10 51) 44 -0.004549722466056144 -10 52) 17 -0.005094229165450173 -11 53) 33 -0.007112771718937178 -16 54) 50 -0.008009653155771651 -18 55) 6 -0.008725562553674474 -20 56) 26 -0.01000190433609049 -23 57) 47 -0.01158648521535965 -26 58) 3 -0.01809942562041326 -41 59) 51 -0.01843159353630121 -42 60) 39 -0.02375369534904158 -54 61) 40 -0.02659139305699997 -61 62) 37 -0.02970174182772609 -68 63) 48 -0.031083105562031 -71 64) 14 -0.03323633066169551 -76 65) 28 -0.03952723165321592 -91

Importance des prédicteurs par force brute (en supprimant 1)
caractéristique, valeur absolue, valeur relative * 100
1) 17 0.01097643069603077 99
2) 30 0.006790004907923086 61
3) 61 0.004684715336508855 42
4) 2 -0.0002692516957934765 -2
5) 59 -0.0006465367565449825 -5
6) 34 -0.0006503517167333328 -5
7) 5 -0.001340840857516234 -12
8) 41 -0.001504570905518282 -13
9) 15 -0.001971414359495396 -17
10) 49 -0.002008411960897655 -18
11) 6 -0.002027305543154334 -18
12) 55 -0.002292162160081906 -20
13) 47 -0.002398304141661728 -21
14) 29 -0.003010337993465118 -27
15) 51 -0.004160368206123241 -37
16) 45 -0.004454751375256194 -40
17) 31 -0.004888451443569572 -44
18) 0 -0.00493201061731692 -44
19) 48 -0.005610904510929521 -51
20) 3 -0.005764515487066274 -52
21) 57 -0.005965409431599886 -54
22) 10 -0.006056332510674986 -55
23) 35 -0.006367565963429744 -58
24) 58 -0.006638024809636447 -60
25) 43 -0.007371220115761079 -67
26) 9 -0.007420288551508419 -67
27) 21 -0.007838972444520739 -71
28) 4 -0.007840269966254226 -71
29) 44 -0.008004942292835771 -72
30) 16 -0.008290498838290847 -75
31) 36 -0.008995332552560964 -81
32) 50 -0.009024243316015798 -82
33) 27 -0.009105675807931257 -82
34) 24 -0.01027361001595535 -93
35) 7 -0.01052719088846928 -95
36) 26 -0.01082406611271462 -98
37) 18 -0.01155880619525071 -105
38) 60 -0.01156309946744785 -105
39) 56 -0.01203862169736691 -109
40) 1 -0.01203862169736691 -109
41) 25 -0.0122272134638268 -111
42) 38 -0.01241174339783128 -113
43) 62 -0.01249635462233889 -113
44) 28 -0.01266702047388507 -115
45) 11 -0.01359028620740281 -123
46) 39 -0.01404126970316556 -127
47) 20 -0.01439737068264699 -131
48) 52 -0.01439756725211659 -131
49) 42 -0.01444571512808378 -131
50) 22 -0.01551886866180208 -141
51) 33 -0.01615798882405024 -147
52) 12 -0.01905830020505599 -173
53) 14 -0.01926462731981513 -175
54) 37 -0.01995084300903066 -181
55) 40 -0.020510512124551 -186
56) 19 -0.021415509666178 -195
57) 63 -0.02151966963894812 -196
58) 54 -0.02355949029687353 -214
59) 64 -0.02507021252693609 -228
60) 32 -0.02702794503628224 -246
61) 8 -0.02803580711831312 -255
62) 13 -0.03090123190409769 -281
63) 46 -0.03344678821960098 -304
64) 53 -0.03558721250407129 -324
65) 23 -0.04407219798162174 -401

Importance des prédicteurs selon la méthode de permutation
0) 0.043401, valeur absolue, valeur relative * 100
1) 55 0.04340158682225395 99
2) 61 0.02562763893643727 59
3) 58 0.02546470705535522 58
4) 56 0.02529445125891924 58
5) 59 0.02513377163594621 57
6) 57 0.02208166602125552 50
7) 64 0.02019285632774162 46
8) 60 0.0160907362360114 37
9) 43 0.0125324616278514 28
10) 35 0.01239249171969528 28
11) 13 0.01233138008911674 28
12) 24 0.01170363669371338 26
13) 62 0.01162424331038356 26
14) 63 0.01149019906346291 26
15) 45 0.01127777161657609 25
16) 34 0.01085020622422195 24
17) 46 0.01061844113396632 24
18) 20 0.01007598993178244 23
19) 2 0.009874770749918993 22
20) 19 0.00973881761283335 22
21) 1 0.009100774421598679 20
22) 32 0.009027289557555301 20
23) 9 0.008970631365350451 20
24) 54 0.00802484531062575 18
25) 8 0.007874015748031482 18
26) 53 0.007388216046985141 17
27) 41 0.006952887365763216 16
28) 12 0.0065631543248105 15
29) 21 0.006511968996697037 15
30) 31 0.006445981174562854 14
31) 30 0.005790682414698156 13
32) 42 0.005742446472030011 13
33) 22 0.003590654957257189 8
34) 4 0.003590358440616087 8
35) 38 0.00350243104857792 8
36) 10 0.00350243104857792 8
37) 29 0.003392223030944636 7
38) 5 0.003253553701826867 7
39) 52 0.003019071994331074 6
40) 11 0.002622140078149371 6
41) 15 0.001506974549529611 3
42) 49 0.001178236999850979 2
43) 27 0.000646877104963639 1
44) 23 0.0001088642328799794 0
45) 0 -0.0007427642973199949 -1
46) 36 -0.0008086747680855211 -1
47) 18 -0.001719116017552688 -3
48) 16 -0.003868408494392753 -8
49) 7 -0.004264601904658535 -9
50) 25 -0.004436590312574581 -10
51) 44 -0.004549722466056144 -10
52) 17 -0.005094229165450173 -11
53) 33 -0.007112771718937178 -16
54) 50 -0.008009653155771651 -18
55) 6 -0.008725562553674474 -20
56) 26 -0.01000190433609049 -23
57) 47 -0.01158648521535965 -26
58) 3 -0.01809942562041326 -41
59) 51 -0.01843159353630121 -42
60) 39 -0.02375369534904158 -54
61) 40 -0.02659139305699997 -61
62) 37 -0.02970174182772609 -68
63) 48 -0.031083105562031 -71
64) 14 -0.03323633066169551 -76
65) 28 -0.03952723165321592 -91

Par permutation, les 10 premières lignes montrent que si l'on supprime un prédicteur, l'erreur se dégrade de 2 à 6 %, les 10 premières de l'énumération seulement de 0,1 à 0,2 %, puisqu'en pratique l'arbre trouvera toujours un autre prédicteur pour lequel la séparation est presque aussi bonne (principalement en raison de ceux qui sont corrélés avec le prédicteur supprimé, mais même s'ils sont précédemment supprimés, on trouvera toujours quelque chose).

Il est intéressant de noter que près de la moitié des prédicteurs présentent une importance négative lorsqu'ils sont effectivement supprimés, c'est-à-dire que s'ils sont supprimés, l'erreur de l'arbre est réduite, c'est-à-dire qu'ils sont clairement bruyants. Mais le plus bruyant n'est pire que de 0,5 %.
Et le fait que l'ordre d'importance n'est pas du tout similaire conduit à l'idée qu'il est encore préférable d'éliminer les prédicteurs bruyants par énumération.

Machine learning in trading: [Archives] Mathématiques pures, physique, The interaction of markets.

Maxim Dmitrievsky 2019.01.30 09:31 #12794

Peut-être parce que vous devez comparer avec une sorte de point de référence ou d'exemple connu, et non pas avec la lumière.

+La vitesse est très importante. Comme Alglib n'a pas d'importations intégrées, je pense que la permutation est optimale pour le moment (j'ai essayé plusieurs méthodes de force brute).

[Archives] Mathématiques pures, physique, Qui croit encore que Toute question des nouveaux

Aleksey Vyazmikin 2019.01.30 10:00 #12795

elibrarius:

Par permutation, les 10 premières lignes montrent que si vous supprimez un prédicteur, l'erreur s'aggravera de 2-6%, les 10 premières de l'énumération - seulement de 0,1-0,2%, parce qu'en pratique l'arbre trouvera toujours un autre prédicteur pour lequel il y aura une séparation presque aussi bonne (principalement en raison de la corrélation avec le prédicteur supprimé, mais même si vous les supprimez précédemment, vous trouverez toujours quelque chose).

Pourquoi avez-vous besoin de l'erreur globale, avez-vous un échantillon binaire à l'équilibre ? Je suis plus enclin à trouver des moyens d'améliorer la précision de la classe 1.

Forester 2019.01.30 10:21 #12796

Aleksey Vyazmikin:

Pourquoi avez-vous besoin d'une erreur commune, avez-vous un échantillonnage binaire à l'équilibre ?

L'erreur commune n'est pas une feuille individuelle, mais un arbre/une forêt.

Aleksey Vyazmikin:

Je suis plus enclin à trouver des moyens d'améliorer la précision de la classe 1.

Moi aussi)

Forester 2019.01.30 10:23 #12797

Maxim Dmitrievsky:

Peut-être parce que vous devez comparer avec une sorte de point de référence ou d'exemple connu, et non pas avec la lumière.

+La vitesse est très importante. Puisque alglib n'a pas d'imports intégrés, je pense que le shuffling est optimal maintenant (j'ai essayé un tas de méthodes de force brute).

Overkill (supprimer/ajoutez 1) est la référence à laquelle toutes les autres méthodes doivent être comparées. Mais c'est long, je suis d'accord. Mais si ça ajoute au moins 5%, je suis prêt à attendre.

FOREX - Tendances, prévisions Exécution synchronisée du script/conseiller Principes de travail avec

Forester 2019.01.30 10:30 #12798

Une autre petite expérience avec la permutation.
Avec différents passages sur le même arbre, en raison du caractère aléatoire de la permutation, l'ordre d'importance change également.

Aleksey Vyazmikin 2019.01.30 10:44 #12799

elibrarius:
Une autre petite expérience de permutation.
Avec différentes exécutions sur le même arbre, en raison du caractère aléatoire de la permutation, l'ordre d'importance change également.

J'aimerais clarifier : sur quel échantillon testez-vous le résultat de la méthode de permutation, celui qui a été entraîné ou celui qui a été testé ?

Je comprends que le bruit est quelque chose qui ne fonctionne plus du tout sur un échantillon en dehors de la formation. Mais je pense qu'il ne s'agit pas d'un prédicteur unique, mais plutôt de relations/pertes. C'est-à-dire qu'il y a deux possibilités - le prédicteur est nul ou il n'est tout simplement pas utilisé correctement, c'est-à-dire que les feuilles sont nulles.

Y a-t-il un modèle FOREX - Tendances, prévisions La méthode "XO" .........

Forester 2019.01.30 10:56 #12800

Aleksey Vyazmikin:

J'aimerais clarifier : sur quel échantillon testez-vous le résultat de la méthode de permutation, celui qui a été entraîné ou celui qui a été testé ?

Je comprends que le bruit est quelque chose qui ne fonctionne plus du tout sur un échantillon en dehors de la formation. Mais je ne pense pas qu'il s'agisse d'un prédicteur unique, mais plutôt de relations/de départs. C'est-à-dire qu'il y a deux possibilités - le prédicteur est nul ou il n'est tout simplement pas utilisé correctement, c'est-à-dire que les feuilles sont nulles.

Sur le plan de l'apprentissage, puisque les arbres ne sont pas formés. Dans les arbres surentraînés, il devrait être sur l'arbre de test, puisque l'arbre se souviendrait aussi du bruit.
Avec des arbres non formés, cela n'a pas d'importance.
Mais la taille de l'échantillon compte. Plus il est grand, plus il est représentatif. Et mon terrain d'entraînement est 3 fois plus grand.

---------

Selon le tutoriel https://www.mql5.com/ru/blogs/post/723619, un grand échantillon représentatif rend inutile l'équilibrage entre les classes, ce qui réduit le caractère aléatoire temporel. J'ai transféré ça aux arbres non formés.
Mais je peux me tromper et je dois vérifier la signification des prédicteurs sur le graphique de test.

Нужна ли деревьям и лесам балансировка по классам?

www.mql5.com

Я тут читаю: Флах П. - Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных - 2015там есть несколько страниц посвященных этой теме. Вот итоговая:Отмеченный...

Comment mesurez-vous le bruit Indicateurs d'élite :) Y a-t-il un modèle

L'apprentissage automatique dans la négociation : théorie, modèles, pratique et algo-trading - page 1280