réseau neuronal et entrées - page 39

 

La qualité de la modélisation en dehors de l'échantillon :
*
* TruePositives : 83
* TrueNegatives : 111
* Faux positifs : 96
* Faux négatifs : 47
* Total des motifs dans les échantillons avec statistiques : 337
* Le reste des modèles en dehors des échantillons sans les statistiques : 78
* Total des erreurs hors échantillon : 143
* Sensibilité de la capacité de généralisation : 46.36871508379888%.
* Spécificité de la capacité de généralisation : 70.25316455696202%.
* Capacité de généralisation : 16,621879640760895 %.
* Indicateur de Reshetov : 0.004123184591376475
*/
double x0 = 2,0 * (v0 - 19,0) / 35,0 - 1,0 ;
double x1 = 2,0 * (v1 - 12,26) / 57,8300000000005 - 1,0
double x2 = 2,0 * (v2 - 21,0) / 13,0 - 1,0
double x3 = 2.0 * (v3 - 12.11) / 24.3800000000003 - 1.0
double x4 = 2,0 * (v4 - 18,0) / 40,0 - 1,0
double x5 = 2,0 * (v5 - 11,61) / 58,5 - 1,0 ;
double décision = -0.03426154451479057 + 0.09136531101334192 * x0 -0.16115463032514218 * x1 + 0.3774761240476446 * x0 * x1 -0.149536367886396967 * x2 -0,2182655506670959 * x0 * x2 -0,686972851164288 * x1 * x2 -0,7274492971348857 * x0 * x1 * x2 -0,06979110777265085 * x3 + 0.27356476016739995 * x0 * x3 -0.026662374360625248 * x1 * x3 + 0.12474514432879064 * x0 * x1 * x3 -0.291989483838501985 * x2 * x3 -0.2863737167793397 * x0 * x2 * x3 + 0.04656257824516221 * x1 * x2 * x3 + 0,11427907143112637 * x0 * x1 * x2 * x3 + 0,01709410880995815 * x4 + 0,21856958901169654 * x0 * x4 -9.925957720785493E-4 * x1 * x4 + 0,9723342991021926 * x0 * x1 * x4 + 0,04599384769467396 * x2 * x4 -0,05459813284687198 * x0 * x2 * x4 + 0.3729012411918303 * x1 * x2 * x4 + 0,010296169116858033 * x0 * x1 * x2 * x4 + 0,058584612082841506 * x3 * x4 + 0,531371391780234 * x0 * x3 * x4 -0.025018778838931215 * x1 * x3 * x4 + 0,1861984476159817 * x0 * x1 * x3 * x4 + 0,07319097184962621 * x2 * x3 * x4 + 0,0968827127374181818 * x0 * x2 * x3 * x4 + 01411041957291555 * x1 * x2 * x3 * x4 + 0,16417712916264263 * x0 * x1 * x2 * x3 * x4 -0,1726597989770004 * x5 + 0,36239224523375185 * x0 * x5 -0.008892292227349143328 * x1 * x5 -0.04417677147047251 * x0 * x1 * x5 -0.7319687377043317 * x2 * x5 -0.7806416997531924 * x0 * x2 * x5 + 0.01225632222209106843 * x1 * x2 * x5 + 0,04393711771649319 * x0 * x1 * x2 * x5 -0,006563651321672569 * x3 * x5 + 0,0627642424509067496 * x0 * x3 * x5 -0.015999570769395857 * x1 * x3 * x5 -0.05302786422005222 * x0 * x1 * x3 * x5 + 0.03534892871195049 * x2 * x3 * x5 + 0.1463193475694817 * x0 * x2 * x3 * x5 -0.027476124047644598 * x1 * x2 * x3 * x5 + 0,052884787352004865 * x0 * x1 * x2 * x3 * x5 -0,018202954537325178 * x4 * x5 + 1,0 * x0 * x4 * x5 -0.07118968415781378 * x1 * x4 * x5 -0,003138748792788926 * x0 * x1 * x4 * x5 + 0,2624137067639589 * x2 * x4 * x5 -0,02015595378617162 * x0 * x2 * x4 * x5 + 0.08019279607969382 * x1 * x2 * x4 * x5 + 0,06399649461673285 * x0 * x1 * x2 * x4 * x5 -0,02596308616804378 * x3 * x4 * x5 + 0.18361769860857746 * x0 * x3 * x4 * x5 -0,08407017017920377723 * x1 * x3 * x4 * x5 + 0,03014271917587724 * x0 * x1 * x3 * x4 * x5 + 0,07432306756805093 * x2 * x3 * x4 * x5 + 0.20722895875809277 * x0 * x2 * x3 * x4 * x5 + 0,0075079586507851345 * x1 * x2 * x3 * x4 * x5 + 0,20670493972886933 * x0 * x1 * x2 * x3 * x4 * x5

C'est compliqué..... Dans quelle mesure les données décrivent la variable dépendante ????

 

J'ai soumis un dossier de formation. Pas encore d'intervalle de test :-( Mais ce n'est pas un problème......

Et d'après ce que j'ai compris, il a fallu 337 entrées, alors que j'en ai soumis 600.

Ici, je vais essayer de reproduire le résultat dans mon environnement. Je me demande quel sera le résultat, même sur des machines différentes ?

Dossiers :
 
Et à propos des données, il n'est pas tout à fait clair comment les prendre pour entraîner le réseau sur des données propres...... Comment sélectionner les VraisPositifs : VraisNégatifs : FauxPositifs : FauxNégatifs de l'échantillon d'entraînement et essayer d'entraîner le réseau. Voyez ce qui se passe. Normalisation des données entrantes, c'est une bonne chose ..... Je ne sais pas comment utiliser.... Juste pour que ça ait l'air bien...
 

Le résultat correspond à ....... Supposons que nous trouvions 83 exemples positifs réels. Comment les séparer de l'échantillon total ? ...... Et l'alimentation pure de ces 83 dossiers s'est naturellement normalisée. Et si le réseau apprend avec un minimum d'erreur à ces 83 enregistrements. Ensuite, il sera (théoriquement) capable de classer ces enregistrements dans le bruit d'entrée....... Comme cela....

 
nikelodeon:

J'ai soumis un dossier de formation. Pas encore d'intervalle de test :-( Mais ce n'est pas un problème......

Et d'après ce que j'ai compris, il a fallu 337 entrées, alors que j'en ai soumis 600.

Ici, je vais essayer de reproduire le résultat dans mon environnement. Je me demande quel sera le résultat, même sur des machines différentes ?

Le VMR divise l'échantillon total en deux parties : formation et contrôle. Par exemple, si l'échantillon total contient 600 exemples, cela signifie que 600 - 337 = 263 exemples ont été inclus dans l'échantillon de formation, sur lequel le modèle a été créé (formé), et 337 exemples ont été inclus dans l'échantillon de contrôle, sur lequel le modèle a ensuite été testé (mais pas formé).
nikelodeon:
Et à propos des données, il n'est pas très clair comment les prendre pour entraîner le réseau sur des données propres...... Comment extraire d'un ensemble d'entraînement les VraisPositifs : VraisNégatifs : FauxPositifs : FauxNégatifs et essayer d'entraîner le réseau.
Il est inutile d'extraire quoi que ce soit de l'ensemble d'apprentissage. L'échantillon d'entraînement sert uniquement à créer le modèle, et le modèle est destiné à d'autres données qui ne figureront pas dans cet échantillon, de sorte que VMR effectue tous les calculs uniquement sur l'échantillon de contrôle.
 

En fait, JPrediction n'a pas été créé pour prédire les instruments financiers, mais pour prédire la rentabilité des signaux pour le mois suivant.

En d'autres termes, je compile un échantillon qui comprend les caractéristiques actuelles du signal : nombre de transactions, durée, % de profit mensuel, pourcentage de transactions rentables, pourcentage de transactions perdantes, facteur de profit, ratio de Sharp, etc. Ensuite, j'attends un mois et je marque avec 1 par mois les transactions rentables et 0 les non rentables.

J'entraîne ensuite le modèle sur cet échantillon et je l'utilise pour prévoir les signaux pour le mois suivant.

L'idée est que les signaux sont plus faciles à prévoir car ils contiennent beaucoup d'informations utiles supplémentaires en plus des données historiques. Les instruments financiers ne disposent pas de données supplémentaires autres que les données historiques.

 
Assistant, quel programme utilisez-vous pour interpréter les données ? E-excel ???
 

Je réfléchis donc... comment interpréter le résultat... pour le rendre plus rapide et certainement pas par la main.........

 
Reshetov:

En fait, JPrediction n'a pas été créé pour prédire les instruments financiers, mais pour prédire la rentabilité des signaux pour le mois suivant.

En d'autres termes, je compile un échantillon qui comprend les caractéristiques actuelles du signal : nombre de transactions, durée, % de profit mensuel, pourcentage de transactions rentables, pourcentage de transactions perdantes, facteur de profit, ratio de Sharp, etc. Ensuite, j'attends un mois et je marque 1 pour les signaux qui ont eu un bénéfice dans le mois, tandis que je marque 0 pour les transactions non rentables.

J'entraîne ensuite le modèle sur cet échantillon et je l'utilise pour prévoir les signaux pour le mois suivant.

L'idée est que les signaux sont plus faciles à prévoir car ils contiennent beaucoup d'informations utiles supplémentaires en plus des données historiques. Les instruments financiers ne disposent pas de données supplémentaires autres que les données historiques.

Je soutiens pleinement ce point de vue, j'ai un indicateur qui donne des signaux. Les mêmes métiers. Je pense qu'il est possible de l'exécuter dans JPrediction également, mais la façon de choisir l'intervalle d'entraînement n'est pas claire ? Et il serait pratique de sauvegarder le fichier avec l'indicateur calculé pour chaque enregistrement.....comme le fait Vizard...... et les données elles-mêmes afin de pouvoir les obtenir..... Sur eux, vous pouvez essayer de former un autre réseau plus tard...... C'est tout. Dis Yuri, est-ce que c'est prévu ????
 
Le plus ennuyeux est qu'Excel ne supporte pas non plus des formules aussi longues :-(
Raison: