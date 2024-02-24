Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 36
Eu não acho que este pacote seja suficiente para construir um modelo capaz de prever a variável alvo. Tudo o que encontrei na ajuda é para construir um modelo PCA baseado em preditores, a variável alvo não está de todo lá.
Olá, você usou função errada, você deveria ter usado"nlPca" como indicado no site que eu dei, mas é minha culpa, eu deveria ter dado mais detalhes...
Aqui, em vez de prever - ajustado, experimente, talvez você consiga
Eu não acho que este pacote seja suficiente para construir um modelo capaz de prever a variável alvo. Tudo o que encontrei na ajuda foi construir um modelo PCA baseado em preditores, a variável alvo não está de todo lá.
Isto criará um objeto resNipals (Nonlinear Estimation by Iterative Partial Least Squares) com 5 componentes principais para analisar a tabelaDataComplete do metabolito. Em vez de metaboliteDataComplete, você pode substituir a sua própria tabela por preditores. É importante não alimentar a variável alvo aqui, ela será usada mais tarde.
Mas isto só será suficiente para analisar as relações entre as variáveis através do exame de diferentes gráficos. A fim de criar um modelo preditivo depois disso é construído um modelo de regressão linear que utiliza os componentes principais PC1,PC2,PC3,PC4,PC5 como variáveis de entrada (x1,x2,x3,...). E a variável alvo Y já é introduzida no modelo linear como o resultado desejado. O problema é que resNipals é algum objeto da classe "pcaRes" do pacote pcaMethods. Não consegui descobrir como fazer tudo isto com a ajuda.
Se fosse um modelo PCA do pacote do carpete, seria assim:
Mas não funciona com resNipals, em teoria o pacote pcaMethods deveria ter algumas funções próprias para trabalhar com este objeto, mas eu não encontrei nada.
Originalmente, o PCA foi concebido para resolver dois problemas:
1. há um número muito grande de preditores com um pequeno número de observações. Isto é comum na química orgânica, genética... Connosco é a utilização de dados macroeconómicos sobre grandes TFs, por exemplo, anuais.
2. Há correlações entre os preditores.
Portanto, os algoritmos PCA resolvem estes dois problemas principais:
1. Reduzir o número de preditores originais através de um novo número, muitas vezes radicalmente menor, de preditores. Ao fazê-lo, o algoritmo assegura que este pequeno número pode explicar uma certa percentagem da variabilidade do conjunto original de preditores, por exemplo, 95%. Este valor é escolhido pelo pesquisador.
2. O novo conjunto de preditores tem correlação ZERO entre si.
Segue-se que, para nós, o PCA éum dos algoritmos para preparar os dados brutos para a modelagem, mas não pode substituir a modelagem para prever a variável alvo.
Parece-me que entre a discussão dos vários detalhes do PCA, o significado das minhas observações sobre este ponto foi perdido. Portanto, deixe-me lembrá-lo: eu dei uma referência ao uso do PCA de uma forma que não só reduziu o número de preditores originais, mas também eliminou os preditores que eram ruído para a variável alvo. Que é o que está sendo discutido neste tópico.
Assim, proponho voltar ao problema do ruído entre os preditores, e o possível uso de uma ideia muito específica de aplicação de PCA para resolver este problema.
Isto irá criar resNipals (Nonlinear Estimation by Iterative Partial Least Squares) objeto com 5 componentes principais para análise de tabela de dados metabólicos Completos. Ao invés de metaboliteDataComplete, você pode substituir sua própria tabela ...........
O que você tentou é o Nipals, é mostrado na segunda foto no site, também não é muito separável, você deve tirar o da terceira foto da rede neural PCA
=========================
um pouco fora de tópico mas precisa de ajuda com o código....
Eu tenho preditores em colunas, quero calcular a diferença de todos os preditores com todas essas combinações, eu a implementei, o problema é que agora eu preciso nomear cada combinação adequadamente para entender o que é o que
Digamos que temos colunas com preditores "A". , "Б" , "С"
Eu faço combinações de diferenças
1) A - B
2) A - C
3) C - B
pergunta: como dar os nomes das novas colunas como "a_minus_b"? a_minus_c".
Estou apenas a dominar o R e a programação em geral, por isso não estou familiarizado com tais truques
O que devo acrescentar a este código?
Parece que é assim.
colnames() <- c(".", ".")
Há também nomes
Ver ajuda.
Dr. Trader:
...
Os dados são retirados de eurusd d1, classe 0 ou 1 - preço cai ou sobe para a próxima barra. Se o modelo prevê corretamente o resultado para test.csv pelo menos em 6 de cada 10 casos, então você pode tentar negociar com ele em Forex, em princípio, não perderá, mas não espere muito lucro. Se prevê corretamente em 7 de cada 10 casos (e superiores) - este é o caminho certo para o graal, temos que tentar treinar e testar o modelo em outros anos e meses, e se tudo vai ser igual - então muito bom.
...
Mais especificamente no ficheiro do relatório:
/**
* A qualidade da modelagem fora da amostra:
*
* TruePositives: 182
* TrueNegative: 181
* FalsePositivos: 1
* FalseNegative: 1
* Total de padrões em amostras com estatísticas: 365
* Total de erros de entrada fora da amostra: 2
* Sensibilidade de generalização abiliy: 99,4535519125683%
* Especificidade da capacidade de generalização: 99,45054945054946%
* Capacidade de generalização: 98,90410136311776%
* Indicador por Reshetov: 8,852456238401455
*/
É hora de construir uma equipe e criar um projeto Open Source - sistema automatizado para este fim em mql5 e Java. Vou mostrar o código fonte do classificador binário no script Java e MQL5, que cria uma amostra para modelos de treinamento.
Plano aproximado de como o complexo irá funcionar:
Se você está interessado em participar do projeto e sabe como programar em Java ou MQL5, por favor inscreva-se neste tópico.
Este exemplo é, infelizmente, de outro fio. Por exemplo, em Forex podemos sempre obter 100% dos dados, mas em outros campos onde os dados são adquiridos experimentalmente sempre haverá valores ausentes. Neste exemplo o PCA é usado para reconstruir os valores ausentes nos próprios preditores. No exemplo eles limpam aleatoriamente os valores em uma das três colunas, criam um modelo pca e o usam para reconstruir os valores ausentes.
Eu nunca tentei isso, mas tecnicamente você também poderia tratar a variável alvo como um preditor, incluindo-a no modelo pca. Então, em novos dados o seu valor será desconhecido, para que pca possa preencher esses valores em falta.
O PCA foi originalmente concebido para reduzir a dimensionalidade da série original. É isso mesmo. Usá-lo para selecionar os preditores é um disparate.
Não, está tudo bem. Como os preditores utilizados para cada um dos componentes principais são conhecidos, podemos rastrear com segurança os preditores que não são utilizados nos componentes principais. Leia isto, eu gostei: http://www.win-vector.com/blog/2016/05/pcr_part2_yaware/ Contém 5 bons preditores e dezenas de preditores de ruído. Eles peneiram o ruído com a ajuda de análises. Eu usei o mesmo código para outros exemplos encontrados neste tópico, ele geralmente funciona. Mas forex é mais complicado, eu não tenho fotos tão boas com indicadores, eu deveria pensar em algo mais inteligente.
