Discussão do artigo "Florestas Aleatórias na Previsão das Tendências" - página 2

 

É claro que seria correto contar tudo em ordem sobre a linguagem R, modelos de aprendizado de máquina em exemplos concretos e com implementações reais em conjunto com a MCL. Não está claro como organizar isso. Apenas um tópico, uma série de artigos com discussões? Não tenho certeza de que a administração esteja interessada. Vou preparar uma proposta. Vamos ver como eles reagem.

É mais importante saber se o público leitor está interessado nesse tópico.

A maioria dos leitores aqui são programadores e estão profundamente imersos nas profundezas do C. Eles são agradáveis e confortáveis lá.

Vou pensar sobre isso.

 
vlad1949:

É claro que seria correto contar tudo em ordem sobre a linguagem R, modelos de aprendizado de máquina em exemplos concretos e com implementações reais em conjunto com a MCL. Não está claro como organizar isso. Apenas um tópico, uma série de artigos com discussões? Não tenho certeza de que a administração esteja interessada. Vou preparar uma proposta. Vamos ver como eles reagem.

É mais importante saber se o público leitor está interessado nesse tópico.

A maioria dos leitores aqui são programadores e estão profundamente imersos nas profundezas do C. Eles são agradáveis e confortáveis lá.

Vou pensar sobre isso.

É apenas uma questão de curso. Abrimos um tópico e isso é tudo. No quarto fórum, tenho vários tópicos sobre econometria. Eu simplesmente fiquei entediado.

E há uma base aqui. O fórum está cheio de pessoas que trabalham com redes neurais. Acho que um material que mostrasse que a NS não é uma dádiva de Deus atrairia esse público. Especialmente se eles perceberem que é possível aumentar o fator de lucro algumas vezes alterando o modelo. E essas pessoas estão muito preparadas.

Se estivermos falando de educação em russo, tenho duas traduções da documentação, além de ter escrito um livro (390 p) sobre o Rattle e a ideologia dos modelos usados nele.

 
faa1947:

É apenas uma coisa aberta e fechada. Abrimos um tópico e pronto. Tenho vários tópicos sobre econometria no quarto fórum. Eu simplesmente fiquei entediado.

E a base está aqui. O fórum está cheio de pessoas que trabalham com redes neurais. Acho que um material que mostrasse que a NS não é uma dádiva de Deus atrairia esse público. Especialmente se eles perceberem que é possível aumentar o fator de lucro algumas vezes alterando o modelo. E essas pessoas estão muito preparadas.

Se estivermos falando de educação em russo, tenho duas traduções da documentação, além de ter escrito um livro (390 p) sobre o Rattle e a ideologia dos modelos usados nele.

Vou terminar o artigo neste fim de semana e enviá-lo para revisão. Depois disso, veremos.

Que tópicos você sugere que analisemos? Em que ordem? Você já pensou sobre isso? Se começarmos, deveríamos começar com uma descrição do idioma. Pelo menos um fluente.

Escrever leva muito tempo. Deve haver motivação.

Vamos pensar sobre isso juntos. Teremos que reunir algumas pessoas do último tópico.

Boa sorte

 
vlad1949:

Vou terminar o artigo neste fim de semana e enviá-lo para revisão. Depois disso, veremos.

Que tópicos você sugere que analisemos? Em que ordem? Você já pensou sobre isso? Se começarmos, deveríamos começar com uma descrição do idioma. Pelo menos um fluente.

Escrever consome muito tempo. Você precisa estar motivado.

Vamos pensar sobre isso juntos. Teremos que reunir algumas pessoas do último tópico.

Boa sorte.

1. Provavelmente da linguagem, mas: pegar o mínimo e, se possível, apenas análogos do MKL, para que as pessoas possam ver - não há dificuldades, ainda mais conveniente por causa do intérprete. Por exemplo, restringir o conceito de "objeto" ao MKL, substituir operações de matriz por loops, se possível - em geral, simplificar.

2. Para mim, a motivação é a busca de novas ideias. No último fórum do econmodel, obtive o problema que ocorre em amostras consecutivas. Consegui repeti-lo e resolvê-lo. Acabou sendo uma questão de princípio. Em geral, precisamos nos reunir.

PS. O número de participantes do fórum que cancelaram a interface com o R ultrapassou 1000! É verdade que, anteriormente, todos eles estavam no fórum quatro. Portanto, a pergunta sobre qual fórum abrir.

 
Erro 0,15, o que significa 85% de chance de adivinhar a tendência! O andaime em si não é um fim em si mesmo, nosso objetivo é ganhar dinheiro. O que a feira mostrou? Existe um gráfico de equilíbrio?
 
wmlab:
Erro 0,15, o que significa 85% de chance de adivinhar a tendência! O andaime em si não é um fim em si mesmo, nosso objetivo é ganhar dinheiro. O que a feira mostrou? Existe um gráfico de balanço?

O principal problema dos modelos preditivos é a seleção dos dados iniciais. O Rattle é uma ferramenta muito conveniente para resolver esse problema, e o artigo é voltado para isso.

Estou disposto a discutir os dados brutos para obter uma estimativa. Se alguém fornecer um arquivo csv de origem, estou pronto para fazer os cálculos e publicar o resultado aqui.

Qualquer outra coisa está além do escopo do artigo.

 

Como posso ver o conjunto completo de valores de variáveis independentes e dependentes? Ele pode ser postado em um arquivo separado em formato de tabela ou texto?

 
Demi:

Como posso ver o conjunto completo de valores das variáveis independentes e dependentes? Não é possível colocá-lo em um arquivo separado em formato de tabela ou texto?

Acho que sim (anexo), embora eu já tenha esquecido o artigo.

Por que não tenta fazer isso você mesmo? O arquivo anexo é deliberadamente redundante para que o leitor possa não apenas repetir os cálculos do artigo, mas também verificar suas ideias.

Arquivos anexados:
ForMQL_1.zip  12 kb
 
faa1947:

Acho que sim (anexo), embora eu já tenha esquecido o artigo.

Por que não tenta você mesmo? O anexo ao artigo é deliberadamente redundante para que o leitor possa não apenas repetir os cálculos do artigo, mas também verificar suas ideias.

Provavelmente porque "eu mesmo tentei" e os resultados são diferentes e não para melhor? Faz sentido, não faz?

Não, é o conjunto original de todas as variáveis que é necessário - talvez eu não tenha as mesmas variáveis independentes

 
Demi:

Provavelmente porque eu mesmo "tentei" e os resultados são diferentes e não para melhor? Faz sentido, não faz?

Não, é o conjunto original de todas as variáveis que é necessário - talvez eu não tenha as mesmas variáveis independentes

No anexo acima, os resultados, e enfatizo, são muito semelhantes aos do artigo. Por que "semelhantes"? Todos os algoritmos de floresta aleatória envolvem um sensor de números aleatórios (isso é considerado uma virtude do algoritmo), portanto, os resultados podem ser semelhantes, mas não muito diferentes.

Seria interessante ver seu resultado.

Quanto à estimativa do valor znA das variáveis no algoritmo de floresta aleatória. Não consegui usá-lo (embora isso não seja um indicador - apenas experiência). Há outros algoritmos mais construtivos e, se você os seguir, poderá melhorar seriamente o resultado.

Em geral, o artigo acima é uma janela para o mundo dos modelos de classificação. É apenas uma tentativa rápida e uma avaliação. E, em seguida, o trabalho tedioso e maçante de selecionar preditores.