Reunir uma equipe para desenvolver uma IO (árvore de decisão/floresta) em relação às estratégias de tendência - página 12

 
Se um milagre acontecer e a equipe se reunir, teremos que escolher um algoritmo de aprendizado e um método para avaliar o modelo.
 
Roffild:
Se um milagre acontecer e a equipe se reunir, teremos que escolher um algoritmo de aprendizado e um método para avaliar o modelo.

Eu posso mordiscar um grupo de reflexão.

 
Aleksey Vyazmikin:

...terei que pensar em um site alternativo. Talvez alguém conheça um semelhante? Estou pensando em algo como um quadro onde você possa compartilhar fotos e editá-las de alguma forma, uma sala de bate-papo separada e algo como um reservatório de idéias inteligentes...

Por exemplo. Eles também têm um repositório para compartilhar o código. Eles também têm uma aplicação móvel. Imho, um serviço muito útil.

Trello
Trello
  • trello.com
Выбросьте длинные цепочки электронных писем, устаревшие таблицы, не такие уж и клейкие стикеры и неуклюжие программы для управления проектами. Trello помогает увидеть все детали проекта с первого взгляда. Зарегистрироваться – Это бесплатно.
 
Roffild:

Para avaliar a qualidade do modelo (rede ou floresta), são utilizados valores de erro de MSE, OOB, etc.

Mas ao contrário do reconhecimento de imagens, onde um humano é a amostra de verificação , é muito difícil fazer tal amostra por uma tabela de preços. Portanto, a estimativa de um modelo de preço pela MSE, OOB, etc. é muitas vezes mal interpretada.

Não há uma definição clara de "sobreajustar" o modelo.

Então, parei de verificar o modelo pela MSE, OOB, etc.

Agora prefiro sobrepor o resultado do treinamento na tabela de preços para ver o quadro completo.

Aqui está meu método de avaliação da qualidade do modelo (eu já publiquei esta foto):


IMHO, o que é necessário não é uma imagem, mas uma métrica objetiva e quantitativa, e se estamos falando de uma avaliação compreensível do consumidor sobre a qualidade do modelo para comercialização, então você pode medi-lo através de um sinal de produtividade, por exemplo.


 
Dennis Kirichenko:

Por exemplo. Um repositório para compartilhamento de códigos também está conectado. Eles também têm um aplicativo móvel. Imho, um serviço muito útil.

Hm... obrigado pela dica, serviço muito interessante. Você usa a versão gratuita? Você pode conectar tantas extensões quantas quiser?

 
Roffild:

Agora eu prefiro sobrepor o resultado do treinamento na tabela de preços para ver o quadro completo.

Aqui está meu método de avaliação da qualidade do modelo (eu já publiquei esta foto):

Diga-me como ler este quadro no porão. Você tem quantos alvos (vejo apenas uma divergência de 4 pontos - 4 alvos?), entendo corretamente que as previsões ocorrem no início da barra (então por que a abertura não coincide ou estou lendo mal o gráfico?) por uma barra?

A visualização é útil para o processo de pensamento, mas sem expressar estas divergências em números é impossível automatizar o processo de estimação do modelo para a mesma função de adequação.

 
Roffild:
Se um milagre acontecer e a equipe se reunir, você terá que escolher um algoritmo de aprendizado e um método para avaliar o modelo.

Você está na equipe ou não?

 
Алексей Тарабанов:

Eu posso fazer um pouco de grupo de reflexão.

OK, vamos colocar as coisas dessa maneira...

 
Dennis Kirichenko:

Por exemplo. Um repositório para compartilhamento de códigos também está conectado. Eles também têm um aplicativo móvel. Imho, um serviço muito útil.

Obrigado, terei que estudar o serviço. Ou dê uma olhada nos projetos existentes com base nisso.

 

Compartilharei minhas idéias sobre a avaliação dos modelos MoD.

Não sei se existe tal coisa como um herbário no MO, mas continuarei a usá-lo. No caso de alguém não entender, um herbário é uma coleção de boas folhas de árvores e uma folha ou muitas podem ser coletadas de uma árvore. Este modelo tem uma desvantagem ao votar - o número de folhas descrevendo um fenômeno (alvo) em diferentes momentos de tempo será diferente, ou seja, se representarmos a amostragem como um campo, verifica-se que as folhas estão dispersas em diferentes conjuntos no campo, o que afeta a qualidade do voto. Portanto, acho que para estimar este modelo (o método funciona para florestas, mas é mais primitivo, a ênfase deve ser colocada apenas na capacidade de previsão no campo) é necessário apresentar cada folha (árvore) como uma camada, sobrepor estas camadas umas sobre as outras e onde as folhas se sobrepõem calcular a capacidade de previsão média adicionando fator que afeta o produto dependendo do número de folhas (não necessário para as florestas), então olhar o mapa resultante e estimar sua uniformidade. Tal mapa pode ser avaliado de diferentes maneiras, adicionando o terceiro espaço - por vértices, ou usando o método do mapa Kohonen - por cor - para maior clareza, e para encontrar a média geral e o RMS deste mapa. Então podemos ver a qualidade do modelo, quão forte é seu poder preditivo sobre toda a amostra, não apenas sobre o agregado. Tal estimativa poderia ajudar a função de aptidão a procurar áreas de melhoria da folha/árvore da amostra com baixo poder de previsão médio.

O que você acha?

Ou eu não estou me fazendo entender novamente?

Razão: