Discussão do artigo "Extraindo dados estruturados de páginas HTML através de seletores CSS"

 

Novo artigo Extraindo dados estruturados de páginas HTML através de seletores CSS foi publicado:

O artigo descreve um método universal para analisar e converter dados de documentos HTML com base em seletores CSS. Em MQL estão disponíveis relatórios de negociação e de teste, calendários econômicos, sinais públicos e monitoramento de contas, fontes de cotações on-line adicionais.

Os traders estão familiarizados com alguns arquivos HTML padrão, como relatórios de teste e relatórios de negociação gerados pelo MetaTrader. Às vezes, recebemos esses arquivos de conhecidos ou os baixamos da Internet e queremos analisar num gráfico, para o qual precisamos converter dados de HTML para uma exibição de tabela, no caso mais simples, para o formato CSV.

Os seletores CSS em nosso utilitário permitem fazer isso automaticamente.

Olhemos dentro dos arquivos HTML. Aqui está a aparência e parte do código HTML de um relatório de negociação do MetaTrader 5 (arquivo ReportHistory.html, em anexo).

Aparência e parte do código HTML do relatório de negociação

Autor: Stanislav Korotky

 
Se precisar de ajuda para configurar seletores CSS para converter uma página da Web específica, você poderá adquirir o WebDataExtractor (для MetaTrader 4, para o MetaTrader 5) e obter recomendações no âmbito do suporte ao produto. No entanto, a disponibilidade dos códigos-fonte permite que você use toda a funcionalidade e a amplie arbitrariamente de forma absolutamente gratuita.
É possível que você mostre aqui a formação de um arquivo de conjunto para esse relatório html?
 

Apenas uma observação: a entidade que você está descrevendo é chamada XmlPath em algum lugar do grande mundo real :-))

você deveria ter pelo menos mencionado isso.

 
Maxim Kuznetsov:

Apenas uma observação - a entidade que você descreve é chamada de XmlPath em algum lugar do grande mundo real :-)

você deveria ter pelo menos mencionado isso.

Você leu o último parágrafo?

 
fxsaber:
É possível mostrar aqui a geração do arquivo definido para esse relatório html?

Você quer dizer analisar o HTML gerado pela biblioteca de relatórios? É possível, mas esse HTML é gerado pelo MQL, portanto, não está claro por que analisar o HTML, se a biblioteca de relatórios pode salvar imediatamente o CSV quando solicitado?

 
Stanislav Korotky:

Você está querendo analisar o HTML gerado pela biblioteca de relatórios? Talvez, mas esse HTML é gerado pelo MQL, então por que analisar HTML quando a biblioteca de relatórios pode salvar CSV mediante solicitação?

O relatório HTML é passado para outra pessoa.

 
fxsaber:

O relatório HTML é passado para outra pessoa.

Bem, é isso que quero dizer: se para outra pessoa, você pode gerar não apenas html, mas também csv ;-).

Você pode dar algum exemplo pronto?

 
Stanislav Korotky:

Bem, é isso que quero dizer: se for para outra pessoa, você pode gerar não apenas html, mas também csv ;-).

A pessoa que faz um relatório em html não está realmente interessada em csv. Além disso, uma versão impessoal do relatório em html é usada com frequência. Por exemplo, esse relatório pode ser publicado em um fórum. Assim, outra pessoa do fórum pega esse relatório e o analisa por meio de seu extrator.

Você pode dar algum exemplo pronto?

Aqui no trailer.

 
REGEXP ????
 
Hely Rojas:
REGEXP ????

Os seletores CSS são muito mais adequados para a análise de HTML, levando em conta a hierarquia dos elementos.

 

Desculpe-me, esse seletor html css não está disponível agora?

Fiz o download do código-fonte, mas descobri que o método de gravação não pode ser compilado.