Discusión sobre el artículo "Extrayendo datos estructurados de las páginas HTML usando los selectores CSS"

 

Artículo publicado Extrayendo datos estructurados de las páginas HTML usando los selectores CSS:

En este artículo, se describe un método universal para analizar y convertir los datos de documentos HTML basados en los selectores CSS. Ahora, en MQL tenemos disponibles los informes comerciales y del Simulador de Estrategias, los calendarios económicos preferibles, señales públicas y monitoreo de cuentas, fuentes adicionales de las cotizaciones en línea.

Los traders conocen muy bien algunos archivos HTML estándar, por ejemplo, los informes de la simulación e informes comerciales generados por MetaTrader. A veces recibimos estos archivos de los conocidos o los bajamos de Internet, y queremos analizarlos en el gráfico, para lo cual necesitamos convertir los datos de HTML en una tabla, o en el caso más simple, en formato CSV.

Los selectores CSS en nuestra utilidad no permiten hacerlo automáticamente.

Echamos un vistazo adentro de los archivos HTML. Aquí está la apariencia y una parte del código HTML de un informe de MetaTrader 5 (el archivo ReportHistory.html se adjunta).

Apariencia y parte del código HTML del informe comercial

Autor: Stanislav Korotky

 
Si necesita ayuda para configurar selectores CSS para convertir una página web específica, puede adquirir WebDataExtractor (для MetaTrader 4, para MetaTrader 5) y obtener recomendaciones en el marco del soporte del producto. Sin embargo, la disponibilidad de los códigos fuente le permite utilizar toda la funcionalidad y ampliarla arbitrariamente de forma totalmente gratuita.
¿Es posible que muestre aquí la formación de un set-file para este informe html?
 

sólo una observación - la entidad que estás describiendo se llama XmlPath en algún lugar del gran mundo real :-))

al menos deberías haberlo mencionado.

 
Maxim Kuznetsov:

sólo una observación - la entidad que describes se llama XmlPath en algún lugar del gran mundo real :-)

al menos deberías haberlo mencionado.

¿Has leído el último párrafo?

 
fxsaber:
¿Es posible que muestre aquí la generación del archivo set para este informe html?

¿Se refiere a analizar el HTML generado por la biblioteca de informes? Es posible, pero este HTML es generado por MQL, por lo que no está claro, ¿por qué analizar HTML, si la biblioteca de informes puede guardar inmediatamente CSV a petición?

 
Stanislav Korotky:

¿Se refiere a analizar el HTML generado por la biblioteca de informes? Tal vez, pero este HTML es generado por MQL, así que ¿por qué analizar HTML cuando la biblioteca de informes puede guardar CSV a petición?

El informe HTML se pasa a otra persona.

 
fxsaber:

El informe HTML se pasa a otra persona.

Bueno, eso es lo que quiero decir: si para otra persona, puede generar no sólo html, sino también csv ;-).

¿Puede dar algún ejemplo listo?

 
Stanislav Korotky:

Bueno, a eso me refiero: si es para otra persona, puedes generar no sólo html, sino también csv ;-).

La persona que hace un informe html no está realmente interesada en el csv. Además, a menudo se utiliza una versión impersonal del informe html. Por ejemplo, un informe de este tipo puede publicarse en un foro. En consecuencia, otra persona del foro toma este informe y lo analiza a través de su extractor.

¿Puede dar algún ejemplo?

Aquí en el trailer.

 
REGEXP ????
 
Hely Rojas:
REGEXP ????

Los selectores CSS son mucho más adecuados para el análisis sintáctico de HTML, teniendo en cuenta la jerarquía de elementos.

 

Disculpe, ¿este selector html css no está disponible ahora?

He descargado el código fuente, pero encontré que el método de escritura no se puede compilar.