記事"CSSセレクタを使用した HTML ページからの構造化データの抽出"についてのディスカッション

 

新しい記事 CSSセレクタを使用した HTML ページからの構造化データの抽出 はパブリッシュされました:

この記事では、CSS セレクタに基づいて HTML ドキュメントからデータを分析および変換するための汎用的な方法について説明します。 トレードレポート、テスターレポート、お気に入りの経済カレンダー、パブリックシグナル、アカウント監視、その他のオンラインクオートソースは MQL から直接利用可能になります。

トレーダーは、多くの場合、テストレポートや MetaTrader によって生成されたトレードレポートなどの標準的な HTML ファイルを扱います。 時々、他のトレーダーからこのようなファイルを受信したり、インターネットからダウンロードして、さらに分析のチャート上のデータを可視化したいです。 この目的に HTML からのデータは、(シンプルなケースでは CSV 形式に) 表形式のビューに変換する必要があります。

ユーティリティで CSS セレクタは、このプロセスを自動化することができます。

HTML ファイルの内部を見てみましょう。 以下は MetaTrader5 トレーディングレポートの HTML コードの外観と一部です (ReportHistory ファイルは以下に添付されています)。

トレードレポートの外観と HTML コードの一部

作者: Stanislav Korotky

 
特定のウェブページを変換するためにCSSセレクタを設定する際にヘルプが必要な場合は、WebDataExtractor (для MetaTrader 4,MetaTrader 5用)を購入し、製品サポートの枠組みの中で推奨事項を得ることができます。しかし、ソースコードが利用可能であるため、全機能を使用したり、任意に拡張したりすることは完全に無料です。
このhtmlレポートの ためのセットファイルの形成をここに示すことは可能ですか?
 

ひとつだけ言っておくと、あなたが説明しているエンティティは、大きな現実世界のどこかでXmlPathと呼ばれている :-))

少なくともそれについて言及すべきだった。

 
Maxim Kuznetsov:

ひとつだけ言っておくと、あなたの言うエンティティは、大きな現実世界のどこかでXmlPathと呼ばれている :-)

少なくともそれについて言及すべきだった。

最後の段落を読みましたか?

 
fxsaber:
このhtmlレポートの セットファイルの生成をここに示すことは可能ですか?

レポート・ライブラリによって生成されたHTMLを解析するということですか?可能ですが、このHTMLはMQLによって生成されたものなので、レポート・ライブラリが要求に応じてすぐにCSVを保存できるのであれば、なぜHTMLを解析するのかが不明です。

 
Stanislav Korotky:

レポート・ライブラリによって生成されたHTMLを解析するということですか?そうかもしれませんが、このHTMLはMQLによって生成されます。レポート・ライブラリがリクエストに応じてCSVを保存できるのに、なぜHTMLを解析するのでしょうか?

HTMLレポートは別の人に渡されます。

 
fxsaber:

HTMLレポートを別の人に渡す。

つまり、別の人のために、htmlだけでなくcsvも生成できるということです。)

何か簡単な例を挙げてもらえますか?

 
Stanislav Korotky:

まあ、そういうことだ。別の人のためなら、htmlだけでなくcsvも生成できる。)

htmlレポートを作る人は、csvにはあまり興味がない。さらに、htmlレポートの非個人的なバージョンがよく使われる。例えば、このようなレポートはフォーラムに投稿することができる。したがって、フォーラムの他の誰かがこのレポートを受け取り、あなたのエクストラクタを通して解析します。

何か準備ができた例を教えてください。

予告編はこちら です。

 
REGEXP ?
 
Hely Rojas:
REGEXP ?

CSSセレクタは、要素の階層構造を考慮したHTMLの解析にはるかに適しています。

 

すみません、このhtmlのcssセレクタは今は使えないのでしょうか?

ソースコードをダウンロードしたのですが、書き方がコンパイルできないことがわかりました。