記事"CSSセレクタを使用した HTML ページからの構造化データの抽出"についてのディスカッション

MetaQuotes 2019.05.17 10:24

新しい記事 CSSセレクタを使用した HTML ページからの構造化データの抽出はパブリッシュされました:

この記事では、CSS セレクタに基づいて HTML ドキュメントからデータを分析および変換するための汎用的な方法について説明します。トレードレポート、テスターレポート、お気に入りの経済カレンダー、パブリックシグナル、アカウント監視、その他のオンラインクオートソースは MQL から直接利用可能になります。

トレーダーは、多くの場合、テストレポートや MetaTrader によって生成されたトレードレポートなどの標準的な HTML ファイルを扱います。時々、他のトレーダーからこのようなファイルを受信したり、インターネットからダウンロードして、さらに分析のチャート上のデータを可視化したいです。この目的に HTML からのデータは、(シンプルなケースでは CSV 形式に) 表形式のビューに変換する必要があります。

ユーティリティで CSS セレクタは、このプロセスを自動化することができます。

HTML ファイルの内部を見てみましょう。以下は MetaTrader5 トレーディングレポートの HTML コードの外観と一部です (ReportHistory ファイルは以下に添付されています)。

トレードレポートの外観と HTML コードの一部

作者: Stanislav Korotky

fxsaber 2019.03.15 09:42 #1

特定のウェブページを変換するためにCSSセレクタを設定する際にヘルプが必要な場合は、WebDataExtractor (для MetaTrader 4,MetaTrader 5用)を購入し、製品サポートの枠組みの中で推奨事項を得ることができます。しかし、ソースコードが利用可能であるため、全機能を使用したり、任意に拡張したりすることは完全に無料です。

このhtmlレポートのためのセットファイルの形成をここに示すことは可能ですか？

Maxim Kuznetsov 2019.03.15 11:10 #2

ひとつだけ言っておくと、あなたが説明しているエンティティは、大きな現実世界のどこかでXmlPathと呼ばれている :-))

少なくともそれについて言及すべきだった。

Stanislav Korotky 2019.03.15 12:48 #3

Maxim Kuznetsov:

ひとつだけ言っておくと、あなたの言うエンティティは、大きな現実世界のどこかでXmlPathと呼ばれている :-)

少なくともそれについて言及すべきだった。

最後の段落を読みましたか？

Stanislav Korotky 2019.03.15 12:51 #4

fxsaber:
このhtmlレポートのセットファイルの生成をここに示すことは可能ですか？

レポート・ライブラリによって生成されたHTMLを解析するということですか？可能ですが、このHTMLはMQLによって生成されたものなので、レポート・ライブラリが要求に応じてすぐにCSVを保存できるのであれば、なぜHTMLを解析するのかが不明です。

fxsaber 2019.03.15 12:56 #5

Stanislav Korotky:

レポート・ライブラリによって生成されたHTMLを解析するということですか？そうかもしれませんが、このHTMLはMQLによって生成されます。レポート・ライブラリがリクエストに応じてCSVを保存できるのに、なぜHTMLを解析するのでしょうか？

HTMLレポートは別の人に渡されます。

Stanislav Korotky 2019.03.15 13:49 #6

fxsaber:

HTMLレポートを別の人に渡す。

つまり、別の人のために、htmlだけでなくcsvも生成できるということです。）

何か簡単な例を挙げてもらえますか？

fxsaber 2019.03.15 14:57 #7

Stanislav Korotky:

まあ、そういうことだ。別の人のためなら、htmlだけでなくcsvも生成できる。）

htmlレポートを作る人は、csvにはあまり興味がない。さらに、htmlレポートの非個人的なバージョンがよく使われる。例えば、このようなレポートはフォーラムに投稿することができる。したがって、フォーラムの他の誰かがこのレポートを受け取り、あなたのエクストラクタを通して解析します。

何か準備ができた例を教えてください。

予告編はこちらです。

Hely Rojas 2019.05.07 20:45 #8

REGEXP ?

Stanislav Korotky 2019.05.07 23:22 #9

Hely Rojas:
REGEXP ?

CSSセレクタは、要素の階層構造を考慮したHTMLの解析にはるかに適しています。

Kaijun Wang 2023.04.29 17:39 #10

すみません、このhtmlのcssセレクタは今は使えないのでしょうか？

ソースコードをダウンロードしたのですが、書き方がコンパイルできないことがわかりました。

1 2

新しいコメント