Обсуждение статьи "Извлечение структурированных данных из HTML-страниц с помощью CSS-селекторов"

MetaQuotes 2019.03.15 09:25

Опубликована статья Извлечение структурированных данных из HTML-страниц с помощью CSS-селекторов:

В статье описан универсальный метод анализа и конвертации данных из HTML-документов, основанный на CSS-селекторах. Торговые отчеты, отчеты тестера, ваши любимые экономические календари, публичные сигналы и мониторы счетов, дополнительные источники онлайн котировок - все это становится доступным из MQL.

Трейдерам хорошо знакомы некоторые стандартные HTML-файлы, например, отчеты тестирования и торговые отчеты, которые генерирует MetaTrader. Иногда мы получаем такие файлы от знакомых или скачиваем из интернета и хотим проанализировать на графике, для чего необходимо преобразовать данные из HTML в табличный вид, в простейшем случае — в CSV-формат.

CSS-селекторы в нашей утилите позволяют это сделать автоматически.

Заглянем внутрь HTML-файлов. Вот внешний вид и часть HTML-кода торгового отчета MetaTrader 5 (файл ReportHistory.html, прилагается).

Внешний вид и часть HTML-кода торгового отчета

Внешний вид и часть HTML-кода торгового отчета

Автор: Stanislav Korotky

fxsaber 2019.03.15 09:42 #1

Если Вам потребуется помощь в настройке CSS-селекторов для конвертации конкретной веб-страницы, Вы можете приобрести WebDataExtractor (для MetaTrader 4, для MetaTrader 5) и получить рекомендации в рамках поддержки продукта. Однако наличие исходных кодов позволяет использовать весь функционал и произвольно расширять его абсолютно бесплатно.

Возможно ли, чтобы Вы показали здесь формирование set-файла для этого html-отчета?

Maxim Kuznetsov 2019.03.15 11:10 #2

только одно замечание - сущность которую вы описываете , где-то в большом реальном мире зовётся XmlPath :-)

хотя-бы упомянуть надо было.

Stanislav Korotky 2019.03.15 12:48 #3

Maxim Kuznetsov:

только одно замечание - сущность которую вы описываете , где-то в большом реальном мире зовётся XmlPath :-)

хотя-бы упомянуть надо было.

Вы последний абзац читали?

Stanislav Korotky 2019.03.15 12:51 #4

fxsaber:
Возможно ли, чтобы Вы показали здесь формирование set-файла для этого html-отчета?

Имеется в виду, распарсить HTML, генерируемый библиотекой Report? Возможно, но этот HTML генерится MQL-ем, так что не понятно, зачем парсить HTML, если библиотека Report может сама сразу сохранять CSV по запросу?

fxsaber 2019.03.15 12:56 #5

Stanislav Korotky:

HTML-отчет передается другому лицу.

Stanislav Korotky 2019.03.15 13:49 #6

fxsaber:

HTML-отчет передается другому лицу.

Ну, так и я про то же: если для другого лица, то можно сгенерить не только html, но и csv ;-).

Можете дать какой-нибудь готовый пример?

fxsaber 2019.03.15 14:57 #7

Stanislav Korotky:

Ну, так и я про то же: если для другого лица, то можно сгенерить не только html, но и csv ;-).

Тот, кто делает html-отчет, не особо заинтересован в довеске в виде csv. Более того, часто задействуется обезличенный вариант html-отчета. Например, такой может выкладываться на форум. Соответственно, кто-то другой с форума берет этот отчет и парсит через Ваш экстрактор.

Можете дать какой-нибудь готовый пример?

Здесь в прицепе.

Нужен код простого мониторинга Параметры эксперта в отчете Что наделал сигнальный сервис.

Hely Rojas 2019.05.07 20:45 #8

REGEXP ????

Stanislav Korotky 2019.05.07 23:22 #9

Hely Rojas:
REGEXP ????

Для прасинга HTML с учетом иерархии элементов CSS-селекторы приспособлены гораздо лучше.

Kaijun Wang 2023.04.29 17:39 #10

Извините, этот html css-селектор сейчас недоступен?

Я скачал исходный код, но обнаружил, что метод записи не может быть скомпилирован.

1 2

Новый комментарий