Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 1307

 
elibrarius:

Не укладывается.

Они хоть и назвали это тестовым набором, но в описании пишут что по нему проводится валидация. Вот Максим цитату приводил:

-t

--test-set

A comma-separated list of input files that contain the validation dataset description (the format must be the same as used in the training dataset).

Omitted. If this parameter is omitted, the validation dataset isn't used.

Так валидация это и есть проверка, но я разделяю проверки на два вида - проверка модели при обучении и независимая от обучения проверка.

Проверка и тест по сути синонимы.
 
Aleksey Vyazmikin:

Так валидация это и есть проверка, но я разделяю проверки на два вида - проверка модели при обучении и независимая от обучения проверка.

Проверка и тест по сути синонимы.

 Но в пакетах применяют именно термин validation. К тому же это английский, там могут быть свои тонкости терминологии.

Для меня тест - это просто посмотреть. А валидация - принимает активное участие в процессе обучения и его остановке. Совсем не синонимы если смотреть на суть, заложенную в эти термины.

 
elibrarius:

 Но в пакетах применяют именно термин validation. К тому же это английский, там могут быть свои тонкости терминологии.

это вообще латынь ))

 
elibrarius:

 Но в пакетах применяют именно термин validation. К тому же это английский, там могут быть свои тонкости терминологии.

Для меня тест - это просто посмотреть. А валидация - принимает активное участие в процессе обучения и его остановке. Совсем не синонимы если смотреть на суть, заложенную в эти термины.

Я не знаю так глубоко английский язык. Однако, в русскоязычной части и тест и валидация часто синоним, поэтому мне нравится термин "экзаменационная выборка". К тому же для одних методов МО тест/валидация нужна непосредственно для обучения, для других же прост посмотреть. В общем, я ничего не навязываю.

 
Aleksey Vyazmikin:

Я не знаю так глубоко английский язык. Однако, в русскоязычной части и тест и валидация часто синоним, поэтому мне нравится термин "экзаменационная выборка". К тому же для одних методов МО тест/валидация нужна непосредственно для обучения, для других же прост посмотреть. В общем, я ничего не навязываю.

Как же не навязываете, если говорите, что валидационный (для всех) участок вы будете называть тестовым. И мы должны это помнить читая ваши посты. И применять вместо общпринятой международной терминологии вашу личную.

Тогда уж в конце каждого поста давайте расшифровку применяемых лично вами терминов.

 
elibrarius:
Как же не навязываете, если говорите, что валидационный (для всех) участок вы будете называть тестовым. И мы должны это помнить читая ваши посты. И применять вместо общпринятой международной терминологии вашу личную.

Тогда уж в конце каждого поста давайте расшифровку применяемых лично вами терминов.

Где этот ISO стандарт для применения?

Да, и я каждый раз стараюсь писать о какой выборке идет речь, именно от того, что знаю особенности кэтбуста.

 
Aleksey Vyazmikin:

Где этот ISO стандарт для применения?

Да, и я каждый раз стараюсь писать о какой выборке идет речь, именно от того, что знаю особенности кэтбуста.

ISO не для всего выпускают.) В данном случае можно ориентироваться на то, как в пактах МО называют 2-й участок.

В используемом вами  катбусте хоть и написали test, в пояснении пишут, что применяется для валидации. В других пакетах XGBoost, Darch - пишут сразу validation.

 
Aleksey Vyazmikin:

Так валидация это и есть проверка, но я разделяю проверки на два вида - проверка модели при обучении и независимая от обучения проверка.

Проверка и тест по сути синонимы.

Валидационный набор участвует в обучении. По нему при обучении настраивают параметры модели. В некоторых пакетах не требуется валидационный набор, в этом случае обучающий набор при обучении разделяется на train/valid в какой то пропорции в самой функции fit(). Но лучше задать самому.

На тестовом наборе проверяется качество обученной модели и этих данных модель не должна была видеть при обучении.

Поэтому это все таки разные вещи, не нужно путать.

Удачи

 
elibrarius:

ISO не для всего выпускают.) В данном случае можно ориентироваться на то, как в пактах МО называют 2-й участок.

В используемом вами  катбусте хоть и написали test, в пояснении пишут, что применяется для валидации. В других пакетах XGBoost, Darch - пишут сразу validation.

Изначально было тестовое и обучающее множество, появился метод кроссвалидации и выборку такую стали называть валидационной (на ней фактически перекресно проводится обучение и тестирование). Теперь появился бустинг, которому нужна выборка для остановки обучения - её назвали тестовой, и она же является валидационной в силу её применения для проверки результатов обучения, но на ней не происходит обучения, в отличии от кроссвалидации.

Я к тому, что у разных методов обучения выборка может использоваться по разному. Валидация это скорей действие, чем тип выборки...

 
Vladimir Perervenko:

Валидационный набор участвует в обучении. По нему при обучении настраивают параметры модели. В некоторых пакетах не требуется валидационный набор, в этом случае обучающий набор при обучении разделяется на train/valid в какой то пропорции в самой функции fit(). Но лучше задать самому.

На тестовом наборе проверяется качество обученной модели и этих данных модель не должна была видеть при обучении.

Поэтому это все таки разные вещи, не нужно путать.

Удачи

Хорошо, пусть так и будет. У меня нет статистики по высказываниям сотни лиц участвующих в создании разных методов МО, нет желания спорить, так как изначально я говорил о том, как удобно мне разделять понятия в уме, а коли иным это не удобно, то пусть я останусь один со своими понятиями.

Причина обращения: