Aleksey Vyazmikin：

マキシム、これどうやってセットアップするんだ？

id_tlとは？

わからない、リンクが欲しい。

変換された例の id_tl は，もしかしたら単に

Aleksey Vyazmikin：

ありがとうございました。すべてうまくいった。

私はそれが正しいと思う - テストでちょうどコントロールに行くので、唯一の変換を訓練する - ので、私はやったが、結果は非常に奇妙である - テストサンプルでエラーloglossが1を超え、成長 - これは全くあり得ない - 私はショックを受けています。

いろいろと試してみてください。

これは良いノートブックです https://www.kaggle.com/rafjaa/resampling-strategies-for-imbalanced-datasets

をコピーしてテストすることができます。

マキシム・ドミトリエフスキー

わからない、リンクが欲しい。

おそらく、変形した例の特質は、ちょうど

同じ記事 です。そこでは何も明らかではありません。

Aleksey Vyazmikin：

同じ記事 であることに変わりはないのですが、そこは何もクリアになっていません。

をコピーしたもので、オリジナルへのリンクがあります。

 
マキシム・ドミトリエフスキー

いろいろと試してみてください。

これは良いノートブックです https://www.kaggle.com/rafjaa/resampling-strategies-for-imbalanced-datasets

をコピーして確認することができます。

これが、私が見ていたロシア語の記事の原文なんですね。

 
マキシム・ドミトリエフスキー

というのはコピー編集で、オリジナルへのリンクを貼りました。

しかし、何の役にも立たない。どうせ情報はない。コードは破られてしまった。

Aleksey Vyazmikin：

何の役に立つのか--まだ情報はない--コードは破られている。

そこには、すべてが完璧に書かれているのです。アンバランスクラスはないのですが、見るからに人為的に作っていたようで

 
マキシム・ドミトリエフスキー

がすべて完璧に書かれています。アンバランスクラスはないのですが、見るからに人為的に作ったもので


Tomek links "メソッドは、単にサンプルを均等化しないことが判明しました。Null行の数が4005から3402に減ったので、効果がないのだと思っていました。
Aleksey Vyazmikin：


Tomek links "メソッドは、サンプルを均等化しないことが判明したのです。
オーバーサンプリングが先で、その後にトドメを刺すのです。
 
Maxim Dmitrievsky：
うんうん。まずオーバーサンプリング、次にボリューム

これまでのところ、オーバーサンプリングでは何も得られませんが、「tome」によって結果が少し改善されました。これは、データに何かあるということで、重要なのはきちんと掘り下げることです。

サンプルに量子化設定の異なるモデルを適用した場合のヒストグラム。


