記事についてのディスカッション - ページ 7

 
これは完全に間違ったアプローチだ。同じトレーニングデータセットとテストデータセットに基づいてモデルを生成することはできない。それはモデルのカーブフィッティングと呼ばれるものだ。そのようなモデルは紙の上ではよく見えますが、現実の世界では決して機能しません。機械学習にはいくつかの方法がありますが、あなたのやり方は完全に間違っています。
 
Jacob James:
これは完全に間違ったアプローチだ。同じトレーニングデータセットとテストデータセットに基づいてモデルを生成することはできない。それはモデルのカーブフィッティングと呼ばれるものだ。そのようなモデルは紙の上ではよく見えますが、現実の世界では決して機能しません。機械学習にはいくつかの方法がありますが、あなたのやり方は完全に間違っています。

二人とも完全に間違っていると思うよ。素朴なアプローチ」と書かれた記事は、CatBoostモデルの紹介です。誰も新しいデータでモデルをテストすることを禁じてはいない。記事の最後にも、新しいデータでのテストと学習 期間が書かれている。

次のパートが控えているので、記事をもっと注意深く読んでほしい。
 
Maxim Dmitrievsky:

あなたがここでやっていることを理解する間に、私は目を焼いてしまったに違いない。すべてが不可能なまでにシンプルなのに、それでも他人の考えを察するのは難しい......。

何と言えばいいのだろう?

1) サインは間違いなくベストではない、大きな幅がある。

2) 分類器を訓練する前にデータを混合する必要はない(私はそれを確認した)。

3) 本当に価値があるのはターゲットであり、記事全体を引っ張っているのはターゲットである(ZZと比較したが、ZZはゴミだ)。


一般的に、このアプローチは次のようなものであることがわかった - 最大限のすべての "検証で良い結果を得るためだけに動く"

そして最良のモデルを選択する )))))

そして、私はこの方法で何とか「動く」ことができた。

しかし実際には、ニューロニクスの重みを最適化したときに話したのと同じ方法で、最大限の利益を得るためにすぐに「動いた」だけなのだ。

さて、他に何を書けばいいのやら...。

 
mytarmailS:

あなたがここで何をしているのか理解する間、私は目を焼いたに違いない。すべてが不可能なまでにシンプルなのに、それでも他人の考えを理解するのは難しい...。

なんて言ったらいいんだろう。

1) サインはベストではない、大きなスペースがある。

2) 分類器をトレーニングする前に、データをシャッフルする必要はない。

3) 本当に価値があるのはターゲットであり、記事全体を引っ張るものである(ZZと比較すると、ZZはゴミである)。


一般的に、アプローチは次のようになった - 「検証で良い結果を得るために、可能な限りすべてを動かす」。

そして最良のモデルを選択する ))))

そして、私はこのように「動かす」ことに成功した。

しかし実際は、私がニューロンキーの重みを最適化したときに話していたのと同じ方法で、ただ利益を最大にするために動かしただけなのだ。

さて、他に何を書けばいいのやら...。

GMMを使わないとそうはいかない。それに、トレーニングできるインターバルがどれだけ短いか、新しいデータでモデルがどれだけ長生きするかもわかっていない。それは限界ではなく、寿命を延ばす方法があります。アプローチ全体は有機的なもので、パーツを切り離すことはできない。

そう、もっと意味のあるものを試すことができる。それを使い、改善する

 
Maxim Dmitrievsky:

GMMなしではそうはいかない。さらに、どれくらいの短いインターバルでトレーニングできるのか、新しいデータでモデルがどれくらいの期間使えるのかをチェックしていない。それが限界ではなく、寿命を延ばす方法がある。アプローチ全体は有機的なものであり、部分を切り離すことはできない。

そう、より有意義なものを試すことができる。それを使い、改良する

明日、gmmで試してみるよ。

 
mytarmailS:

明日、gmmで試してみるよ。

ああ、あなたが書いた記事ね。じゃあ、そうだね。入門的なものだから、読者の頭を完全に吹き飛ばさないようにね。
 
Maxim Dmitrievsky:
ああ、あなたが書いた記事ね。そうだよ。読者が完全に道を踏み外してしまわないための紹介記事なんだ。

ああ、順番に見ていこうと思ったんだ

 
一般的に、シャッフルがないと、システムはすぐに予想通りの消耗を始める。
 
Александр:
一般的に、シャッフルがないと、システムはすぐに予想通りに消耗し始めます。

次の記事へ

 
自分で作るか、提供されたものを使うか、どちらかです。 以下のエラーが あります