ニューラルネットと入力 - ページ 38

 

こんにちは。

それだけではありません。ada、randomForest(様々なバリエーション)、C50などを使っています。しかし、最良の結果は、もちろん、CORElearnのadaとrfNear()から得られます。高く評価されているsvmは、(学習に非常に時間がかかるということを除いて)何の利点も示していない。その重要性を軽視することなく、もしかしたら、うまく調理できなかったのかも?

作業の順序は以下の通りです。入力データの 有意性を確認し、各モデルの最適なパラメータを決定します。3種類のモデルによる計算とキャリブレーション、単純な投票による決定。初期サンプル1000本で、250本でも再トレーニングなしで安定に動作する。精度管理、推定。

主成分法による入力データの評価だけでなく、前処理方法の結果への影響を推定し、最適な方法を選択するパッケージも存在する。時間がないので、まだマスターしていません。でも、これからも勉強していきます。

頑張ってください。

 
grell:

どの入力信号が有用な情報を持っていると思いますか:)

添付アーカイブのPDFをご覧ください:p17重要でない 予測因子の削減 ...


その中に簡単な例があり、この方法が学習サンプルの説明変数でない入力だけを正しくダウンサンプリングしていることが明確に示されています。

ファイル:
 
ふむふむ...。興味深いことに、本の中のリンクからプロジェクトを ダウンロードしましたが、実行方法がわかりません。ヒントを教えてください。
 
そして、java経由で開くと。Jprojectクラスがないって書いてあるんだけど...。こんな感じで...。
 

こんな窓がありますよ...。

 
nikelodeon:
ふむふむ...。面白いですね、本のリンクからプロジェクトをダウンロードしましたが、どうやって実行したらいいのかわかりません。教えてもらえますか?

お使いのコンピュータのJavaのバージョンが古い可能性はありませんか?バージョン1.8.0_25でプロジェクトをコンパイルしました。

最新版のJava2SE(JREまたはJDK)は http://java.com/ru/ からダウンロードしてください。

 

素晴らしい、すべてが実行されているが、データがどのような形式で送信されるべきかは明確ではありません......それは.csvウェル、それらがどのように配置されるべきかは明らかである。

例のデータファイルを送っていただければ...。

 
nikelodeon:

素晴らしい、すべてが稼働しているのですが、データをどのような形にすればいいのかがはっきりしません...。 .csv Wellというのは明らかですが、どのように並べればいいのか、などです。

例のデータファイルを送っていただけると...。

をご覧ください。倒産を予測する。

分類の例を示したCSVファイルが添付されています。

要するに

セルの区切り記号はセミコロンです。

数値の整数部と小数部の区切り:ドットまたはカンマ(カンマはすべてフルストップに自動置換されます)。

最初の列 - 例の識別子(テキスト形式)

最後の列 - 従属変数の値: 1 - 与えられたクラスに属する, 0 - 未定義のクラス(与えられたクラス以外の任意のクラス)に属する。

1行目:因子識別子(テキスト形式)

2行目-因子識別に関する注意事項、例えば、測定単位(テキストとして)

2行目以下、1列目の右側、最後の列の左側の残りのデータは因子の数値である(数値以外は処理されない)。

 
もちろん私の計算式はもっと単純で、データも少ないのですが、どう解釈すればいいのでしょうか。理解できない :-(.
 

なるほど。最初の変換は入力データの正規化で、正規化した後にデータを数式に代入すると、「WHAT?つまり、正規化したデータを計算式に入れ、計算式にしたがってインジケータのカーブを得るということなのですが?なぜ、記号>0をつける必要があるのか?

ちょっと不明です :-)