Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 2623

 
JeeyCi # :

ve cevap sizin için değildi - okumayı asla öğrenmediniz ...

NON-BED'in yazılı olduğu bir makaleyi tavsiye ederseniz, bu NON-BELDS'e (yeterliliğinizden bahseder) sahip olursunuz, başkalarına da tavsiye edersiniz..

Soru: Bu cevap bana verilmediyse, o zaman saçmalık saçmalık olmaktan çıkar mı? Soru retorik değil
 
JeeyCi # :

burada ve 2. modele ihtiyaç duyulmayabilir mi? - Model Seçimi için Çapraz Doğrulama ve Grid Arama ...

ama belki sadece bir karışıklık matrisi 2. sorunuza cevap verecektir (fikrinizin 2. modelinin amacı) ...

veya sınıflandırma_raporu

... 2. modele ihtiyacınız olduğundan şüpheliydim ... IMHO

Bu, örneğin Prado'yu okursanız, ikinci modeli kullanırken sadece karışıklık matrisindeki gelişmedir. Ama aynı zamanda ya gerçek pozitiflerin sayısını ya da başka bir şeyi artırmak için ilk model için örneklerin aşırı örneklenmesini kullanır. unuttum maalesef.
Bir modeli kullanarak, diğerinin bozulması pahasına birini iyileştirebilirsiniz ve 2 model ile güya her şeyi iyileştirebilirsiniz. Karışıklık Matrisi Prado veya Meta Etiketleme Prado'yu arayın. telefondan arıyorum.
Ve çapraz doğrulama, bu tür manipülasyonlardan sonra “iyi” gösterecektir, sadece TS özkaynak bakiyesindeki yeni verilere bakabilirsiniz ve her şeyi bir kerede görebilirsiniz)
 
Maxim Dmitrievsky # :
Bu, örneğin Prado'yu okursanız, ikinci modeli kullanırken sadece karışıklık matrisindeki gelişmedir. Ama aynı zamanda ya gerçek pozitiflerin sayısını ya da başka bir şeyi artırmak için ilk model için örneklerin aşırı örneklenmesini kullanır. unuttum maalesef.
Bir modeli kullanarak, diğerinin bozulması pahasına birini iyileştirebilirsiniz ve 2 model ile iddiaya göre her şeyi iyileştirebilirsiniz. Karışıklık Matrisi Prado veya Meta Etiketleme Prado'yu arayın. telefondan arıyorum.

yukarı örnekleme ve aşağı örnekleme, Dengesiz veri kümeleri ve küçük eğitim kümeleri içindir - bundan bahsediyorsak - yani. daha küçük sınıflara daha fazla ağırlık vermek ve bunun tersi ... evet, muhtemelen, (gerçekten olumlu) artışları için ...

***

ve yaklaşık 2 model - peki, muhtemelen 2 kez filtreleyebilirsiniz - önce ağırlıkları ayarlamak için sinyalleri, ardından bu ağırlıklara göre bunlarla ilgilenir (2. tartımdaki girdi ile başlatılır)... öğrenme fırsatı gibi görünse de bağlamla ilgilenmekten - ve böylece gradyan daha önceki zaman serileri için kaybolmaz - iyi bir fikir ... AMA bağlamla çalışırken uygulama hala biraz farklıdır - görev, kodlamayı kullanmaktır. "işlem ve bağlamı" ve 2. RNN, çıktıdaki kod çözme için 1.'nin sonucunu alır - ancak bunun 2 farklı görevde (örneğin bağlam ve işlemler) 2 ağın çalışmasıyla çok az ilgisi vardır, çünkü aslında işlenir - "anlaşma ve bağlam" (bir çift olarak !!) 2 ağdan geçer ... - yalnızca hız sorununu çözer, ancak çıktının geçerliliğini (veya daha az ölçüde) çözmez. .. BENİM NACİZANE FİKRİME GÖRE ...

ama bağlamın işlenmesini ve işlemi kesinlikle ayırmak istiyorsanız (bağlam ayrı, işlemler ayrı) - o zaman şimdilik böyle bir yapı bana bir sandviçi (veya tereyağı-tereyağı, ara bağlantılarını ve bağımlılıklarını yağlayan) hatırlatıyor. birbirinden fenomenler - 2 katmanda) ... İş Tanımı Şartlarınızı yorumluyormuş gibi yapmıyorum, ancak endişelerimi ve sonuçta modelleme sürecinde muhtemelen korumaya değer olduğu varsayımını dile getirdim - yani İlişkiler! .. Size güzel (gerçekliği yansıtan! Tereyağı değil) bir Ağ Mimarisi diliyorum!

ps ) "içeriğe dayalı reklamcılığın" ebedi sorunu olarak - "ana şey gerçeklikten kopmamaktır" (yalnızca ağırlık ayarları bazen çarpıktır - kimseyi işaret etmeyeceğim - veya çalıştıkları küçük örneklerle yanlış yön )

 
JeeyCi # :

yukarı örnekleme ve aşağı örnekleme, Dengesiz veri kümeleri ve küçük eğitim kümeleri içindir - bundan bahsediyorsak - yani. küçük sınıflara daha fazla ağırlık vermek... evet, muhtemelen (gerçekten olumlu) artışları için...

***

ve yaklaşık 2 model - peki, muhtemelen 2 kez filtreleyebilirsiniz - önce ağırlıkları ayarlamak için sinyalleri, ardından bu ağırlıklara göre bunlarla ilgilenir (2. tartımdaki girdi ile başlatılır)... öğrenme fırsatı gibi görünse de bağlamla ilgilenmekten - ve böylece gradyan daha önceki zaman serileri için kaybolmaz - iyi bir fikir ... AMA bağlamla çalışırken uygulama hala biraz farklıdır - görev, kodlamayı kullanmaktır. "işlem ve bağlamı" ve 2. RNN, çıktıdaki kod çözme için 1.'nin sonucunu alır - ancak bunun 2 farklı görevde (örneğin bağlam ve işlemler) 2 ağın çalışmasıyla çok az ilgisi vardır, çünkü aslında işlenir - "anlaşma ve bağlam" 2 ağından geçer (bir çift olarak !!) ... - yalnızca hız sorununu çözer, ancak çıktının geçerliliğini (veya daha az ölçüde) çözmez. .. BENİM NACİZANE FİKRİME GÖRE ...

ama bağlamın işlenmesini ve işlemi kesinlikle ayırmak istiyorsanız (bağlam ayrı, işlemler ayrı) - o zaman şimdilik böyle bir yapı bana bir sandviçi (veya tereyağı-tereyağı, ara bağlantılarını ve bağımlılıklarını yağlayan) hatırlatıyor. birbirinden fenomenler - 2 katmanda) ... İş Tanımı Şartlarınızı yorumluyormuş gibi yapmıyorum, ancak endişelerimi ve sonuçta modelleme sürecinde muhtemelen korumaya değer olduğu varsayımını dile getirdim - yani İlişkiler! .. Size güzel (gerçekliği yansıtan! Tereyağı değil) bir Ağ Mimarisi diliyorum!

ps ) "içeriğe dayalı reklamcılığın" ebedi sorunu olarak - "ana şey gerçeklikten kopmamaktır" (yalnızca ağırlık ayarları bazen çarpıktır - kimseyi işaret etmeyeceğim - veya çalıştıkları küçük örneklerle yanlış yön )

Bağlam kavramı, zaman serileri söz konusu olduğunda çok kullanışlı olmayabilir. Net bir ayrım yok, her iki model de tahminde yer alıyor. Bir yön, başka bir zamanlama. eşit olduklarını söyleyebilirim. Soru, model hatalarının analizine dayanarak ticaret için en iyi durumları aramanın nasıl optimize edileceği ve bu mümkün mü? Birbiri ardına sırayla yeniden eğitim. Her bir yeniden eğitim çiftinden sonra, sonuç yeni veriler üzerinde iyileştirilmelidir. Onlar. eğitim setinden bir model seçebilmeli ve görmediği yeni verileri kademeli olarak iyileştirebilmelidir. Önemsiz bir görev.

İlk model tarafından kötü tahmin edilen örnekleri ikinci modelin "ticaret yapma" sınıfına attım. İlk model için dayak örneğinden atıldı. İlk başta hata sırasıyla neredeyse sıfıra düştü. İkincisi de küçük. Ancak bu, yeni verilerin iyi olacağı anlamına gelmez.

Bu bir tür kombinatoryal görevdir: doğru zamanda doğru alım ve satımı bulmak

Belki burada bir çözüm yoktur.
 
Maxim Dmitrievsky # :
Düzenlilik kavramı tekrarı ima eder, bu önemli!

Şimdi, eğer bir küme bir şeyi %90 olasılıkla tahmin edebiliyorsa ve en az 200 kez tekrarlıyorsa, bunun bir kalıp olduğunu varsayabiliriz.
Veya bir küme değil, bir günlük. kural..

Karmaşık bir modelle (katlama kelimesinden karmaşık) uğraşırken, iç kalıpların tekrarlanabilirliğini düzeltme yeteneğini kaybedersiniz, başka bir deyişle, düzenlilik ile uydurmayı ayırt etme yeteneğinizi kaybedersiniz...

Bunu anlayarak, sinir ağlarının çöpe gittiğini hemen anlayabilirsiniz, ancak ahşap modeller kurallara ayrılabilir ve istatistikler zaten kurallarda dikkate alınabilir.
 
mytarmailS # :
Düzenlilik kavramı tekrarı ima eder, bu önemli!

Şimdi, eğer bir küme bir şeyi %90 olasılıkla tahmin edebiliyorsa ve en az 200 kez tekrarlıyorsa, bunun bir kalıp olduğunu varsayabiliriz.
Veya bir küme değil, bir günlük. kural..

Karmaşık bir modelle (katlama kelimesinden karmaşık) uğraşırken, iç kalıpların tekrarlanabilirliğini düzeltme yeteneğinizi kaybedersiniz, başka bir deyişle, düzenlilik ile uydurmayı ayırt etme yeteneğinizi kaybedersiniz...

Bunu anlayarak, sinir ağlarının çöpe gittiğini hemen anlayabilirsiniz, ancak ahşap modeller kurallara ayrılabilir ve istatistikler zaten kurallarda dikkate alınabilir.
Ancak ns'de, analiz imkanı olmasa da basit bağımlılıklar yoksa birçok işaret sığdırabilirsiniz. Aksi takdirde, tüm makine öğrenimini atacağız ve basit TS yazma yollarına geri döneceğiz :) O zaman sadece basit algoritmalar yazabilir, test cihazında nasıl çalıştıklarını (yapmadıklarını) görebilir, düzeltebilir, tekrar bakabilirsiniz, vb.
 

istatistikler doğrusaldır , ne söylenirse söylensin... sinir ağları aptaldır (veya akıllıdır - geliştiriciye bağlıdır) ağırlıklandırmadır... ağırlıklandırma için 2 veya daha fazla Yoğun katman kullanırken, Doğrusal olmayan bağımlılıklar vermezler (göreceli olarak çünkü bu bir bağımlılık VEYA aptal bir korelasyon - bu hala çok büyük bir soru) ... ama şu ana kadar aptal bir korelasyon bile çalışıyor - bunun üzerinden para kazanmayı deneyebilirsiniz ... - çalışmayı bıraktığı an zamanında tanınmak (fark edilmesi gereken herhangi bir anormallik gibi - rastgele veya sistem oluşturan - bu zaten başka bir soru - ve sonra, her zamanki gibi, risk / karlılık sorununuzu çözün)

kolaylık esnekliğinde değildir - çıktıya girdiye başlattığımızdan tamamen farklı bir "isimlendirme" alabilir/gönderebilirsiniz - yani. ağın kendisinde, ihtiyacımız olan dönüşümleri gerçekleştirin ... ve bunu çok iş parçacıklı modda yapın (kütüphaneye bağlıdır) ... sadece istatistik değil ...

ve bir girdi aramak için istatistiklerin gerekli olup olmadığı (set-up'a) - bu başka bir soru ...

bilgi ve deneyim genellikle istatistikten daha yardımcı olur. ilki ayrıntılara odaklanır, ikincisi ortak bir paydaya indirgenmeye odaklanır ...

her şeyin bir yeri var - istatistikler dahil ...

***

gerçek şu ki, bir robot için - rakamlardan elde edilen olasılıklar dışında açıklamanın başka bir yolu yoktur (ve size farklı bir şekilde açıklamayacaktır) ... - BİLGİSAYARLAR YÜZYILLARDIR BU ŞEKİLDE ÇALIŞIYOR 0 ve 1 sayıları ... bu nedenle ve çıktıdaki olasılıkları elde etmek için girdileri sayısallaştırmamız ve güven aralıkları için koşulları belirlememiz gerekir (buna güveniriz, istatistik olması gerekmez) ... ve her şeye güvenebiliriz (bu özneldir) ) - ya ikili mantık, ya da bu ikili mantığın ağırlıklı bir sonucu (diğer bir deyişle, tüm potansiyel çözümler aralığında bütünün olasılığı)... Kâse...

(ve zaten ormana giriş veya sinir ağına giriş zaten detaylar)

kimse ağaçların / ormanların ve sinir ağlarının tek bir proje çerçevesinde paylaşılmasını yasaklamadı ... - soru Nerelerde, Ne Zaman Uygulanmalı (hız ve hafıza önemlidir) ve neyin daha iyi olduğu değil ... - bu zaman kaybetmemek daha iyidir - "anlaşmadan ayrı zamanlama - zamanlamadan ayrı bir anlaşma gibi kayıp zaman - bilinmeyen bir anlaşma"

 
Bu kadar uzun bir tirad ve bu kadar zayıf bir sonuç :) Zamanı göz ardı etsek bile, bir modele (düzenlenmiş, uygun değil) kârlı ve kârsız işlemlerin sayısının iyi bir oranı, kârsızların hariç tutulması öğretilemez. Bir tren örneğinde bile TS'nin ticaret performansında yapay bir bozulma olarak algılanan sınıflandırma hatasından kurtulmak imkansızdır.
 

Hiçbir model olasılıklardan fazlasını elde edemez (bu, herhangi bir dijitalleşmenin avantajı ve dezavantajıdır), bu olasılıklar tartılmasa bile ... Ben kendim sandviçleri zehirlemiyorum ve kimseye tavsiye etmiyorum - Bayes iptal edilmedi ( koda yatırım yapmasanız ve özellikle kodun içine koysanız bile)...

ps ve muhtemelen bir McDonalds hayranısın... - bir hipotez, kontrol etmeyeceğim...

algoritmalar sonuçlarınızdan daha pahalıdır

 
JeeyCi # :

Hiçbir model olasılıklardan fazlasını elde edemez (bu, herhangi bir dijitalleşmenin avantajı ve dezavantajıdır), bu olasılıklar tartılmasa bile ... Ben kendim sandviçleri zehirlemiyorum ve kimseye tavsiye etmiyorum - Bayes iptal edilmedi ( koda yatırım yapmasanız ve özellikle kodun içine koysanız bile)...

ps ve muhtemelen bir McDonalds hayranısın... - bir hipotez, kontrol etmeyeceğim...

algoritmalar sonuçlarınızdan daha pahalıdır

Sandviçler, herhangi bir derin ağda yaygın olarak kullanılmaktadır. Farklı görevler için hileleri. Ama eğer dar düşünürseniz, o zaman herhangi bir fotokopi makinesi bir fotokopi makinesidir ve herhangi bir McDonald's burgeri
Böylece hiçbir şey denemeden kendi kalıp yargılarınızın esiri olabilirsiniz. Ve klişeler hiçbir şekilde katmanlaşma değildir 😀
Cevabımda, dolaylı olarak, duruma daha uygun olan genelleştirilmiş bilgiden belirli olanları ayıran ikinci açıklayıcı modeli kullandım.
Neden: