Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 185

 
Yuri Reshetov :
Saçma sapan konuşma. jPrediction, gürültülü veya önemsiz tahminciler üzerinde eğitilmiş bir modelle sonuçlanmamak için bir girdi boyutluluk azaltma algoritması uygular. Onlar. Farklı tahmin edici kombinasyonlarına sahip bir dizi modelden bir seçim yapılır ve bunlardan yalnızca en iyi genelleme yeteneğine sahip olan kalır.

varsayımsal durum...

100 potansiyel tahmincimiz var, açıklamanın basitliği için gösterge olmalarına izin verin.

Başlangıçta tüm bu tahmin edicilerde yalnızca bir karlı durum olduğunu bildiğimizi hayal edin, bu RSI 90'ı geçtiğinde ve stokastik sıfırın altına düştüğünde (tabii ki tavandan bir durum) , bu durum bir fiyat düşüşü verir. %90 olasılık, diğer tüm öngörücüler tam gürültüdür, RSI ve stokastik öngörücülerindeki diğer tüm durumlar da tam gürültüdür ve orada yüzlerce ve yüzlerce farklı durum vardır....

yani, yararlı sinyalin yaklaşık %0.01'ine ve gürültünün %99.9'una sahibiz.

Diyelim ki, bir mucize eseri, MO'nuz 98 tahmin edicinin tümünü ayıklayacak ve sadece iki tane - RSI ve Stokastik - bırakacak.

RSI'de yüzlerce durumsal RSI>0, RSI>13, RSI<85, RSI=0, RSI<145, ...... ve dolayısıyla yüzlerce ve yüzlerce vardır, schochastic'te daha az durum, orada çalışmak sadece bir durum vardır , MO'yu tüm fiyat hareketlerini tanımak için eğittiğiniz için, MO, RSI ve Stokastikte mevcut olan tüm olası durumları ve bu durumlarda bunların olasılığını dikkate alarak modeller oluşturacaktır. çalışacak neredeyse sıfır, ancak MO onları dikkate almak ve bunlara göre bir tür modeller inşa etmekle yükümlüdür, bunun gerçek gürültü olmasına ve yüzlerce başka çözüm arasında bir çalışma durumunun basitçe kaybolmasına rağmen, işte yeniden eğitim ....

Sonunda nasıl oldu???

 

Her şeyi birbirine karıştırdılar.

Farklı, birbirinden bağımsız problemler var. AMA EV İÇİN TUĞLA GİBİDİR: SADECE HEP BİRLİKTE BİR TİCARET SİSTEMİ VERECEKTİR.

1. Tahmin edicilerin hazırlanması . Bu aşamada, oldukça fazla sayıda hedef ve bunlara karşılık gelen araçlar. Bu aşamadaki tüm sorunları kasıtlı olarak gürültüden kurtulma yönünde çarpıttım, yani. Belirli bir SPESİFİK hedef değişken için tahmin edici olan tahmin edicileri bulmak. Ben ideali tarif edeceğim. Genetik üzerine bir makaleden alınmıştır. Ama kendi örneğimde.

"Müslümanlar" hedef değişkenini alıyoruz (saflık için). Öngörücü, "pantolon" ve "etek" olmak üzere iki değere sahip olan "kıyafetlerdir". "Pantolon" değeri ile "giyim" yordayıcısının değerlerinin bir kısmı, "erkek" sınıfını benzersiz bir şekilde tahmin eder ve ikinci kısım kadınları tahmin eder. Ayrıca "al/sat" hedef değişkeni için RSI gibi ideal tahmincilerimiz de var. Göstergenin genellikle yalan söylediğini hepimiz biliyoruz, ancak bunun bir kısmı bir sınıfı, bir kısmı da diğerini tahmin ediyor. Bu nedenle, bazıları bir sınıfı, bazıları da diğerini öngören tahmin edicileri aramak gerekir. Ayrıca, kesişim ne kadar küçükse (yanlış pozitifler), tahmin edici o kadar iyi olur. "Pantolon/etek" ideali, kestiricinin kesişim olmaksızın iki parçaya bölünebileceği ideal. Ama sadece Müslümanlar için değil, Avrupalılar için çalışıyor....

Algoritmik yöntemler vardır (örneğin, RSA, ancak klasik değil, iyileştirme ile), ancak tahmin edicilerin içeriğiyle başlamanız gerekir. Asli değerlendirmelere dayanarak, başlangıçta Satürn'ün halkalarını, kahve telvesini ve benzerlerini atmak gerekir .... Aynı zamanda, bu tahmin edicilerin DEĞİL korelasyonu önemlidir. Örneğin, teklifin bazı türevlerini alıyoruz - hepsi tekliften, ancak açık faiz, hacimler alıyoruz ... Sonra, bir nedenden dolayı diğer döviz çiftleri, makroekonomi tartışılmıyor ...

2. Modelin takılması. Bu ayrı bir problemdir ve ilk problemi kullanılan model yardımıyla çözmek mümkün değildir. Buradaki karışıklık, bir grup model algoritmasının yerleşik bir tahminci seçim algoritmasına sahip olması gerçeğiyle ortaya çıkmaktadır. İlk sorunu çözecek yerleşik algoritmaları şahsen bilmiyorum.

Reshetov, böyle bir yerleşik algoritmaya sahip olduğunu iddia ediyor. Ancak algoritmasına göre yeniden eğitimin bulunmadığına dair hiçbir zaman kanıt vermedi.

İlk adım gereklidir. Ancak, yerleşik tahminci seçim algoritmalarının kullanımını dışlamaz ve hatta belki de önerir. Ancak bu algoritmalar ilk aşamada "kahve telvesi"nden arındırılmalıdır.

3. İkili-üçlü sınıflandırıcı. Reshetov, her zaman olduğu gibi, konuyu üçlü sınıflandırıcı anlayışıyla karıştırdı. Üçlü, hedef değişkenin üç değere ve genel olarak konuşursak, herhangi bir sayıda nitel (nominal, kategorik) değere sahip olmasıdır. Reshetov'un, handikap için ÇOK İSTENİLEN bir çalışma sinyali aldığı iki ikili dosyası vardır - üçlü bir "alım/fiyat/satış" sinyaline sahip olmak. Sınıflandırma için ikili hedef değişken kullanıyorum ve ticaret için iki ikili sınıflandırmanın sonuçlarından üç sinyal alıyorum - aynen Reshetov gibi.

4. Birkaç modelin sonuçlarını bir ticaret sinyaliyle birleştirmek ayrı bir sorundur. Reshetov tarafından önerilen bir çözüm var. Ancak yukarıda dalda başka çözümler önerildi. Yukarıda Dik, sınıfın elde edildiği değerlerin dikkate alınmasını önerdi. Özellikle sınıflandırma algoritmalarının, sınıfın türetildiği sınıfın OLASILIK değerini döndürdüğü hatırlanırsa, bu soruna girilebilir. Birkaç modelin sonuçlarını tek bir sonuca döktüğümüzde, bu olasılıkları hesaba katmak kendini gösterir. Bu olasılıkları ikiye bölmeyen, aksi halde sınıflandırma hatasını azaltan algoritmalar vardır.

5. Modelin nihai değerlendirmesi. Bu, Burnakov ile anlaşamadığım bir konu. Modeli alıp "örnek dışında" çalıştırıyoruz ve "out", eğitim, test, çapraz doğrulamanın gerçekleştirildiği zaman aralığının dışında olduğu anlaşılıyor ... Bu adım yapıcı değil çünkü ne yapılması gerektiğini söyle. Bu adımda bir karar verilir: saklayın veya atın. "Atmanın" nedeni çok büyük bir hata değil, ÖNCEKİ ADIMLARA GÖRE DEĞİŞKENLİĞİDİR. Atın çünkü model fazla takılmış, umutsuz ve tehlikeli. Bu adımın üstesinden gelindiyse, test cihazına gidin, ondan aynı sonucu "tut - at".

 
mytarmailS :

varsayımsal durum...

...

daha sonra MO, olası tüm durumları göz önünde bulundurarak modeller oluşturacaktır ...

MO'yu tüm fiyat hareketlerini tanımak için eğittiğiniz için, MO ...

...

ancak MO bunları dikkate almak ve bunlara dayalı bir tür modeller oluşturmak zorundadır, bunun gerçek gürültü olmasına ve bir çalışma durumunun yüzlerce başka çözüm arasında basitçe kaybolmasına rağmen, işte yeniden eğitim ... .

jPrediction , olası tüm durumları hesaba katmak için gerekli değildir . Yazdığından çok daha kolay çalışıyor.

Tahmin edicilerin sıralı seçimi ilkesi (ve icat etmeye çalıştığınız gibi tam bir kombinasyon listesi değil) sayfa 109'daki mesajımdadır.

Hafıza kaybınız varsa, tahmin edicileri seçme prosedürünü sayfa 110'da zaten belirttiğinizi hatırlatmama izin verin.

 

San Sanych Fomenko :

Reshetov, her zaman olduğu gibi, konuyu üçlü sınıflandırıcı anlayışıyla karıştırdı .

...

Sınıflandırma için ikili hedef değişken kullanıyorum ve ticaret için iki ikili sınıflandırmanın sonuçlarından üç sinyal alıyorum - aynen Reshetov gibi .


Peki, bu Reshetov bir alçak değil mi?

Konuyu o kadar karıştırdı ki şimdi Fomenko bile Reshetov'un yaptığının aynısını yapmak zorunda kaldı.

Shurik Shurikovich, raftan bir turta al. Ne de olsa, turpları ve kötü bir insanı eleştirme alanında dürüstçe hak ettin - Reshetov.

 
Yuri Reshetov :

jPrediction , olası tüm durumları hesaba katmak için gerekli değildir . Yazdığından çok daha kolay çalışıyor.

Tahmin edicilerin sıralı seçimi ilkesi (ve icat etmeye çalıştığınız gibi tam bir kombinasyon listesi değil) sayfa 109'daki mesajımdadır.

Hafıza kaybınız varsa, tahmin edicileri seçme prosedürünü sayfa 110'da zaten belirttiğinizi hatırlatmama izin verin.

Ben size MO'nun (herhangi birinin) işaretleri normal olarak seçemediğini anlatacağım ve siz bana yeşili anlatacaksınız ...

 
mytarmailS :

Ben size MO'nun (herhangi birinin) işaretleri normal olarak seçemediğini anlatacağım ve siz bana yeşili anlatacaksınız ...

jPrediction, tahmin edicileri normal şekilde seçer. Belki de en ideal yöntem değil ama uygulanan problemler için normaldir. Büyük olasılıkla, mükemmellik sınırına henüz ulaşılmadı ve daha fazla araştırma için potansiyel var mı? En önemli şey, olumlu bir sonucun olması ve bundan daha fazla dans edebilmenizdir.

Sonuç olarak, kendi önyargılarınızı herhangi bir makine öğrenimi yöntemine (yalnızca ML alanında değil) yansıtmanız gerekmez.

Bir şey sizin için işe yaramazsa, ancak diğerleri de aynısını yaparsa, bu normal yöntemlerin olmadığı anlamına gelmez. Bu sadece, bu en normal yöntemleri bazı kişisel önyargılar için kullanmadığınız veya yanlış kullandığınız anlamına gelir.

 
Yuri Reshetov :

Peki, bu Reshetov bir alçak değil mi?

Konuyu o kadar karıştırdı ki şimdi Fomenko bile Reshetov'un yaptığının aynısını yapmak zorunda kaldı.

Shurik Shurikovich, raftan bir turta al. Ne de olsa, turpları ve kötü bir insanı eleştirme alanında dürüstçe hak ettin - Reshetov.

Boşver.

Siz ve ben aynı kandan olduğumuz için sizi kişisel olarak gücendirmeyi ASLA düşünmedim bile.

Ama senin "çitte"n beni hiç şüphesiz ilgilendiriyor.

Mesele şu. Bir ikili örnek üzerinde.

Bir sınıfın olasılığının sırasıyla 0,49 ve ikincisinin 0,51 olduğunu varsayalım. İki sınıf mı yoksa "çitte" mi?

 
Yuri Reshetov :

Uygulamada en ilkel olmasına rağmen en aptal ve en ümitsiz üçlü bisiklet: üç çıkışlı bir YSA'dır. Bu tür çıktıların her birinin kendi sınıflandırma eşiği varsa, o zaman üç değil sekiz olası olası durum elde ederler, bunlardan yalnızca üçü belirsizdir (değer üç çıktıdan yalnızca birinde eşiğin üzerindedir) ve beşinin nasıl yapılacağı belirsizdir. yorumlayın (eşiğin üzerindeki değerler çıktılardan birinden fazla veya üç çıktının hepsinde eşiğin altında).

Sınıflandırma için her şey çok daha basittir, çıktıyı daha büyük bir değerle almak gelenekseldir. Üç çıkıştaki sonuçlar (0.1;0.3;0.2) ise en yüksek değer = 0.4 ve çıkış numarası 2 aktiftir.
Ticaret modeli aşağıdaki mantığa sahip olabilir:
İlk çıkıştaki en büyük değer -> uzun pozisyon,
İkinci çıkıştaki en büyük değer -> tüm işlemlerden çıkın ve işlem yapmayın,
Üçüncü çıkıştaki en yüksek değer -> kısa pozisyon.
İşte bu kadar, eşik, durum vb. yok.

Ve bu kesinlikle bir bisiklet değil, ikiden fazla sınıfa ihtiyaç duyulduğunda sınıflandırma için nöronlarda sıklıkla kullanılan bir yöntem, bu nedenle örneğin görüntüleri sınıflandırırken en az düzinelerce sınıf kullanılabilir.
İki sınıf için ortada eşikli bir çıkış yeterlidir.
 

Dr.Tüccar :

Ticaret modeli aşağıdaki mantığa sahip olabilir:


  • İlk çıkıştaki en büyük değer -> uzun pozisyon,
  • İkinci çıkıştaki en büyük değer -> tüm işlemlerden çıkın ve işlem yapmayın,
  • Üçüncü çıkıştaki en yüksek değer -> kısa pozisyon.


İşte bu kadar, eşik, durum vb. yok.

Aynı zamanda bir seçenektir. Böyle önemsiz bir yaklaşımın normal bir genelleme yeteneği kazandıracağı bir gerçek olmasa da. Bazen basitlik hırsızlıktan daha kötüdür. Onlar. Ampirik olarak kontrol etmeniz gerekiyor - bir otopsi gösterilecek.
 
San Sanych Fomenko :

Bir sınıfın olasılığının sırasıyla 0,49 ve ikincisinin 0,51 olduğunu varsayalım. İki sınıf mı yoksa "çitte" mi?

Çünkü dondurma.

Üzgünüm ama soru nedir, cevap böyle.

Onlar. Mizahı anlamadım, çünkü bir karar vermek için sınıflandırıcının çıktı değerini bir şeyle, örneğin bir eşik değeriyle karşılaştırmak gerekiyor. Ve herhangi bir nedenle, problemi formüle ederken, karşılaştırılabilir miktarlar bilinmediğinden ve sadece sınıflandırma için gerekli olmayanlar bilindiğinden, açıklamalar yapmak güzel olurdu.

Neden: