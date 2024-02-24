Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 3049
Ticaret görevleri için RL kavramı gereksiz değil mi? Çevrenin ajan üzerinde etkisi var, ama ajanın çevre üzerinde bir etkisi var mı? Bu ikinci etkiyi yapay olarak ortaya koymak mümkündür, ancak bu mantıklı mıdır?
Makaledeki iki (veya üç) fikir bizim için hiç de gereksiz değildir - kayıp fonksiyonunun tam olarak ihtiyacımız olanı yansıtması ve düzgün (ve monotonik) olması gerektiğidir. Bizim durumumuzda, kar olmalı ve model parametrelerine düzgün ve monoton bir şekilde bağlı olmalıdır.
Kârın bir benzerinin düzgünlüğü muhtemelen bir şekilde sağlanabilir (örneğin, çekirdek düzgünleştirme gibi bir şeyle). Ancak monotonluk konusunda çok şüpheliyim.
Ticaretin finansal sonucunun temeli fiyat hareketidir - durağan olmayan rastgele bir süreç.
Durağan olmayan rastgele bir süreci bazı hilelerle pürüzsüz ve monoton bir sürece mi dönüştürmeye çalışıyoruz? Belki de geniş yürüyoruz? Özellikle de eğitim seti dışında %20'den(!) daha az sınıflandırma hatası elde etmenin son derece zor olduğunu göz önünde bulundurursak. Belki de işe sınıflandırma hatasını azaltmaya çalışarak başlamalıyız?
Makaleyi okuyun.
Bu makalenin bize ne faydası var?
Tamamen şüpheli.
Sebebi de şu.
Şimdi yapay zeka (MO) üzerine geleceği tahmin edebilecek herhangi bir yayın hatırlamıyorum. Bir modele el yazısı harfler yazmayı öğretiyorlar. Sonra bu el yazısı harfleri tanımaya çalışıyorlar. Ancak modele İLKESEL olarak bir sonraki harfin ne olacağını tahmin etmesi öğretilmiyor.
Bizim sorunumuz da bu.
MO'yu (mum çubuğu kombinasyonlarıyla yaptığımız çalışmanın aynısı) kullanarak tahmin edicilerde doğru tahmini verecek bazı örüntüler bulmaya çalışıyoruz. Ancak bulunan kalıpların gelecekte doğru tahminler vereceğinin garantisi yoktur. "Doğru" kalıplar hata verecek ve "yanlış" kalıplar doğru şeyi tahmin edecektir. Bunun nedeni, bir sınıfın değerini değil, DOĞRULUĞUNU veren sınıflandırma algoritmalarının kendisinde yatmaktadır. Sınıflara ayırmak için en ilkel düzenleme olan 0,5'i kullanıyoruz. Ve eğitim sırasında "doğru" bir örüntü olasılığı = 0.5000001 ise, neden bu olasılığı sınıf değeri olarak alıyoruz?
Bundan kurtulmak için bir sebze bahçesi yetiştirmeye başlarız, ancak aralarında örüntü aradığımız tahmincilerin değerleri ya durağan DEĞİLDİR ya da sözde durağandır ve fiyatla uzak bir ilişkisi vardır!
Çevrenin fail üzerindeki etkisine sahibiz ama failin çevre üzerinde bir etkisi var mı? Muhtemelen bu ikinci etkiyi yapay olarak ortaya koymak mümkündür, ancak bu mantıklı mıdır?
Her şey elimizdeki göreve bağlıdır.
Eğer ezici çoğunluğun yaptığı gibi hazır bir hedef tahmin ediyorsak, o zaman çevre üzerinde hiçbir etkimiz yoktur ve RL'ye gerek yoktur.
Ancak, örneğin, pozisyon yönetimi, stoplar, take-out'lar gibi görevler söz konusuysa...
Varlık yönetimi bizim (aracı) yönettiğimiz ortamdır.
Temsilci bir emir vermeye ya da vermemeye karar verir.
hangi fiyattan,
ve ne zaman çıkarılacağı ya da taşınacağı,
ve mevcut pozisyondaki mevcut kayıp n pip'i aştığında ne yapacak,
ve üst üste beş mağlubiyet alırsa ne yapacak?
Gördüğünüz gibi bu, sınıflandırmada ilkel bir yukarı/aşağı değil, çok sayıda durum (çıktı) içeren tamamen farklı bir görev seviyesidir
Daha da basitleştirmek gerekirse - piyasayı yönetemeyiz, ancak pozisyon ve riski yönetebiliriz, çünkü yapabiliriz!
Kârın bazı analoglarının düzgünlüğü, muhtemelen, bir şekilde elde edilebilir (örneğin, kernel smoothing gibi bir şeyle). Ancak monotonluk konusunda çok şüpheliyim.
"Pürüzsüzlük" ile ne kastedildiğini ve "pürüzsüzlüğün" neden gerekli olduğunu gerçekten anlamıyorum....
Belki de bunun için en iyi çözümü bulmak için çok kriterli optimizasyonu kullanabiliriz.
Her şey eldeki göreve bağlıdır.
İnsanların büyük çoğunluğunun yaptığı gibi hazır bir hedef tahmin ediyorsak, çevre üzerinde hiçbir etkimiz yoktur ve RL'nin kendisine de gerek yoktur....
Ancak, örneğin, pozisyon yönetimi, stoplar, take-out'lar görevi ...
Varlık yönetimi, bizim (temsilci) yönettiğimiz ortamdır...
Temsilci sipariş vermeye veya vermemeye karar verir.
hangi fiyata,
ve ne zaman çıkarılacağı ya da taşınacağı,
ve mevcut pozisyondaki mevcut kayıp n puanı aştığında ne yapacaktır,
ve üst üste beş mağlubiyet aldığında ne yapacak?
Gördüğünüz gibi bu, sınıflandırmada ilkel bir yukarı/aşağı değil, çok sayıda durum (çıktı) içeren tamamen farklı bir görev seviyesidir
Daha da basit bir şekilde ifade etmek gerekirse - piyasayı yönetemeyiz, ancak pozisyon ve riski yönetebiliriz, yapabiliriz!
"Pürüzsüzlüğe" neyin girdiğini ve buna neden ihtiyaç duyduğunuzu gerçekten anlamıyorum....
Belki de aramaya çok kriterli optimizasyon uygulayabiliriz.
Bir acentenin ortalama yapması mümkündür.
Ticaretin finansal sonucunun temeli fiyat hareketidir - durağan olmayan rastgele bir süreç.
Durağan olmayan rastgele bir süreci bazı hilelerle düzgün ve monoton bir sürece mi dönüştürmeye çalışıyoruz? Belki de geniş yürüyoruz? Özellikle de eğitim seti dışında %20'den(!) daha az sınıflandırma hatası elde etmenin son derece zor olduğunu göz önünde bulundurursak. Belki de işe sınıflandırma hatasını azaltmaya çalışarak başlamalıyız?
Modeli eğiterek minimize edilen kayıp fonksiyonunun özelliklerinden bahsediyordum. Daha doğrusu, ideal formu hakkında.
Pürüzsüzlüğe neyin girdiğini ve pürüzsüzlüğün neden gerekli olduğunu gerçekten anlamıyorum.
Bu optimizasyonun temelidir. Düzgünlük, bir gradyan aracılığıyla optimizasyonu mümkün kılar. Aksi takdirde geriye sadece kaba kuvvet algoritmaları kalır.
Optimizasyonun temelleri
Evet, bunu biliyorum, ancak son zamanlarda sermaye eğrisinin kendisinin düzgünlüğünden bahsediyorlardı, bu yüzden bu tartışmalara gerçekten girmedim, bu yüzden ne demek istediğinizi soruyorum.
