Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 3030

 
Forester #:

Bu karmaşık bir açıklama. Sütunu sıralayın ve 32 parçaya bölün, örneğin çiftler varsa, hepsi kuantuma atılır. Eğer sütunda sadece 0 ve 1 varsa, o zaman 32 değil 2 kuanta olacaktır (çünkü kopyalar).

Siz yöntemi kastediyorsunuz, ben de hedefi. Yöntemler farklı olabilir. Şöyle söyleyeyim: ampirik yöntemler genellikle matematiksel yöntemlerden daha iyidir. Belki de genel örneklem hakkında tam veriye sahip olmadığımız içindir.

 
Aleksey Nikolayev #:

Esasen, her bir tahmin ediciye ayrı ayrı bir ağaç inşa edildiği ortaya çıkmaktadır.

Evet, C4.5 ağaçları ayrık değerler için bu şekilde oluşturulur. Bir bölünme.

 
Aleksey Vyazmikin #:

Siz yöntemden bahsediyorsunuz, ben hedeften bahsediyorum. Farklı yöntemler olabilir. Şöyle söyleyeyim: ampirik yöntemler genellikle matematiksel yöntemlerden daha iyidir. Muhtemelen genel örneklem hakkında tam veriye sahip olmadığımız için.

Durağan olmayan veriler için "ana örneklem" kavramı yoktur, kuyruklardan başka bir şey yoktur. Sorun da budur, bu nedenle eğitimden elde edilen tahminlerin gelecekte elde edilmesi son derece zordur.

 
СанСаныч Фоменко #:

Durağan olmayan veriler için "ana örneklem" diye bir kavram yoktur, kuyruklardan başka bir şey yoktur. Tüm sorun budur, bu nedenle eğitimde elde edilen tahminlerin gelecekte elde edilmesi son derece zordur.

Bunu bilmiyoruz. Daha doğrusu dağılımın gerçek yoğunluğunu bilmiyoruz ve sadece alıntıları gözlemliyoruz - bu yüzden bu tür dalgalanmalar...

Ben kavramlarla yaşamıyorum :)

Öyleyse bana gözlemleyemediğimiz böyle bir fenomenin nasıl adlandırıldığını söyleyin, çünkü biz onun sürecindeyiz ve uzayın uzak köşelerinde uzun zaman önce tamamlandı....

 
СанСаныч Фоменко #:

Durağan olmayan veriler için "ana örneklem" diye bir kavram yoktur, kuyruklardan başka bir şey yoktur. Tüm sorun budur, bu nedenle eğitimde elde edilen tahminlerin gelecekte elde edilmesi son derece zordur.

Bu doğru, SanSanych.

Durağan olmayan veriler her zaman diğerdurağan olmayan verilerin kümülatif etkilerine tabidir. Kuyruklar buna bağlı olacaktır.

[Silindi]  
Aleksey Vyazmikin #:

Verileri tanımlayan tahmin edici değerler aralığı.

Burada algoritmayı pratik olarak tanımladım - RSI ile bir resim de var.

Anladım. Her şeyi ve her şeyi ayırın ve ayrı ayrı inceleyin.

Neden kuantum olduklarını anlamıyorum.
 
Maxim Dmitrievsky #:
Neden kuantum olduklarını anlamıyorum.

Çünkü çocuk kurallara göre yaşamıyor, yazmış)

 
Maxim Dmitrievsky #:

Anladım. Her şeyi ve herkesi ayırın ve ayrı ayrı çalışın.

Neden kuantum olduklarını anlamıyorum.

Muhtemelen çevirilerdendir. terminoloji.

Kuantizasyon ve farklı yöntemleri var, bölünme noktalarını içeren tablo - kuantum tablosu - zaten CatBoost talimatından.

Kuantum segmentleri - kuantum tablosundan, ancak aşırı olanların sınırları var. Bu zaten benim icadım.

[Silindi]  
Aleksey Vyazmikin #:

Muhtemelen çevirmenlerin hatası. terminoloji.

Niceleme ve bunların farklı yöntemleri vardır, bölme noktalarını içeren tablo - kuantum tablosu - zaten CatBoost talimatından alınmıştır.

Kuantum segmentleri - kuantum tablosundan, ancak aşırı olanların sınırları var. Bu zaten benim icadım.

kuantum değil, muhtemelen burada olduğu gibi kuantize edilmiştir.

5.4 Evrişimsel sinir ağlarının nicelleştirilmesi

Klasik olarak, belirgin optimizasyon zorlukları nedeniyle, sinir ağlarını ölçerken sadece tamsayılar kullanılmaz, bunun yerine tamsayılar aracılığıyla kayan noktalı sayıların bir yaklaşımı kullanılır. Literatürde [52, 54, 60] kayan noktalı sayıların keyfi derinlikteki tamsayılar aracılığıyla yaklaştırılması içinyaygın olarak kullanılan bir yaklaşım, Google GEMMLOWP kütüphanesinde önerilen algoritmadır [59]. Bir giriş dizisi 𝑋, sınır değerleri [𝑣􏰲􏰭􏰠,𝑣􏰲􏰈􏰂], bit sayısı 𝑀 olmak üzere, sonuç aşağıdaki gibi tanımlanır:

𝑠𝑐𝑎𝑙𝑒=(𝑣􏰲􏰈􏰂 - 𝑣􏰲􏰭􏰠)/2􏰳,(14) 𝑧𝑒𝑟𝑜_𝑝𝑜𝑖𝑛𝑡 = 𝑟𝑜𝑢𝑛𝑑(min(max(-𝑣􏰲􏰭􏰠/𝑠𝑐𝑎𝑙𝑒, 0),2􏰳)),(15)𝑜𝑢𝑡𝑝𝑢𝑡𝑝𝑢𝑡 = 𝑟𝑜𝑢𝑛𝑑(𝑋/𝑠𝑐𝑎𝑙𝑒 + 𝑧𝑒𝑟𝑜_𝑝𝑜𝑖𝑛𝑡).(16)

Böylece, her kayan noktalı sayı dizisi için bir tamsayı dizisi 𝑜𝑢𝑡𝑝𝑢𝑡𝑝𝑢𝑡 , tamsayı 𝑧𝑒𝑟𝑜_𝑝𝑜𝑖𝑛𝑡, sıfırı doğru bir şekilde temsil eden, niceleme ölçeğini tanımlayan çift hassasiyetli bir𝑠𝑐𝑎𝑙𝑒 sayısı.


https://dspace.susu.ru/xmlui/bitstream/handle/0001.74/29281/2019_401_fedorovan.pdf?sequence=1&isAllowed=y

 
Maxim Dmitrievsky #:

kuantum değil, kuantize, buradaki gibi.

5.4 Evrişimsel sinir ağlarının sayısallaştırılması

Klasik olarak, belirgin optimizasyon zorlukları nedeniyle, sinir ağlarının sayısallaştırılmasında sadece tam sayılar kullanılmaz, bunun yerine tam sayılar aracılığıyla kayan noktalı sayıların bir yaklaşımı kullanılır. Literatürde [52, 54, 60] kayan noktalı sayıların keyfi derinlikteki tamsayılar aracılığıyla yaklaştırılması içinyaygın olarak kullanılan bir yaklaşım, Google GEMMLOWP kütüphanesinde önerilen algoritmadır [59]. Bir giriş dizisi 𝑋, sınır değerleri [𝑣􏰲􏰭􏰠,𝑣􏰲􏰈􏰂], bit sayısı 𝑀 olmak üzere, sonuç aşağıdaki gibi tanımlanır:

𝑠𝑐𝑎𝑙𝑒=(𝑣􏰲􏰈􏰂 - 𝑣􏰲􏰭􏰠)/2􏰳,(14) 𝑧𝑒𝑟𝑜_𝑝𝑜𝑖𝑛𝑡 = 𝑟𝑜𝑢𝑛𝑑(min(max(-𝑣􏰲􏰭􏰠/𝑠𝑐𝑎𝑙𝑒, 0),2􏰳)),(15)𝑜𝑢𝑡𝑝𝑢𝑡𝑝𝑢𝑡 = 𝑟𝑜𝑢𝑛𝑑(𝑋/𝑠𝑐𝑎𝑙𝑒 + 𝑧𝑒𝑟𝑜_𝑝𝑜𝑖𝑛𝑡).(16)

Böylece, her kayan noktalı sayı dizisi için bir tamsayı dizisi 𝑜𝑢𝑡𝑝𝑢𝑡𝑝𝑢𝑡 , tamsayı 𝑧𝑒𝑟𝑜_𝑝𝑜𝑖𝑛𝑡, sıfırı doğru olarak temsil eden bir tamsayı, niceleme ölçeğini tanımlayan çift hassasiyetli bir𝑠𝑐𝑎𝑙𝑒 sayısı.


https://dspace.susu.ru/xmlui/bitstream/handle/0001.74/29281/2019_401_fedorovan.pdf?sequence=1&isAllowed=y

Size söylüyorum, bu bir çeviri meselesi - hepsi eşanlamlı. İşte CatBoost ayarları.