L'apprendimento automatico nel trading: teoria, modelli, pratica e algo-trading - pagina 3231

 
Forester #:
Perché ne avete bisogno? Quando stavo sperimentando con R, ho usato il dll-ku ordinato da SanSanych. Funziona bene e ha più possibilità, perché trasferisce qualsiasi dato in entrambi i sensi, non solo le virgolette (come era nel primo port di R). Inoltre, sono anche riuscito a eseguire un'ottimizzazione multithread attraverso di essa.

Il supporto ufficiale, come mi sembra, può dare una buona spinta /hype sia a R che a MKL .....

Nuovi articoli su tutti i paesi, nuove idee, nuove persone con cui parlare, nuovi algoritmi....

 

Esisteun sito che registra la pubblicazione di nuovi pacchetti R....

Sono sempre stato interessato a scaricare questi dati e ad aggregarli per tempo (quanti nuovi pacchetti vengono scaricati al giorno), per capire cosa sta succedendo al linguaggio....

Ma ho sempre rimandato, non sapevo come fare, pensavo fosse lungo e complicato....

Oggi ho deciso di farlo, ho impiegato circa 5 minuti per capire come farlo e 30 secondi per il codice stesso)))

Ecco il codice

library(rvest)
library(xts)
url <- "https://cran.r-project.org/web/packages/available_packages_by_date.html"

tb <- url |> read_html() |> html_table() |> _[[1]] |> {\(.) .[nrow(.):1,]}()

tb$Date |> rle() |> _$lengths |> xts(as.POSIXct(r$values)) |> plot(main="количество новых пакетов",col=4)

scaricare i dati dal sito + aggregazione per giorno + visualizzazione.


2008-09-08                                           1
2008-10-28                                           1
2010-06-25                                           1
2010-07-07                                           1
2011-08-18                                           1
2011-09-07                                           1
2011-12-01                                           1
2011-12-28                                           1
2012-01-28                                           1
2012-03-01                                           1
       ...                                            
2023-09-01                                          44
2023-09-02                                          35
2023-09-03                                          37
2023-09-04                                          32
2023-09-05                                          72
2023-09-06                                          84
2023-09-07                                          58
2023-09-08                                          45
2023-09-09                                          26
2023-09-10                                          27

Ricevo una media di 40-50 nuovi pacchetti al giorno.

=========================================================================


Ed ecco lo stesso codice nel decantato python, che è il migliore per il parsing e in generale

import pandas as pd
import requests
from bs4 import BeautifulSoup
import matplotlib.pyplot as plt

url = "https://cran.r-project.org/web/packages/available_packages_by_date.html"

response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
table = soup.find_all('table')[0] 
df = pd.read_html(str(table))[0]
df = df.iloc[::-1]

df['Date'] = pd.to_datetime(df['Date'])
df_grouped = df.groupby('Date').size()

df_grouped.plot(title="количество новых пакетов")
plt.show()

Date
2008-09-08     1
2008-10-28     1
2010-06-25     1
2010-07-07     1
2011-08-18     1
              ..
2023-09-06    84
2023-09-07    58
2023-09-08    45
2023-09-09    26
2023-09-10    29
Length: 2807, dtype: int64

===========================================================


7 righe di codice in R, 18 righe di codice in python...

 
Renat Fatkhullin #:

In sostanza, tutto sarà in funzione della definizione dei termini del concorso: si tratta di una mole di lavoro enorme.

Attenderemo le condizioni dettagliate.

Tuttavia, la maggior parte degli sviluppi ha un proprio modello, che non può essere adattato a standard/template per tutti. E le cose più preziose non sono i modelli, ma i predittori.

Se i predittori sono un insieme fisso, il compito dell'addestramento si riduce alla selezione di quelli significativi. Ma se è possibile regolare le impostazioni di questi predittori, sarà più divertente.

 
Andrey Dik #:

ZZY**. "la serata smette di essere languida" - molto interessante quello che ne verrà fuori, dopotutto a te interessa, fxsaber, non è vero? - e anche a me))))))))))))))))))))))))))

Probabilmente una delle cose più stupide è cercare di far cambiare idea a un'altra persona. Nessuna argomentazione funziona. Da qui l'altra parola con la "P": bygones.

 
fxsaber #:

Probabilmente una delle cose più stupide è cercare di far cambiare idea a un'altra persona. Nessuna argomentazione funziona. Ecco perché l'altra parola con la "P" è "bygones".

il loro concorso == le loro condizioni.

È una cosa stupida da discutere.

 

Dovrò aumentare la quantità di sforzi per poter installare i pacchetti con l'accelerazione

import requests, pandas as pd, matplotlib.pyplot as plt
from bs4 import BeautifulSoup

df = pd.read_html(requests.get("https://cran.r-project.org/web/packages/available_packages_by_date.html").text, flavor='bs4')[0].iloc[::-1]
df.groupby('Date').size().plot(title="количество новых пакетов")
plt.show()
Ancora una volta vi siete fatti abbindolare, avete spalmato delle righe sullo schermo e le avete spacciate per verità.
 
Maxim Dmitrievsky #:

Dovrò aumentare la quantità di sforzi per essere in grado di installare i pacchetti a un ritmo accelerato.

Ancora una volta sono fregato, ho solo spalmato le righe sullo schermo e le ho fatte passare per verità.
Se lo comprimo in modo così inutile come hai fatto tu, allora avrò 2 righe insieme alla dichiarazione della libreria....

Quindi anche qui sei sfortunato.
 
mytarmailS #:
Se comprimo in un modo non utilizzabile come hai fatto tu, avrò 2 righe in totale insieme alla dichiarazione della libreria...

Quindi anche in questo caso sei sfortunato.

Un modo assolutamente utilizzabile e una sintassi perfettamente comprensibile, e tu impari l'alfabeto del predatore per scrivere codice in corsivo, che non sono nemmeno sulla tastiera )).

Di conseguenza, non puoi nemmeno scrivere un ciclo senza errori in altri linguaggi, perché sei abituato ai geroglifici.

 

Non si può che accogliere con favore l'organizzazione del campionato con l'obiettivo di rendere popolare il MoD.

Sembrerebbe.

Tuttavia, il quadro tecnico del campionato, che è costituito da python e onnx, lascia fuori dal campionato la vera diversità dei modelli disponibili all'interno del MO.

Centinaia di modelli sono esclusi. Sono questi modelli che definiscono il significato della parola "machine learning", e le varie reti neurali sono una piccola parte e non la più interessante del MO per il trading.

Allego un elenco piuttosto datato (2015) dei modelli disponibili all'interno della shell caret, ovvero disponibili all'interno dell'operatore treno. La composizione di alcuni gruppi di modelli non è stata resa nota, in quanto l'elenco riflette i miei gusti.

 
È una barriera contro una setta di pazzi.
Motivazione: