Você está perdendo oportunidades de negociação:
- Aplicativos de negociação gratuitos
- 8 000+ sinais para cópia
- Notícias econômicas para análise dos mercados financeiros
Registro
Login
Você concorda com a política do site e com os termos de uso
Se você não tem uma conta, por favor registre-se
Obrigado, não me apercebi que estava a abrir um relatório.
O ganho foi ainda maior.
Estou espantado: este é um cartão de orçamento por menos de $80! Assim, a NVidia tem feito um trabalho sério sobre o condutor.
E aqui estão os novos resultados:
Eu compreendo: 1. CPU pura, 2. CPU com OpenCL, 3. GPU com OpenCL ?
E ainda é 422.
Estou espantado: é um cartão de orçamento que custa menos de 80 dólares! Assim, a NVidia tem trabalhado arduamente no condutor.
E como estou espantado, da sujidade à riqueza. Fica-se com a impressão de que a NVidia lê este fórum, faz testes semelhantes, encontra bugs e corrige-os.
Se apenas o testador escolhesse o que simular, ou seja, sem a escrita forçada de código, isso seria muito bom. Ainda assim, 1 segundo (ou 11 segundos se o vídeo não permitir ou não estiver disponível) contra 7 minutos é energia.
Os sistemas operativos modernos e os processadores realmente multi-core eliminaram seriamente o problema da dispersão das medições através do GetTickCount. O meu comentário original era apenas sobre a afirmação errada "o erro médio da GetTickCount é de pelo menos dezenas de ms".
no registo, é o que parece:
"nvcuda.dll"=dword:00000000
"amdocl.dll"=dword:00000000
"amdocl64.dll"=dword:00000000
"IntelOpenCL64.dll"=dword:00000000
São cerca de 1,5 vezes mais lentas (destacadas a vermelho) do que o motorista nativo da Intel (destacadas a verde).
Pode remover os valores de registo correspondentes, mas guardar o ramo só por precaução.
Caro Administrador. Já há algum tempo que não está no seu fórum, pode ter perdido este ponto.
Haverá uma implementação de entrega de cartões de vídeo às necessidades da nuvem?
Caro Administrador. Já há algum tempo que não está no seu fórum, pode ter perdido este ponto.
Haverá uma implementação de troca de cartões de vídeo para as necessidades da nuvem?
Quase pronto https://www.mql5.com/ru/forum/23/page15#comment_201948
Os programas OpenCL destinam-se a realizar cálculos em placas de vídeo que suportam OpenCL 1.1 ou superior. As placas de vídeo modernas contêm centenas de pequenos processadores especializados que podem realizar simultaneamente operações matemáticas simples nos fluxos de dados que chegam. A linguagem OpenCL empreende a organização de tal computação paralela e oferece uma grande rapidez para uma determinada classe de tarefas.
Sim, é isso mesmo.
Importa-se de executar o guião em anexo e de publicar os resultados? É realmente interessante.
Não tenha medo de um grande número de dígitos. Eles estão lá apenas para verificar a correcção dos cálculos.
O guião também percorre todos os dispositivos. A tarefa principal é a de multiplicar duas grandes matrizes.
As definições só podem ser alteradas dentro do código - o tamanho linear das matrizes _tamanho nesta linha:
#define _size 2000
Altere-os apenas se ficar sem memória. Um sinal disso são discrepâncias nos números de matriz quando executados numa GPU discreta: se a diferença nos números for superior a 10^(-4), isso é um erro óbvio. Mas parece ter memória suficiente.
Por exemplo, tenho uma placa gráfica Radeon 6930 que tem 1280 processadores de fluxo. Como é que vai aparecer na lista de agentes? Como 1 dispositivo, ou todos os 1280.
É por si só vezes mais rápido do que 10 processadores, e o bónus não é para 1 dispositivo adicionado.
Importa-se de executar o guião em anexo e exibir os resultados? É realmente interessante.
Não, não é um aborrecimento. Eu próprio estou curioso sobre isso. Não mudei nada nas definições.
Simplesmente não compreendo nenhum dos números. Pode explicar? Bem, pelo menos nos dedos: é bom ou não? São diferentes entre dispositivos, e nas linhas de 5-6 dígitos após o ponto decimal já é diferente em casas decimais.
Acho que consegui: é um teste múltiplo em operações repetidas, o tempo final é a média para cada dispositivo. Certo?
Estes são apenas dígitos de verificação. Se coincidirem com 0,00001, tudo está bem. Os índices são escolhidos aleatoriamente - é uma verificação aleatória para se certificar de que os cálculos estão correctos. Bem, não vamos imprimir aqui os resultados de uma verificação completa de todos os 4 milhões de elementos da matriz resultante, pois não?
Acho que consegui: é um teste múltiplo em operações repetidas, o tempo final é a média para cada dispositivo. Certo?
Não, trata-se de uma única operação de multiplicação de duas grandes matrizes.
Em termos de números de desempenho: muito bom para este cartão. Agora os meus resultados. Dispositivos (de baixo para cima - ordem de inicialização):
Isto é, primeiro um CPU Intel com motor OCL da Intel, depois o meu dinossauro HD 4870, e depois uma pedra novamente, mas com motor AMD. Roteiro: