Discussão do artigo "Redes Neurais de Maneira Fácil (Parte 5): Cálculos em Paralelo com o OpenCL" - página 2
Você está perdendo oportunidades de negociação:
- Aplicativos de negociação gratuitos
- 8 000+ sinais para cópia
- Notícias econômicas para análise dos mercados financeiros
Registro
Login
Você concorda com a política do site e com os termos de uso
Se você não tem uma conta, por favor registre-se
Portanto, isso não é novidade - havia 1 núcleo e ele estava carregado, e agora há dois núcleos, a carga diminuiu pela metade.... Provavelmente, as alterações são mais significativas e a comparação não está correta.
Para entender os motivos da aceleração, não basta analisar o número de núcleos, é preciso analisar também a arquitetura de computação.
Concordo. Não entendi por que 4 vetores foram paralelizados em vez de 2?
Portanto, isso não é novidade - havia 1 núcleo, e ele estava carregado, e agora há dois núcleos, a carga diminuiu pela metade.... Provavelmente, as alterações são mais significativas e a comparação não está correta.
A alocação de memória pode ser mais eficiente, um núcleo obtém dados completos de uma só vez, sem redistribuição. Isso acaba sendo mais rápido. Mas, para algumas tarefas, pode ser mais lenta quando os cálculos do kernel consomem muitos recursos.
Concordo. Aqui eu não entendi por que 4 vetores foram paralelizados e não 2?
2 vetores de 4 elementos cada foram colocados em paralelo. Vetores inp e weight. Eles colocaram quatro elementos em cada um e depois os multiplicaram em ponto.
Dimitri, obrigado pela resposta.
A alocação de memória pode ser mais eficiente, pois o kernel obtém os dados completos de uma só vez, sem realocação. Isso acaba sendo mais rápido. No entanto, para algumas tarefas, pode ser mais lento quando os cálculos do kernel exigem muitos recursos.
Talvez.
Dois vetores de 4 elementos cada são colocados em paralelo. Vetores inp (dados iniciais) e weight (pesos). Quatro elementos foram escritos em cada um deles e depois multiplicados em ponto
Ou seja, devido à operação de multiplicação sequencial, há um aumento? Afinal, dois vetores são paralelizados, nos quais 4 multiplicações (condicionalmente) são realizadas sequencialmente em cada vetor?
Ou seja, devido à operação de multiplicação sequencial, há um aumento? Afinal, dois vetores são paralelizados, nos quais 4 multiplicações (condicionalmente) são realizadas sequencialmente em cada vetor?
O uso de operações de vetor permite que você execute o produto de 4 elementos em paralelo, em vez de sequencialmente. Dê uma olhada no vídeo https://ru.coursera.org/lecture/parallelnoye-programmirovaniye/4-1-chto-takoie-viektorizatsiia-i-zachiem-ona-nuzhna-f8lh3. É sobre OpenMP, mas o significado é o mesmo.