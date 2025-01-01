#define M 3000 // число строк в первой матрице

#define K 2000 // число столбцов в первой матрице равно числу строк во второй

#define N 3000 // число столбцов во второй матрице



//+------------------------------------------------------------------+

const string clSrc=

"#define N "+IntegerToString(N)+" \r

"

"#define K "+IntegerToString(K)+" \r

"

" \r

"

"__kernel void matricesMul( __global float *in1, \r

"

" __global float *in2, \r

"

" __global float *out ) \r

"

"{ \r

"

" int m = get_global_id( 0 ); \r

"

" int n = get_global_id( 1 ); \r

"

" float sum = 0.0; \r

"

" for( int k = 0; k < K; k ++ ) \r

"

" sum += in1[ m * K + k ] * in2[ k * N + n ]; \r

"

" out[ m * N + n ] = sum; \r

"

"} \r

";

//+------------------------------------------------------------------+

//| Script program start function |

//+------------------------------------------------------------------+

void OnStart()

{

//--- инициализируем генератор случайных чисел

MathSrand((int)TimeCurrent());

//--- заполним матрицы заданного размера случайными значениями

matrixf mat1(M, K, MatrixRandom) ; // первая матрица

matrixf mat2(K, N, MatrixRandom); // вторая матрица



//--- посчитаем произведение матриц наивным способом

uint start=GetTickCount();

matrixf matrix_naive=matrixf::Zeros(M, N);// сюда запишем результат умножения двух матриц

for(int m=0; m<M; m++)

for(int k=0; k<K; k++)

for(int n=0; n<N; n++)

matrix_naive[m][n]+=mat1[m][k]*mat2[k][n];

uint time_naive=GetTickCount()-start;



//--- посчитаем произведение матриц через MatMull

start=GetTickCount();

matrixf matrix_matmul=mat1.MatMul(mat2);

uint time_matmul=GetTickCount()-start;



//--- посчитаем произведение матриц в OpenCL

matrixf matrix_opencl=matrixf::Zeros(M, N);

int cl_ctx; // хэндл контекста

if((cl_ctx=CLContextCreate(CL_USE_GPU_ONLY))==INVALID_HANDLE)

{

Print("OpenCL не найдено, выходим");

return;

}

int cl_prg; // хэндл программы

int cl_krn; // хэндл кернела

int cl_mem_in1; // хэндл первого буфера (входного)

int cl_mem_in2; // хэндл второго буфера (входного)

int cl_mem_out; // хэндл третьего буфера (выходного)

//--- создаем программу и кернел

cl_prg = CLProgramCreate(cl_ctx, clSrc);

cl_krn = CLKernelCreate(cl_prg, "matricesMul");

//--- создаем все три буфера для трех матриц

cl_mem_in1=CLBufferCreate(cl_ctx, M*K*sizeof(float), CL_MEM_READ_WRITE);

cl_mem_in2=CLBufferCreate(cl_ctx, K*N*sizeof(float), CL_MEM_READ_WRITE);

//--- третья матрица - выходная

cl_mem_out=CLBufferCreate(cl_ctx, M*N*sizeof(float), CL_MEM_READ_WRITE);

//--- устанавливаем аргументы кернела

CLSetKernelArgMem(cl_krn, 0, cl_mem_in1);

CLSetKernelArgMem(cl_krn, 1, cl_mem_in2);

CLSetKernelArgMem(cl_krn, 2, cl_mem_out);

//--- пишем матрицы в буферы девайса

CLBufferWrite(cl_mem_in1, 0, mat1);

CLBufferWrite(cl_mem_in2, 0, mat2);

CLBufferWrite(cl_mem_out, 0, matrix_opencl);

//--- старт времени исполнения кода OpenCL

start=GetTickCount();

//--- устанавливаем параметры рабочего пространства задачи и исполняем программу OpenCL

uint offs[2] = {0, 0};

uint works[2] = {M, N};

start=GetTickCount();

bool ex=CLExecute(cl_krn, 2, offs, works);

//--- считываем результат в матрицу

if(CLBufferRead(cl_mem_out, 0, matrix_opencl))

PrintFormat("Прочитана матрица [%d x %d]: ", matrix_opencl.Rows(), matrix_opencl.Cols());

else

Print("CLBufferRead(cl_mem_out, 0, matrix_opencl failed. Error ",GetLastError());

uint time_opencl=GetTickCount()-start;

Print("Сравним время вычислений каждым методом");

PrintFormat("Naive product time = %d ms",time_naive);

PrintFormat("MatMul product time = %d ms",time_matmul);

PrintFormat("OpenCl product time = %d ms",time_opencl);

//--- освободим все OpenCL контексты

CLFreeAll(cl_ctx, cl_prg, cl_krn, cl_mem_in1, cl_mem_in2, cl_mem_out);



//--- сравним все полученные матрицы результатов между собой

Print("Cколько ошибок расхождения между матрицами результатов?");

ulong errors=matrix_naive.Compare(matrix_matmul,(float)1e-12);

Print("matrix_direct.Compare(matrix_matmul,1e-12)=",errors);

errors=matrix_matmul.Compare(matrix_opencl,float(1e-12));

Print("matrix_matmul.Compare(matrix_opencl,1e-12)=",errors);

/*

Результат:



Прочитана матрица [3000 x 3000]:

Сравним время вычислений каждым методом

Naive product time = 54750 ms

MatMul product time = 4578 ms

OpenCl product time = 922 ms

Cколько ошибок расхождения между матрицами результатов?

matrix_direct.Compare(matrix_matmul,1e-12)=0

matrix_matmul.Compare(matrix_opencl,1e-12)=0

*/

}

//+------------------------------------------------------------------+

//| Заполняет матрицу случайными значениями |

//+------------------------------------------------------------------+

void MatrixRandom(matrixf& m)

{

for(ulong r=0; r<m.Rows(); r++)

{

for(ulong c=0; c<m.Cols(); c++)

{

m[r][c]=(float)((MathRand()-16383.5)/32767.);

}

}

}

//+------------------------------------------------------------------+

//| Освободим все OpenCL контексты |

//+------------------------------------------------------------------+

void CLFreeAll(int cl_ctx, int cl_prg, int cl_krn,

int cl_mem_in1, int cl_mem_in2, int cl_mem_out)

{

//--- удвляем в обратной последовательности все созданные OpenCL контексты

CLBufferFree(cl_mem_in1);

CLBufferFree(cl_mem_in2);

CLBufferFree(cl_mem_out);

CLKernelFree(cl_krn);

CLProgramFree(cl_prg);

CLContextFree(cl_ctx);

}