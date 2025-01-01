#define M 3000 // 첫 번째 행렬의 행 수

#define K 2000 // 첫 번째 행렬의 열 수는 두 번째 행렬의 행 수와 같습니다.

#define N 3000 // 두 번째 행렬의 열 수



/+------------------------------------------------------------------+

const string clSrc=

"#define N "+IntegerToString(N)+" \r

"

"#define K "+IntegerToString(K)+" \r

"

" \r

"

"__kernel void matricesMul( __global float *in1, \r

"

" __global float *in2, \r

"

" __global float *out ) \r

"

"{ \r

"

" int m = get_global_id( 0 ); \r

"

" int n = get_global_id( 1 ); \r

"

" float sum = 0.0; \r

"

" for( int k = 0; k < K; k ++ ) \r

"

" sum += in1[ m * K + k ] * in2[ k * N + n ]; \r

"

" out[ m * N + n ] = sum; \r

"

"} \r

";

/+------------------------------------------------------------------+

//| 프로그램 시작 함수 스크립트 |

/+------------------------------------------------------------------+

void OnStart()

{

//--- 랜덤 넘버 생성기 초기화

MathSrand((int)TimeCurrent());

//--- 랜덤 값으로 주어진 크기의 행렬 채우기

matrixf mat1(M, K, MatrixRandom) ; // first matrix

matrixf mat2(K, N, MatrixRandom); // second matrix



//--- 네이티브 메서드를 사용하여 행렬의 곱을 계산

uint start=GetTickCount();

matrixf matrix_naive=matrixf::Zeros(M, N);// 두 행렬을 곱한 결과가 여기에 설정됩니다.

for(int m=0; m<M; m++)

for(int k=0; k<K; k++)

for(int n=0; n<N; n++)

matrix_naive[m][n]+=mat1[m][k]*mat2[k][n];

uint time_naive=GetTickCount()-start;



//--- MatMull을 통해 행렬의 곱을 계산

start=GetTickCount();

matrixf matrix_matmul=mat1.MatMul(mat2);

uint time_matmul=GetTickCount()-start;



//--- OpenCL에서 행렬의 곱 계산

matrixf matrix_opencl=matrixf::Zeros(M, N);

int cl_ctx; // 컨텍스트 핸들

if((cl_ctx=CLContextCreate(CL_USE_GPU_ONLY))==INVALID_HANDLE)

{

Print("OpenCL not found, leaving");

return;

}

int cl_prg; // 프로그램 핸들

int cl_krn; // 커널 핸들

int cl_mem_in1; // 첫번째(입력) 버퍼 핸들

int cl_mem_in2; // 두번째(입력) 버퍼 핸들e

int cl_mem_out; // 세번째(입력) 버퍼 핸들

//--- 프로그램과 커널 생성

cl_prg = CLProgramCreate(cl_ctx, clSrc);

cl_krn = CLKernelCreate(cl_prg, "matricesMul");

//--- 3개의 행렬에 대해 3개의 버퍼를 모두 생성

cl_mem_in1=CLBufferCreate(cl_ctx, M*K*sizeof(float), CL_MEM_READ_WRITE);

cl_mem_in2=CLBufferCreate(cl_ctx, K*N*sizeof(float), CL_MEM_READ_WRITE);

//--- 세번째 행렬 - 출력

cl_mem_out=CLBufferCreate(cl_ctx, M*N*sizeof(float), CL_MEM_READ_WRITE);

//--- 커널 인수 설정

CLSetKernelArgMem(cl_krn, 0, cl_mem_in1);

CLSetKernelArgMem(cl_krn, 1, cl_mem_in2);

CLSetKernelArgMem(cl_krn, 2, cl_mem_out);

//--- 장치 버퍼에 행렬 쓰기

CLBufferWrite(cl_mem_in1, 0, mat1);

CLBufferWrite(cl_mem_in2, 0, mat2);

CLBufferWrite(cl_mem_out, 0, matrix_opencl);

//--- OpenCL 코드 실행 시간 시작

start=GetTickCount();

//--- 태스크 작업 영역의 매개변수를 설정하고 OpenCL 프로그램을 실행

uint offs[2] = {0, 0};

uint works[2] = {M, N};

start=GetTickCount();

bool ex=CLExecute(cl_krn, 2, offs, works);

//--- 결과를 행렬로 계산

if(CLBufferRead(cl_mem_out, 0, matrix_opencl))

PrintFormat("[%d x %d] matrix read: ", matrix_opencl.Rows(), matrix_opencl.Cols());

else

Print("CLBufferRead(cl_mem_out, 0, matrix_opencl failed. Error ",GetLastError());

uint time_opencl=GetTickCount()-start;

Print("Compare calculation time using each method");

PrintFormat("Naive product time = %d ms",time_naive);

PrintFormat("MatMul product time = %d ms",time_matmul);

PrintFormat("OpenCl product time = %d ms",time_opencl);

//--- 모든 OpenCL 컨텍스트 해제

CLFreeAll(cl_ctx, cl_prg, cl_krn, cl_mem_in1, cl_mem_in2, cl_mem_out);



//--- 얻은 모든 결과 행렬을 서로 비교

Print("How many discrepancy errors are there between result matrices?");

ulong errors=matrix_naive.Compare(matrix_matmul,(float)1e-12);

Print("matrix_direct.Compare(matrix_matmul,1e-12)=",errors);

errors=matrix_matmul.Compare(matrix_opencl,float(1e-12));

Print("matrix_matmul.Compare(matrix_opencl,1e-12)=",errors);

/*

결과:



[3000 x 3000] matrix read:

각 메서드별 계산 시간 비교

Naive product time = 54750 ms

MatMul product time = 4578 ms

OpenCl product time = 922 ms

결과 행렬 사이에 얼마나 많은 불일치 오류가 있을까요?

matrix_direct.Compare(matrix_matmul,1e-12)=0

matrix_matmul.Compare(matrix_opencl,1e-12)=0

*/

}

/+------------------------------------------------------------------+

//| 행렬을 임의의 값으로 채웁니다. |

/+------------------------------------------------------------------+

void MatrixRandom(matrixf& m)

{

for(ulong r=0; r<m.Rows(); r++)

{

for(ulong c=0; c<m.Cols(); c++)

{

m[r][c]=(float)((MathRand()-16383.5)/32767.);

}

}

}

/+------------------------------------------------------------------+

//| 모든 OpenCL 컨텍스트 해제 |

/+------------------------------------------------------------------+

void CLFreeAll(int cl_ctx, int cl_prg, int cl_krn,

int cl_mem_in1, int cl_mem_in2, int cl_mem_out)

{

//--- OpenCL에서 생성한 모든 컨텍스트를 역순으로 삭제

CLBufferFree(cl_mem_in1);

CLBufferFree(cl_mem_in2);

CLBufferFree(cl_mem_out);

CLKernelFree(cl_krn);

CLProgramFree(cl_prg);

CLContextFree(cl_ctx);

}