티스토리 뷰
특정한 크기의 행렬에서 동작할 수 있는 가속기와 병렬적으로 연산을 할 수 있는 하드웨어의 특징을 효율적으로 활용하기 위해서는 이런 특성에 맞게 연산을 할 필요가 있다.
이중에서도 특정 크기의 행렬을 가속하기 위해서 입력으로 주어지는 행렬의 크기를 특정한 크기로 잘라서 연산하는 것을 고민하였다.
특정한 크기로 행렬을 자르게 되면 그 외의 submatrix에서는 크기가 맞지 않을 수도 있다.
그런 크기로 나눠진 것도 한번에 연산을 진행하는 것이 아니라 잘라서 연산을 하는 식으로 한다면 하드웨어의 특징을 최대한 사용할 수 있을 것이다.
위와 같이 생각을 한 후에 가속기 외에서 병렬적으로 연산을 하기 위해서 행렬을 잘라서 하는 것은 어떨지 고민을 해보았지만 쉽게 답이 나오지 않아서 관련 논문으로는 어떤 것이 있을 지 살펴봤더니 시간이 빠르게 지나갔다.
논문 탐색과 같은 과정은 모각코에서 하는 것보다는 다른 시간에 틈틈히 하는 것이 좋았을 거라는 생각이 들지만 그래도 이렇게라도 시간을 써서 생각을 했다는 점이 좋았다.