SpMdM: Added CUDA implementation for hyb_matrix, thus resolving #22 (e1617c38) · Commits · Kaushik Kulkarni / viennacl-dev

Commit e1617c38 authored Dec 11, 2013 by Karl Rupp

SpMdM: Added CUDA implementation for hyb_matrix, thus resolving #22

Now:
 C = prod(A, B); C = prod(A, trans(B));
fully supported, where A is sparse and B, C are dense (both row- or column-major).
Some kernels can be further tuned towards improved coalesced memory transfers,
or for avoiding memory transfers at all.

parent b4442cd3

Hide whitespace changes

Inline Side-by-side

Please register or to comment