Restructuring and implementations of 2D matrix transpose algorithm using SSE4 vector instructions

Current general-purpose processors are augmented with vector instructions that can process many elements of matrices and vectors in parallel. Transposing a matrix in-place is a main kernel operation required by many scientific and engineering applications to shuttle data before, during, or after pro...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:2015 International Conference on Applied Research in Computer Science and Engineering (ICAR) S. 1 - 7
1. Verfasser: Zekri, Ahmed S.
Format: Tagungsbericht
Sprache:Englisch
Veröffentlicht: IEEE 01.10.2015
Schlagworte:
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!