2017-02-25 14 views
0

私はaarch64の新しいld4r命令と混乱します。Neon 64bit aarch64:混乱についてld4r

次のコード(V [20~23]にSAME 4の32ビット値をロード)は:

ld1 { v20.4s }, [out1] 
mov v21.16b, v20.16b 
mov v22.16b, v20.16b 
mov v23.16b, v20.16b 

それはdoesnの:

ld1 { v20.4s }, [out1] 
ld1 { v21.4s }, [out1] 
ld1 { v22.4s }, [out1] 
ld1 { v23.4s }, [out1] 

次のコードと同等であると思われます

ld4r { v20.4s, v21.4s, v22.4s, v23.4s }, [out1] 

ld4r命令の読み方は間違っていますか?それは4レーンを越えて反復することになっていませんか?

答えて

0

ld4rは1つの4要素構造だけを読み込み、SAMEレーンを越えてそれを複製するようです。これはレーン間の複製ではありません。

関連する問題