0
私はaarch64の新しいld4r命令と混乱します。Neon 64bit aarch64:混乱についてld4r
次のコード(V [20~23]にSAME 4の32ビット値をロード)は:
ld1 { v20.4s }, [out1]
mov v21.16b, v20.16b
mov v22.16b, v20.16b
mov v23.16b, v20.16b
それはdoesnの:
ld1 { v20.4s }, [out1]
ld1 { v21.4s }, [out1]
ld1 { v22.4s }, [out1]
ld1 { v23.4s }, [out1]
次のコードと同等であると思われます
ld4r { v20.4s, v21.4s, v22.4s, v23.4s }, [out1]
ld4r命令の読み方は間違っていますか?それは4レーンを越えて反復することになっていませんか?