mirror of
https://github.com/FFmpeg/FFmpeg.git
synced 2025-04-19 09:02:26 +02:00
avcodec/arm/int_neon: fix handling sizes % 16 != 0
This assumes the array is sufficiently padded with 0 Signed-off-by: Michael Niedermayer <michaelni@gmx.at>
This commit is contained in:
parent
429f742a61
commit
ccc48b318b
@ -35,7 +35,7 @@ function ff_scalarproduct_int16_neon, export=1
|
|||||||
vmlal.s16 q2, d18, d22
|
vmlal.s16 q2, d18, d22
|
||||||
vmlal.s16 q3, d19, d23
|
vmlal.s16 q3, d19, d23
|
||||||
subs r2, r2, #16
|
subs r2, r2, #16
|
||||||
bne 1b
|
bgt 1b
|
||||||
|
|
||||||
vpadd.s32 d16, d0, d1
|
vpadd.s32 d16, d0, d1
|
||||||
vpadd.s32 d17, d2, d3
|
vpadd.s32 d17, d2, d3
|
||||||
@ -75,7 +75,7 @@ function ff_scalarproduct_and_madd_int16_neon, export=1
|
|||||||
vst1.16 {q10}, [r12,:128]!
|
vst1.16 {q10}, [r12,:128]!
|
||||||
subs r3, r3, #16
|
subs r3, r3, #16
|
||||||
vst1.16 {q13}, [r12,:128]!
|
vst1.16 {q13}, [r12,:128]!
|
||||||
bne 1b
|
bgt 1b
|
||||||
|
|
||||||
vpadd.s32 d16, d0, d1
|
vpadd.s32 d16, d0, d1
|
||||||
vpadd.s32 d17, d2, d3
|
vpadd.s32 d17, d2, d3
|
||||||
|
Loading…
x
Reference in New Issue
Block a user