FFmpeg/libavfilter/x86/Makefile

OBJS-$(CONFIG_AFIR_FILTER)                   += x86/af_afir_init.o
OBJS-$(CONFIG_BLEND_FILTER)                  += x86/vf_blend_init.o
OBJS-$(CONFIG_BWDIF_FILTER)                  += x86/vf_bwdif_init.o
OBJS-$(CONFIG_COLORSPACE_FILTER)             += x86/colorspacedsp_init.o
OBJS-$(CONFIG_EQ_FILTER)                     += x86/vf_eq.o
OBJS-$(CONFIG_FSPP_FILTER)                   += x86/vf_fspp_init.o
OBJS-$(CONFIG_GRADFUN_FILTER)                += x86/vf_gradfun_init.o
OBJS-$(CONFIG_FRAMERATE_FILTER)              += x86/vf_framerate_init.o
OBJS-$(CONFIG_HFLIP_FILTER)                  += x86/vf_hflip_init.o
OBJS-$(CONFIG_HQDN3D_FILTER)                 += x86/vf_hqdn3d_init.o
OBJS-$(CONFIG_IDET_FILTER)                   += x86/vf_idet_init.o
OBJS-$(CONFIG_INTERLACE_FILTER)              += x86/vf_interlace_init.o
OBJS-$(CONFIG_LIMITER_FILTER)                += x86/vf_limiter_init.o
OBJS-$(CONFIG_MASKEDMERGE_FILTER)            += x86/vf_maskedmerge_init.o
OBJS-$(CONFIG_NOISE_FILTER)                  += x86/vf_noise.o
OBJS-$(CONFIG_PP7_FILTER)                    += x86/vf_pp7_init.o
OBJS-$(CONFIG_PSNR_FILTER)                   += x86/vf_psnr_init.o
OBJS-$(CONFIG_PULLUP_FILTER)                 += x86/vf_pullup_init.o
OBJS-$(CONFIG_REMOVEGRAIN_FILTER)            += x86/vf_removegrain_init.o
OBJS-$(CONFIG_SHOWCQT_FILTER)                += x86/avf_showcqt_init.o
OBJS-$(CONFIG_SPP_FILTER)                    += x86/vf_spp.o
OBJS-$(CONFIG_SSIM_FILTER)                   += x86/vf_ssim_init.o
OBJS-$(CONFIG_STEREO3D_FILTER)               += x86/vf_stereo3d_init.o
OBJS-$(CONFIG_TBLEND_FILTER)                 += x86/vf_blend_init.o
OBJS-$(CONFIG_THRESHOLD_FILTER)              += x86/vf_threshold_init.o
OBJS-$(CONFIG_TINTERLACE_FILTER)             += x86/vf_tinterlace_init.o
OBJS-$(CONFIG_VOLUME_FILTER)                 += x86/af_volume_init.o
OBJS-$(CONFIG_W3FDIF_FILTER)                 += x86/vf_w3fdif_init.o
OBJS-$(CONFIG_YADIF_FILTER)                  += x86/vf_yadif_init.o

X86ASM-OBJS-$(CONFIG_AFIR_FILTER)            += x86/af_afir.o
X86ASM-OBJS-$(CONFIG_BLEND_FILTER)           += x86/vf_blend.o
X86ASM-OBJS-$(CONFIG_BWDIF_FILTER)           += x86/vf_bwdif.o
X86ASM-OBJS-$(CONFIG_COLORSPACE_FILTER)      += x86/colorspacedsp.o
X86ASM-OBJS-$(CONFIG_FRAMERATE_FILTER)       += x86/vf_framerate.o
X86ASM-OBJS-$(CONFIG_FSPP_FILTER)            += x86/vf_fspp.o
X86ASM-OBJS-$(CONFIG_GRADFUN_FILTER)         += x86/vf_gradfun.o
X86ASM-OBJS-$(CONFIG_HFLIP_FILTER)           += x86/vf_hflip.o
X86ASM-OBJS-$(CONFIG_HQDN3D_FILTER)          += x86/vf_hqdn3d.o
X86ASM-OBJS-$(CONFIG_IDET_FILTER)            += x86/vf_idet.o
X86ASM-OBJS-$(CONFIG_INTERLACE_FILTER)       += x86/vf_interlace.o
X86ASM-OBJS-$(CONFIG_LIMITER_FILTER)         += x86/vf_limiter.o
X86ASM-OBJS-$(CONFIG_MASKEDMERGE_FILTER)     += x86/vf_maskedmerge.o
X86ASM-OBJS-$(CONFIG_PP7_FILTER)             += x86/vf_pp7.o
X86ASM-OBJS-$(CONFIG_PSNR_FILTER)            += x86/vf_psnr.o
X86ASM-OBJS-$(CONFIG_PULLUP_FILTER)          += x86/vf_pullup.o
ifdef CONFIG_GPL
X86ASM-OBJS-$(CONFIG_REMOVEGRAIN_FILTER)     += x86/vf_removegrain.o
endif
X86ASM-OBJS-$(CONFIG_SHOWCQT_FILTER)         += x86/avf_showcqt.o
X86ASM-OBJS-$(CONFIG_SSIM_FILTER)            += x86/vf_ssim.o
X86ASM-OBJS-$(CONFIG_STEREO3D_FILTER)        += x86/vf_stereo3d.o
X86ASM-OBJS-$(CONFIG_TBLEND_FILTER)          += x86/vf_blend.o
X86ASM-OBJS-$(CONFIG_THRESHOLD_FILTER)       += x86/vf_threshold.o
X86ASM-OBJS-$(CONFIG_TINTERLACE_FILTER)      += x86/vf_interlace.o
X86ASM-OBJS-$(CONFIG_VOLUME_FILTER)          += x86/af_volume.o
X86ASM-OBJS-$(CONFIG_W3FDIF_FILTER)          += x86/vf_w3fdif.o
X86ASM-OBJS-$(CONFIG_YADIF_FILTER)           += x86/vf_yadif.o x86/yadif-16.o x86/yadif-10.o
avfilter: add arbitrary audio FIR filter Signed-off-by: Paul B Mahol <onemda@gmail.com> 2017-01-26 18:03:08 +02:00			`OBJS-$(CONFIG_AFIR_FILTER) += x86/af_afir_init.o`
avfilter/vf_blend: add x86 SIMD for some modes Signed-off-by: Paul B Mahol <onemda@gmail.com> 2015-10-02 17:22:42 +02:00			`OBJS-$(CONFIG_BLEND_FILTER) += x86/vf_blend_init.o`
avfilter/vf_bwdif: add x86 SIMD Signed-off-by: Thomas Mundt <loudmax@yahoo.de> 2016-03-13 11:06:21 +02:00			`OBJS-$(CONFIG_BWDIF_FILTER) += x86/vf_bwdif_init.o`
vf_colorspace: x86-64 SIMD (SSE2) optimizations. 2016-04-06 20:09:08 +02:00			`OBJS-$(CONFIG_COLORSPACE_FILTER) += x86/colorspacedsp_init.o`
avfilter: Port mp=eq/eq2 to lavfi Code adapted from James Darnley's port Some fixes from Paul B Mahol <onemda@gmail.com> Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2015-01-19 00:26:48 +02:00			`OBJS-$(CONFIG_EQ_FILTER) += x86/vf_eq.o`
x86/vf_fspp: port inline asm to yasm Reviewed-by: Michael Niedermayer <michaelni@gmx.at> Signed-off-by: James Almer <jamrial@gmail.com> 2014-12-26 20:37:54 +02:00			`OBJS-$(CONFIG_FSPP_FILTER) += x86/vf_fspp_init.o`
avfilter: x86: Port gradfun filter optimizations to yasm Signed-off-by: Diego Biurrun <diego@biurrun.de> 2013-10-22 03:37:46 +03:00			`OBJS-$(CONFIG_GRADFUN_FILTER) += x86/vf_gradfun_init.o`
avfilter/vf_framerate: add SIMD functions for frame blending Blend function speedups on x86_64 Core i5 4460: ffmpeg -f lavfi -i allyuv -vf framerate=60:threads=1 -f null none C: 447548411 decicycles in Blend, 2048 runs, 0 skips SSSE3: 130020087 decicycles in Blend, 2048 runs, 0 skips AVX2: 128508221 decicycles in Blend, 2048 runs, 0 skips ffmpeg -f lavfi -i allyuv -vf format=yuv420p12,framerate=60:threads=1 -f null none C: 228932745 decicycles in Blend, 2048 runs, 0 skips SSE4: 123357781 decicycles in Blend, 2048 runs, 0 skips AVX2: 121215353 decicycles in Blend, 2048 runs, 0 skips Signed-off-by: Marton Balint <cus@passwd.hu> 2018-01-08 02:05:45 +02:00			`OBJS-$(CONFIG_FRAMERATE_FILTER) += x86/vf_framerate_init.o`
avfilter: add hflip x86 SIMD Signed-off-by: Paul B Mahol <onemda@gmail.com> 2017-12-01 21:56:45 +02:00			`OBJS-$(CONFIG_HFLIP_FILTER) += x86/vf_hflip_init.o`
vf_hqdn3d: x86: Add proper arch optimization initialization 2013-01-22 03:39:37 +03:00			`OBJS-$(CONFIG_HQDN3D_FILTER) += x86/vf_hqdn3d_init.o`
avfilter/vf_idet: MMX/MMXEXT/SSE2 implementation of idet's filter_line() integration by Neil Birkbeck, with help from Vitor Sessak. core SSE2 loop by Skal (pascal.massimino@gmail.com) Reviewed-by: Clément Bœsch <u@pkh.me> Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2014-09-03 12:02:32 +03:00			`OBJS-$(CONFIG_IDET_FILTER) += x86/vf_idet_init.o`
vf_interlace: Add SIMD for lowpass filter Signed-off-by: Luca Barbato <lu_zero@gentoo.org> 2014-11-11 20:43:42 +02:00			`OBJS-$(CONFIG_INTERLACE_FILTER) += x86/vf_interlace_init.o`
avfilter: add limiter filter Signed-off-by: Paul B Mahol <onemda@gmail.com> 2017-07-03 17:42:03 +02:00			`OBJS-$(CONFIG_LIMITER_FILTER) += x86/vf_limiter_init.o`
avfilter/vf_maskedmerge: add SIMD for maskedmerge with 8 bit depth input Signed-off-by: Paul B Mahol <onemda@gmail.com> 2015-09-30 23:00:14 +02:00			`OBJS-$(CONFIG_MASKEDMERGE_FILTER) += x86/vf_maskedmerge_init.o`
x86/vf_noise: move asm code to a separate file Reviewed-by: Michael Niedermayer <michaelni@gmx.at> Signed-off-by: James Almer <jamrial@gmail.com> 2014-10-17 04:24:42 +03:00			`OBJS-$(CONFIG_NOISE_FILTER) += x86/vf_noise.o`
x86/vf_pp7: port dctB_mmx to yasm Reviewed-by: Michael Niedermayer <michaelni@gmx.at> Signed-off-by: James Almer <jamrial@gmail.com> 2015-01-09 21:51:13 +02:00			`OBJS-$(CONFIG_PP7_FILTER) += x86/vf_pp7_init.o`
vf_psnr: sse2 optimizations for sum-squared-error. The internal line accumulator for 16bit can overflow, so I changed that from int to uint64_t in the C code. The matching assembly looks a little weird but output looks correct. (avx2 should be trivial to add later.) Reviewed-by: Paul B Mahol <onemda@gmail.com> Reviewed-by: James Almer <jamrial@gmail.com> Signed-off-by: Michael Niedermayer <michael@niedermayer.cc> 2015-07-12 12:44:39 +02:00			`OBJS-$(CONFIG_PSNR_FILTER) += x86/vf_psnr_init.o`
avfilter: port pullup filter from libmpcodecs Signed-off-by: Paul B Mahol <onemda@gmail.com> 2013-07-08 15:42:53 +03:00			`OBJS-$(CONFIG_PULLUP_FILTER) += x86/vf_pullup_init.o`
avfilter/vf_removegrain: add x86 and x86_64 SSE2 functions Speed of all modes increased by a factor between 7.4 and 19.8 largely depending on whether bytes are unpacked into words. Modes 2, 3, and 4 have been sped-up by a factor of 43 (thanks quick sort!) All modes are available on x86_64 but only modes 1, 10, 11, 12, 13, 14, 19, 20, 21, and 22 are available on x86 due to the number of SIMD registers used. With a contribution from James Almer <jamrial@gmail.com> 2015-07-15 01:48:47 +02:00			`OBJS-$(CONFIG_REMOVEGRAIN_FILTER) += x86/vf_removegrain_init.o`
avfilter/avf_showcqt: cqt_calc optimization on x86 on x86_64: time PSNR plain 3.303 inf SSE 1.649 107.087535 SSE3 1.632 107.087535 AVX 1.409 106.986771 FMA3 1.265 107.108437 on x86_32 (PSNR compared to x86_64 plain): time PSNR plain 7.225 103.951979 SSE 1.827 105.859282 SSE3 1.819 105.859282 AVX 1.533 105.997661 FMA3 1.384 105.885377 FMA4 test is not available Reviewed-by: James Almer <jamrial@gmail.com> Signed-off-by: Muhammad Faiz <mfcc64@gmail.com> 2016-06-04 09:33:05 +02:00			`OBJS-$(CONFIG_SHOWCQT_FILTER) += x86/avf_showcqt_init.o`
lavfi: add spp filter. 2013-05-11 13:03:38 +03:00			`OBJS-$(CONFIG_SPP_FILTER) += x86/vf_spp.o`
vf_ssim: x86 simd for ssim_4x4xN and ssim_endN. Both are 2-2.5x faster than their C counterpart. Reviewed-by: Paul B Mahol <onemda@gmail.com> Reviewed-by: James Almer <jamrial@gmail.com> Signed-off-by: Michael Niedermayer <michael@niedermayer.cc> 2015-07-13 01:33:06 +02:00			`OBJS-$(CONFIG_SSIM_FILTER) += x86/vf_ssim_init.o`
avfilter/vf_stereo3d: add x86 SIMD for anaglyph outputs Signed-off-by: Paul B Mahol <onemda@gmail.com> 2015-10-04 11:34:03 +02:00			`OBJS-$(CONFIG_STEREO3D_FILTER) += x86/vf_stereo3d_init.o`
avfilter/vf_blend: add x86 SIMD for some modes Signed-off-by: Paul B Mahol <onemda@gmail.com> 2015-10-02 17:22:42 +02:00			`OBJS-$(CONFIG_TBLEND_FILTER) += x86/vf_blend_init.o`
avfilter/vf_threshold: add x86 SIMD Signed-off-by: Paul B Mahol <onemda@gmail.com> 2017-11-12 20:11:51 +02:00			`OBJS-$(CONFIG_THRESHOLD_FILTER) += x86/vf_threshold_init.o`
avfilter/tinterlace: add Support for ff_lowpass_line_avx() & ff_lowpass_line_sse2() Based-on: 2e1704059ae8625beda2ffde847ad22c5ba416dc by Kieran Kunhya Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2014-11-15 04:49:37 +02:00			`OBJS-$(CONFIG_TINTERLACE_FILTER) += x86/vf_tinterlace_init.o`
x86: af_volume: add SSE2-optimized s16 volume scaling 2012-09-23 21:49:26 +03:00			`OBJS-$(CONFIG_VOLUME_FILTER) += x86/af_volume_init.o`
avfilter/vf_w3fdif: add x86 SIMD Signed-off-by: Paul B Mahol <onemda@gmail.com> 2015-10-07 21:03:16 +02:00			`OBJS-$(CONFIG_W3FDIF_FILTER) += x86/vf_w3fdif_init.o`
Revert "Revert "vf_yadif: move x86 init code to x86/yadif.c"" This reverts commit 975110a85ef8e794fdc041455ff41b0ad30bc01e. Signed-off-by: Robert Krüger <krueger@lesspain.de> Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2014-01-04 15:49:38 +03:00			`OBJS-$(CONFIG_YADIF_FILTER) += x86/vf_yadif_init.o`
avfilter: call x86 init functions under if (ARCH_X86), not if (HAVE_MMX) 2012-08-29 20:37:14 +03:00
build: Generalize yasm/nasm-related variable names None of them are specific to the YASM assembler. (Cherry-picked from libav commit 39e208f4d4756367c7cd2d581847e0c1b8a429c1) Signed-off-by: James Almer <jamrial@gmail.com> 2016-10-08 16:18:33 +02:00			`X86ASM-OBJS-$(CONFIG_AFIR_FILTER) += x86/af_afir.o`
			`X86ASM-OBJS-$(CONFIG_BLEND_FILTER) += x86/vf_blend.o`
			`X86ASM-OBJS-$(CONFIG_BWDIF_FILTER) += x86/vf_bwdif.o`
			`X86ASM-OBJS-$(CONFIG_COLORSPACE_FILTER) += x86/colorspacedsp.o`
avfilter/vf_framerate: add SIMD functions for frame blending Blend function speedups on x86_64 Core i5 4460: ffmpeg -f lavfi -i allyuv -vf framerate=60:threads=1 -f null none C: 447548411 decicycles in Blend, 2048 runs, 0 skips SSSE3: 130020087 decicycles in Blend, 2048 runs, 0 skips AVX2: 128508221 decicycles in Blend, 2048 runs, 0 skips ffmpeg -f lavfi -i allyuv -vf format=yuv420p12,framerate=60:threads=1 -f null none C: 228932745 decicycles in Blend, 2048 runs, 0 skips SSE4: 123357781 decicycles in Blend, 2048 runs, 0 skips AVX2: 121215353 decicycles in Blend, 2048 runs, 0 skips Signed-off-by: Marton Balint <cus@passwd.hu> 2018-01-08 02:05:45 +02:00			`X86ASM-OBJS-$(CONFIG_FRAMERATE_FILTER) += x86/vf_framerate.o`
build: Generalize yasm/nasm-related variable names None of them are specific to the YASM assembler. (Cherry-picked from libav commit 39e208f4d4756367c7cd2d581847e0c1b8a429c1) Signed-off-by: James Almer <jamrial@gmail.com> 2016-10-08 16:18:33 +02:00			`X86ASM-OBJS-$(CONFIG_FSPP_FILTER) += x86/vf_fspp.o`
			`X86ASM-OBJS-$(CONFIG_GRADFUN_FILTER) += x86/vf_gradfun.o`
avfilter: add hflip x86 SIMD Signed-off-by: Paul B Mahol <onemda@gmail.com> 2017-12-01 21:56:45 +02:00			`X86ASM-OBJS-$(CONFIG_HFLIP_FILTER) += x86/vf_hflip.o`
build: Generalize yasm/nasm-related variable names None of them are specific to the YASM assembler. (Cherry-picked from libav commit 39e208f4d4756367c7cd2d581847e0c1b8a429c1) Signed-off-by: James Almer <jamrial@gmail.com> 2016-10-08 16:18:33 +02:00			`X86ASM-OBJS-$(CONFIG_HQDN3D_FILTER) += x86/vf_hqdn3d.o`
			`X86ASM-OBJS-$(CONFIG_IDET_FILTER) += x86/vf_idet.o`
			`X86ASM-OBJS-$(CONFIG_INTERLACE_FILTER) += x86/vf_interlace.o`
avfilter: add limiter filter Signed-off-by: Paul B Mahol <onemda@gmail.com> 2017-07-03 17:42:03 +02:00			`X86ASM-OBJS-$(CONFIG_LIMITER_FILTER) += x86/vf_limiter.o`
build: Generalize yasm/nasm-related variable names None of them are specific to the YASM assembler. (Cherry-picked from libav commit 39e208f4d4756367c7cd2d581847e0c1b8a429c1) Signed-off-by: James Almer <jamrial@gmail.com> 2016-10-08 16:18:33 +02:00			`X86ASM-OBJS-$(CONFIG_MASKEDMERGE_FILTER) += x86/vf_maskedmerge.o`
			`X86ASM-OBJS-$(CONFIG_PP7_FILTER) += x86/vf_pp7.o`
			`X86ASM-OBJS-$(CONFIG_PSNR_FILTER) += x86/vf_psnr.o`
			`X86ASM-OBJS-$(CONFIG_PULLUP_FILTER) += x86/vf_pullup.o`
avfilter/vf_removegrain: add x86 and x86_64 SSE2 functions Speed of all modes increased by a factor between 7.4 and 19.8 largely depending on whether bytes are unpacked into words. Modes 2, 3, and 4 have been sped-up by a factor of 43 (thanks quick sort!) All modes are available on x86_64 but only modes 1, 10, 11, 12, 13, 14, 19, 20, 21, and 22 are available on x86 due to the number of SIMD registers used. With a contribution from James Almer <jamrial@gmail.com> 2015-07-15 01:48:47 +02:00			`ifdef CONFIG_GPL`
build: Generalize yasm/nasm-related variable names None of them are specific to the YASM assembler. (Cherry-picked from libav commit 39e208f4d4756367c7cd2d581847e0c1b8a429c1) Signed-off-by: James Almer <jamrial@gmail.com> 2016-10-08 16:18:33 +02:00			`X86ASM-OBJS-$(CONFIG_REMOVEGRAIN_FILTER) += x86/vf_removegrain.o`
avfilter/vf_removegrain: add x86 and x86_64 SSE2 functions Speed of all modes increased by a factor between 7.4 and 19.8 largely depending on whether bytes are unpacked into words. Modes 2, 3, and 4 have been sped-up by a factor of 43 (thanks quick sort!) All modes are available on x86_64 but only modes 1, 10, 11, 12, 13, 14, 19, 20, 21, and 22 are available on x86 due to the number of SIMD registers used. With a contribution from James Almer <jamrial@gmail.com> 2015-07-15 01:48:47 +02:00			`endif`
build: Generalize yasm/nasm-related variable names None of them are specific to the YASM assembler. (Cherry-picked from libav commit 39e208f4d4756367c7cd2d581847e0c1b8a429c1) Signed-off-by: James Almer <jamrial@gmail.com> 2016-10-08 16:18:33 +02:00			`X86ASM-OBJS-$(CONFIG_SHOWCQT_FILTER) += x86/avf_showcqt.o`
			`X86ASM-OBJS-$(CONFIG_SSIM_FILTER) += x86/vf_ssim.o`
			`X86ASM-OBJS-$(CONFIG_STEREO3D_FILTER) += x86/vf_stereo3d.o`
			`X86ASM-OBJS-$(CONFIG_TBLEND_FILTER) += x86/vf_blend.o`
avfilter/vf_threshold: add x86 SIMD Signed-off-by: Paul B Mahol <onemda@gmail.com> 2017-11-12 20:11:51 +02:00			`X86ASM-OBJS-$(CONFIG_THRESHOLD_FILTER) += x86/vf_threshold.o`
build: Generalize yasm/nasm-related variable names None of them are specific to the YASM assembler. (Cherry-picked from libav commit 39e208f4d4756367c7cd2d581847e0c1b8a429c1) Signed-off-by: James Almer <jamrial@gmail.com> 2016-10-08 16:18:33 +02:00			`X86ASM-OBJS-$(CONFIG_TINTERLACE_FILTER) += x86/vf_interlace.o`
			`X86ASM-OBJS-$(CONFIG_VOLUME_FILTER) += x86/af_volume.o`
			`X86ASM-OBJS-$(CONFIG_W3FDIF_FILTER) += x86/vf_w3fdif.o`
			`X86ASM-OBJS-$(CONFIG_YADIF_FILTER) += x86/vf_yadif.o x86/yadif-16.o x86/yadif-10.o`