llama.cpp

History

Georgi Gerganov 611aa914ef metal : optimize MoE for large batches (#13388 ) ggml-ci		2025-05-09 15:14:56 +03:00
..
cmake	scripts : update sync + fix cmake merge	2025-03-27 10:09:29 +02:00
include	CUDA: fix bad asserts for partial offload (#13337 )	2025-05-06 13:58:51 +02:00
src	metal : optimize MoE for large batches (#13388 )	2025-05-09 15:14:56 +03:00
.gitignore	vulkan : cmake integration (#8119 )	2024-07-13 18:12:39 +02:00
CMakeLists.txt	whisper: remove MSVC warnings pragmas (whisper/3090)	2025-05-07 17:28:36 +03:00