llama.cpp

Author	SHA1	Message	Date
Georgi Gerganov	745aa5319b	llama : deprecate llama_kv_self_ API (#14030 ) * llama : deprecate llama_kv_self_ API ggml-ci * llama : allow llama_memory_(nullptr) ggml-ci * memory : add flag for optional data clear in llama_memory_clear ggml-ci	2025-06-06 14:11:15 +03:00
Georgi Gerganov	3e63a58ef7	kv-cache : refactor the update/defrag mechanism (#13988 ) * kv-cache : refactor update mechanism ggml-ci * memory : improve status handling * defrag : reset head + add comments ggml-ci * cont : minor fixes ggml-ci	2025-06-04 18:58:20 +03:00
Georgi Gerganov	e0e806f52e	kv-cache : fix unified::seq_rm to work with seq_id < 0 (#13985 ) ggml-ci	2025-06-04 09:50:32 +03:00
Georgi Gerganov	0fc16b42e8	kv-cache : split implementation in separate sources (#13920 ) ggml-ci	2025-06-01 11:39:27 +03:00