llama.cpp/src/llama-cparams.cpp at 5e1c3aed4074480f63e914d6c44c93536ed1452a - ver4a/llama.cpp - git.uncontrol.me

ver4a/llama.cpp

Georgi Gerganov de2ef53a4b

kv-cache : rework kv_cell (#13706 )

* kv-cache : rework kv_cell

ggml-ci

* kv-cells : use "shift" instead of "delta" consistently

ggml-ci

* llama : add llama_max_parallel_sequences()

ggml-ci

* kv-cells : update comments [no ci]

* context : fail upon construction if sequences exceed max value

ggml-ci

* kv-cells : get_pos() -> pos_get() + comments

ggml-ci

* kv-cells : fix tracking of "used" cells

ggml-ci

2025-05-25 16:34:36 +03:00

5 lines

115 B

C++

Raw Blame History

 #include "llama-cparams.h"
 size_t llama_max_parallel_sequences(void) {
     return LLAMA_MAX_PARALLEL_SEQUENCES;
 }