llama: Add support for RWKV v7 architecture (#12412)

* ggml: Add op l2_norm

Signed-off-by: Molly Sophia <mollysophia379@gmail.com>

* ggml: Add op rwkv_wkv7

Signed-off-by: Molly Sophia <mollysophia379@gmail.com>

* llama: Add support for RWKV7 and ARWKV7 models

Signed-off-by: Molly Sophia <mollysophia379@gmail.com>

* llama: fix inference with RWKV6Qwen2

Signed-off-by: Molly Sophia <mollysophia379@gmail.com>

* llama: add more (a)rwkv7 variants in size

Signed-off-by: Molly Sophia <mollysophia379@gmail.com>

* Apply code-format changes

Signed-off-by: Molly Sophia <mollysophia379@gmail.com>

* fix MUSA build

Signed-off-by: Molly Sophia <mollysophia379@gmail.com>

* llama: fix shape error with rwkv using llama-parallel

Signed-off-by: Molly Sophia <mollysophia379@gmail.com>

---------

Signed-off-by: Molly Sophia <mollysophia379@gmail.com>

This commit is contained in:

Molly Sophia

2025-03-18 07:27:50 +08:00

• committed by

GitHub

parent 60c902926c

commit 7dfad387e3

No known key found for this signature in database

GPG key ID: B5690EEEBB952194

35 changed files with 2948 additions and 438 deletions

5

ggml/src/ggml-cuda/wkv6.cuh

View file

 @ -1,5 +0,0 @@
 #include "common.cuh"
 #define CUDA_WKV_BLOCK_SIZE 64
 void ggml_cuda_op_rwkv_wkv6(ggml_backend_cuda_context & ctx, ggml_tensor * dst);

Rows
Columns

llama: Add support for RWKV v7 architecture (#12412)

5 ggml/src/ggml-cuda/wkv6.cuh Unescape Escape View file

5

ggml/src/ggml-cuda/wkv6.cuh

View file