llama : Support Qwen3 and Qwen3MoE (#12828)

* add qwen3 & qwen3moe support. * fix --------- Co-authored-by: bozheng-hit <dsoul0621@gmail.com>
2025-04-09 17:47:36 +08:00 · 2025-04-09 17:47:36 +08:00 · d3bd7193ba
commit d3bd7193ba
parent d9a63b2f2e
5 changed files with 441 additions and 0 deletions
--- a/convert_hf_to_gguf.py
+++ b/convert_hf_to_gguf.py
@ -2459,6 +2459,16 @@ class Qwen2MoeModel(Model):
                raise ValueError(f"Unprocessed experts: {experts}")


+@Model.register("Qwen3ForCausalLM")
+class Qwen3Model(Qwen2Model):
+    model_arch = gguf.MODEL_ARCH.QWEN3
+
+
+@Model.register("Qwen3MoeForCausalLM")
+class Qwen3MoeModel(Qwen2MoeModel):
+    model_arch = gguf.MODEL_ARCH.QWEN3MOE
+
+
@Model.register("GPT2LMHeadModel")
 class GPT2Model(Model):
    model_arch = gguf.MODEL_ARCH.GPT2