mtmd : add support for Qwen2-Audio and SeaLLM-Audio (#13760)

* mtmd : add Qwen2-Audio support * small clean up * update discussion link * clarify mtmd_get_output_embd * clarification in multimodal.md * fix ultravox bug * ggml_cont
2025-05-25 14:06:32 +02:00 · 2025-05-25 14:06:32 +02:00 · 40aaa8a403
commit 40aaa8a403
parent a08c1d2845
9 changed files with 144 additions and 52 deletions
--- a/gguf-py/gguf/tensor_mapping.py
+++ b/gguf-py/gguf/tensor_mapping.py
@ -1165,6 +1165,10 @@ class TensorNameMap:
            "audio.multi_modal_projector.linear_{bid}", # ultravox
        ),

+        MODEL_TENSOR.A_MMPROJ_FC: (
+            "audio.multi_modal_projector.linear", # qwen2audio
+        ),
+
        MODEL_TENSOR.A_MM_NORM_PRE: (
            "audio.multi_modal_projector.ln_pre", # ultravox
        ),