Changes in convert script according to comments

Tianyue-Zhao · Tianyue-Zhao · commit 11c5dfd2b2ee · 2025-08-10T19:12:52.000Z
diff --git a/convert_hf_to_gguf.py b/convert_hf_to_gguf.py
@@ -1261,7 +1261,7 @@ def set_gguf_parameters(self):
             self.gguf_writer.add_vision_embedding_length(self.find_vparam(["hidden_size"]))
             self.gguf_writer.add_vision_feed_forward_length(self.find_vparam(["intermediate_size"]))
             self.gguf_writer.add_vision_block_count(self.find_vparam(self.n_block_keys))
-            self.gguf_writer.add_vision_head_count(self.find_vparam(["num_attention_heads"]))
+            self.gguf_writer.add_vision_head_count(self.find_vparam(["num_attention_heads", "num_heads"]))
 
             # preprocessor config
             self.gguf_writer.add_vision_image_mean(self.preprocessor_config["image_mean"])
@@ -8307,9 +8307,6 @@ def prepare_tensors(self):
 
 @ModelBase.register("CogVLMForCausalLM")
 class CogVLMVisionModel(MmprojModel):
-    def __init__(self, *args, **kwargs):
-        super().__init__(*args, **kwargs)
-        self.hparams_vision['num_attention_heads'] = self.hparams['num_heads']
 
     def set_gguf_parameters(self):
         super().set_gguf_parameters()
@@ -8338,9 +8335,6 @@ def modify_tensors(self, data_torch: Tensor, name: str, bid: int | None) -> Iter
 class CogVLMModel(LlamaModel):
     model_arch = gguf.MODEL_ARCH.COGVLM
 
-    def set_gguf_parameters(self):
-        super().set_gguf_parameters()
-
     def modify_tensors(self, data_torch: Tensor, name: str, bid: int | None) -> Iterable[tuple[str, Tensor]]:
         del bid  # unused