FleetModel Dpo, AutoModel => FleetModel. #3024

wtmlon · 2025-11-26T08:59:35Z

支持glm4.5 fleet组网dpo训练，直接paddleformers-cli train /path/to/dpo.yaml启动训练
启动前先设置两个PYTHONPATH
export PYTHONPATH=/path/to/PaddleFleet/:/path/to/PaddleFleet/src/:$PYTHONPATH #修改为自己的paddlefleet路径
export PYTHONPATH=/path/to/PaddleFormers/:$PYTHONPATH

paddle-bot · 2025-11-26T08:59:41Z

Thanks for your contribution!

… into fleetmodel-dpo-support

xiaoguoguo626807 · 2025-12-04T01:29:07Z

paddleformers/transformers/glm4_moe/modeling.py

+        "LayerSpec", Callable[["GPTModelProvider"], "LayerSpec"]
+    ] = get_gpt_decoder_block_spec
+
+    transform_rules = {"n_routed_experts": "moe_num_experts"}


这个fleet 已经更新为n_routed_experts ，不需要配了吧

xiaoguoguo626807 · 2025-12-04T01:32:13Z

paddleformers/transformers/gpt_provider.py


    # MoE / FP8
-    moe_num_experts: Optional[int] = None
+    num_moe_experts: Optional[int] = None


这里是和fleet 对齐吗，改成n_routed_experts了

… into fleetmodel-dpo-support

nepeplwu · 2025-12-04T12:27:48Z

paddleformers/nn/criterion/interface.py

        self.config = config
-        self.dpo_config = copy.deepcopy(config.get("dpo_config", None))
-        self.kto_config = copy.deepcopy(config.get("kto_config", None))
+        self.dpo_config = copy.deepcopy(config.dpo_config) if hasattr(config, "dpo_config") else None


为什么要这么改，原本的写法没问题

nepeplwu · 2025-12-04T12:28:08Z

paddleformers/trainer/integrations.py

-                elif hasattr(model, "init_config") and model.init_config is not None:
-                    model_config_json = json.dumps(model.get_model_config(), ensure_ascii=False, indent=2)
-                    self.vdl_writer.add_text("model_config", model_config_json)
+                # elif hasattr(model, "init_config") and model.init_config is not None:


为什么要注释掉

nepeplwu · 2025-12-04T12:28:39Z

paddleformers/transformers/auto/modeling.py

        try:
            model_class = getattr(import_class, init_class)
            return model_class
+        except AttributeError:


临时写法的话，这里写个注释吧

nepeplwu · 2025-12-04T12:32:56Z

paddleformers/transformers/glm4_moe/modeling.py



+@register_base_model
+class Glm4MoeModelFleet(Glm4MoePreTrainedModel):


需要用Fleet后缀吗？

lugimzzz

LGTM

FleetModel Dpo, AutoModel => FleetModel.

ef9f520

wtmlon added 13 commits November 26, 2025 17:00

remove print.

958568e

fix lint.

b6f6b0f

merge model

fab4e3b

fix remove code.

076aedf

Merge branch 'develop' of https://github.com/PaddlePaddle/PaddleFormers…

27eb0d2

… into fleetmodel-dpo-support

move gpt_provider

d148f4b

fix provider setting.

822119e

add glm45 transform rules.

4e7c827

update paddlefleet requirement.

40b927c

add fleet flag.

4a5a543

add fleet flag.

bab7f56

Merge branch 'develop' of https://github.com/PaddlePaddle/PaddleFormers…

25f03c7

… into fleetmodel-dpo-support

remove redundant code.

468ebc3

xiaoguoguo626807 reviewed Dec 4, 2025

View reviewed changes

wtmlon added 5 commits December 4, 2025 10:51

Merge branch 'develop' of https://github.com/PaddlePaddle/PaddleFormers…

05108cf

… into fleetmodel-dpo-support

fix conflict.

ac134c8

switch formers.

5bac4ff

fix ci.

4668620

fix ci again.

f58c6da

nepeplwu reviewed Dec 4, 2025

View reviewed changes

lugimzzz approved these changes Dec 4, 2025

View reviewed changes

From00 merged commit 64bd537 into PaddlePaddle:develop Dec 5, 2025
6 of 7 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

FleetModel Dpo, AutoModel => FleetModel. #3024

FleetModel Dpo, AutoModel => FleetModel. #3024

Uh oh!

wtmlon commented Nov 26, 2025 •

edited

Loading

Uh oh!

paddle-bot bot commented Nov 26, 2025

Uh oh!

xiaoguoguo626807 Dec 4, 2025

Uh oh!

wtmlon Dec 4, 2025

Uh oh!

xiaoguoguo626807 Dec 4, 2025

Uh oh!

wtmlon Dec 4, 2025

Uh oh!

nepeplwu Dec 4, 2025

Uh oh!

nepeplwu Dec 4, 2025

Uh oh!

nepeplwu Dec 4, 2025

Uh oh!

nepeplwu Dec 4, 2025

Uh oh!

lugimzzz left a comment

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

5 participants



		@register_base_model
		class Glm4MoeModelFleet(Glm4MoePreTrainedModel):

FleetModel Dpo, AutoModel => FleetModel. #3024

FleetModel Dpo, AutoModel => FleetModel. #3024

Uh oh!

Conversation

wtmlon commented Nov 26, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

paddle-bot bot commented Nov 26, 2025

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

lugimzzz left a comment

Choose a reason for hiding this comment

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

5 participants

wtmlon commented Nov 26, 2025 •

edited

Loading