Skip to content

vllm上的实现 #9

@solitarynew

Description

@solitarynew

请问vllm上的实现是否与论文不太一致,vllm上单次prefill阶段,hidden_states的的第一个维度是多个句子拼接的总tokens数,vllm实现中似乎只对这一个请求计算了一个δ,而不是每个样本单独一个δ,这是否会影响最后的推理结果

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions