Skip to content

加速模型载入 #202

@shouldsee

Description

@shouldsee

RWKV6

目前模型载入的速度挺久的,需要载入ninja2 extension。开发的时候经常重新载入模型,有没有啥好办法加速?目前用的gradio应用基座,每次更改应用层逻辑的时候都会重载。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions