如题,目前的小轻量模型的识别准度较差,可能影响后续llm对接生成选项等 需要试行是否可能利用qualcomm NPU加速推理运行 可能参考项目: Local Dream,基于tflite可以利用qualcomm npu 前置issue: https://github.com/k2-fsa/sherpa-onnx/issues/740