Sherpa-onnx 推理可行性？

如题，目前的小轻量模型的识别准度较差，可能影响后续llm对接生成选项等
需要试行是否可能利用qualcomm NPU加速推理运行

可能参考项目: Local Dream，基于tflite可以利用qualcomm npu

前置issue: https://github.com/k2-fsa/sherpa-onnx/issues/740