LLM — 模型训练详情

RAG 管线

向量库 Qdrant

Embedding bge-m3

数据源

Model docsAPI specs最佳实践

微调管线

方法 LoRA (r=16, alpha=32)

基础模型 Qwen2.5-14B

适配器大小 ~48MB

部署状态

目标节点 mac-studio

VRAM 12.4 / 128 GB

推理速度 42 tok/s

正常运行 99.7%

OctopusOS

有什么可以帮您？