训练看板
LLM — 模型训练详情
RAG 管线
向量库 Qdrant
Embedding bge-m3
数据源
Model docsAPI specs最佳实践
微调管线
方法 LoRA (r=16, alpha=32)
基础模型 Qwen2.5-14B
适配器大小 ~48MB
部署状态
目标节点 mac-studio
VRAM 12.4 / 128 GB
推理速度 42 tok/s
正常运行 99.7%