训练看板

LLM — 模型训练详情

RAG 管线

向量库 Qdrant
Embedding bge-m3
数据源
Model docsAPI specs最佳实践

微调管线

方法 LoRA (r=16, alpha=32)
基础模型 Qwen2.5-14B
适配器大小 ~48MB

部署状态

目标节点 mac-studio
VRAM 12.4 / 128 GB
推理速度 42 tok/s
正常运行 99.7%
OctopusOS
有什么可以帮您?