GGUF (GPT-Generated Unified Format)是专为本地 CPU/GPU 推理优化 的模型文件格式,由 llama.cpp 团队设计,用于替代早期的 GGML 格式。它的核心目标是: