GGUF:修订历史

差异选择:选中要对比的修订的单选按钮,然后按Enter键或下面的按钮。
说明:(当前)=与最后修订的差异,(之前)=与上个修订的差异,=小编辑。

2025年2月9日 (星期日)

  • 当前之前 09:342025年2月9日 (日) 09:34 Ztm0929 留言 贡献 809字节 +809 创建页面,内容为“GGUF ('''G'''PT-'''G'''enerated '''U'''nified '''F'''ormat)是专为'''本地 CPU/GPU''' 推理优化 的模型文件格式,由 llama.cpp 团队设计,用于替代早期的 GGML 格式。它的核心目标是: * 高效推理 :支持量化(4-bit、5-bit、8-bit 等),大幅降低模型内存占用(例如 7B 模型可压缩至 3-5GB)。 * 跨平台兼容 :适配 CPU、GPU(CUDA、Metal)、手机端等场景。 * 扩展性 :内置元…” 标签可视化编辑