首页
随机

登录

设置

关于本站
免责声明

GGUF：修订间差异

语言
监视
查看历史
查看源代码

下一编辑→

可视化wikitext

2025年2月9日 (日) 09:34的版本查看源代码

Ztm0929（留言 | 贡献）

行政员、界面管理员、管理员

2,411次编辑

创建页面，内容为“GGUF （'''G'''PT-'''G'''enerated '''U'''nified '''F'''ormat）是专为'''本地 CPU/GPU''' 推理优化的模型文件格式，由 llama.cpp 团队设计，用于替代早期的 GGML 格式。它的核心目标是： * 高效推理：支持量化（4-bit、5-bit、8-bit 等），大幅降低模型内存占用（例如 7B 模型可压缩至 3-5GB）。 * 跨平台兼容：适配 CPU、GPU（CUDA、Metal）、手机端等场景。 * 扩展性：内置元…”

标签：可视化编辑

下一编辑→

（没有差异）

检索自“https://wiki.ztm0929.cn/GGUF”

语言

此页面在其他语言不可用。

隐私政策
关于本站
免责声明
桌面版