打开/关闭搜索
搜索
打开/关闭菜单
269
10
3
1269
导航
首页
最近更改
随机页面
特殊页面
特殊页面
上传文件
打开/关闭外观设置菜单
通知
打开/关闭个人菜单
未登录
未登录用户的IP地址会在进行任意编辑后公开展示。
user-interface-preferences
个人工具
登录
GGUF:修订历史
帮助
来自天明的百科全书
分享此页面
查看
阅读
查看源代码
查看历史
associated-pages
页面
讨论
更多操作
查看该页面的日志
过滤修订版本
展开
折叠
截止日期:
标签
过滤:
wikieditor(隐藏的标签)
可视化编辑
可视化编辑:已切换
回退
已被回退
手工回退
撤销
新重定向
清空
移动版编辑
移动版网页编辑
移除重定向
高级移动版编辑
反选
显示版本
差异选择:选中要对比的修订的单选按钮,然后按Enter键或下面的按钮。
说明:
(当前)
=与最后修订的差异,
(之前)
=与上个修订的差异,
小
=小编辑。
2025年2月9日 (星期日)
当前
之前
09:34
2025年2月9日 (日) 09:34
Ztm0929
留言
贡献
809字节
+809
创建页面,内容为“GGUF ('''G'''PT-'''G'''enerated '''U'''nified '''F'''ormat)是专为'''本地 CPU/GPU''' 推理优化 的模型文件格式,由 llama.cpp 团队设计,用于替代早期的 GGML 格式。它的核心目标是: * 高效推理 :支持量化(4-bit、5-bit、8-bit 等),大幅降低模型内存占用(例如 7B 模型可压缩至 3-5GB)。 * 跨平台兼容 :适配 CPU、GPU(CUDA、Metal)、手机端等场景。 * 扩展性 :内置元…”
标签
:
可视化编辑
GGUF:修订历史
来自天明的百科全书