大型语言模型:修订间差异
来自天明的百科全书
更多操作
创建页面,内容为“'''大型语言模型'''(英语:large language model,LLM),也称'''大语言模型''',是由具有大量参数(通常数十亿个权重或更多)的人工神经网络组成的一类语言模型,使用自监督学习或半监督学习对大量未标记文本进行训练。大语言模型在2018年左右出现,并在各种任务中表现出色。 尽管这个术语没有正式的定义,但它通常指的是参数数量在数十亿或更多…” |
小无编辑摘要 |
||
第11行: | 第11行: | ||
* [https://zh.wikipedia.org/wiki/%E5%A4%A7%E5%9E%8B%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B 大型语言模型 - 维基百科,自由的百科全书] | * [https://zh.wikipedia.org/wiki/%E5%A4%A7%E5%9E%8B%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B 大型语言模型 - 维基百科,自由的百科全书] | ||
{{默认排序:LLM}} | |||
[[分类:信息技术]] |