大模型的“涌现”,指的是当模型突破某个规模时模型性能显著提升,表现出让人惊叹的能力。比如语言理解能力、生成能力、逻辑推理能力方面的飞跃和迁移等。一般当模型大于 100亿个参数时,可能产生能力涌现。
超能力
思维链思维链是指使用大模型时,把一个复杂问题分解成很多个中间步骤,鼓励大模型逐步推理,最终得到问题的答案。这种方式可以使得大模型给出更为精确的结论,而且模型的回答过程也具有较好的可解释性。
上下文学习意思是指大模型在针对特定任务时,并不需要重新训练,人们只需要提供任务描述,和提供几个示例,大模型就理解了要做的事情,给出在新问题上就能给出合理的答案。
指令理解人类指导大模型执行任务的过程称为提示过程 (Prompting)。大模型能理解这些指令(也称为提示,Prompt)并执行相应任务。提示可以简单到一个问题,也可以复杂到多个段落,如文章摘要、解决数学问题等。
Copyright © 2024 妖气游戏网 www.17u1u.com All Rights Reserved