当前位置:网站首页 > 编程语言 > 正文

预训练模型可以( )新模型的训练(预训练模型怎么使用)



1 算法简介

现代机器学习技术取得了长足的进步,但是机器在某些领域的表现仍然远远不如人类。其中最关键的原因之一,机器往往缺乏人类的常识和推理能力,这使得机器在面对一些复杂的任务时表现不佳,例如自然语言理解、文本生成等。

近年来,预训练语言模型已然成为自然语言处理(NLP)领域中备受瞩目的技术之一(典型NLP技术范式见图1)。预训练模型可以在大规模文本语料上进行自监督学习,从而获得丰富的语言学知识,并通过在下游任务上进行微调,实现出色的性能。提示学习(Prompt learning)则是一种最新的预训练模型范式,通过在预训练过程中提供特定任务的提示信息,来指导模型学习,帮助模型更好地利用任务的上下文信息,从而提高模型的性能。

图1 型NLP技术范式

2 算法原理

传统的深度学习需要一定规模的训练数据,但在具体的应用场景中,标注数据往往有限,限制了深度学习的应用与推广。为此,研究者提出小样本学习(Few-shot learning),它是一种在给定少量训练样本的情况下,进行深度学习模型训练和应用的方法。Prompt learning就是典型的小样本学习方法,它充分利用在预训练阶段获取的掩码语言模型(Masked Language Model,MLM),将下游任务建模为语言模型的掩码生成问题,也使得模型可以在Few-shot、Zero-shot等低资源场景下保持良好的表现。

Prompt learning本质上就是设计一个比较契合上游预训练任务的模板,通过模板的设计就是挖掘出上游预训练模型的潜力,让上游的预训练模型在尽量不需要标注数据的情况下比较好的完成下游的任务,关键包括3个步骤:

(1)设计预训练语言模型的任务:明确预训练语言模型完成的具体任务,比如情感分析、文本分类、问题回答等。
(2)设计输入模板样式(Prompt Engineering):根据任务设计合适的提示模板,涉及到确定提示的形状,选择合适的词语或标记来构建提示,这些词语或标记将引导PLM按照预期的方式进行预测或生成。
(3)设计label 样式及模型的输出映射到label的方式(Answer Engineering):是Prompt Learning中的一个关键步骤,涉及到构建和优化答案候选集以及确定答案到最终输出的映射关系,包括构建答案候选集,评估答案候选集的多样性、准确性和相关性,使用不同的技术来优化答案候选集,确定如何将模型生成的答案映射到最终的输出。
图2是以情感分类作为例子,阐述上述Prompt learning的步骤:

图2 Prompt learning的步骤图

3 算法应用

Prompt Learning的应用广泛,包括但不限于自然语言处理任务、计算机视觉、多模态、生物医学等领域。在医学领域,Prompt Learning的应用是一个新兴的研究方向,它可以利用预训练语言模型通过少量示例快速适应医学专业任务。例如在针对面向诊断的医疗对话系统无法支持精准医疗所需的信息粒度、难以同时满足医疗领域中多样化的槽值表示形式的缺陷,研究中提出了一种基于提示学习的多层次生成式医疗对话理解方法,即用多层次槽结构替代当前对话理解任务中单层的槽结构,以表示更细粒度的信息,之后采用一种基于对话风格提示的生成式方法,利用提示字符模拟医患对话,从多轮交互中获得多层次信息;提出在推理过程中使用一种受限的解码策略,使模型能够以统一的方式处理意图识别与分类型和抽取型的槽填充任务,避免复杂的建模;此外,针对医疗领域缺少标注数据的问题,提出了一种两阶段训练策略,以充分利用大规模的无标注医疗对话语料来提升性能。实验架构图见图3。最终实验结果表明,所提方法能够有效解析医疗对话中的各种复杂实体,相比已有的生成方法,其性能高出2.18%,而在小样本的场景下两阶段训练最高能提高模型5.23%的性能。

图3 架构图

在中医药领域,Prompt Learning具有潜在的应用前景。当前虽尚未有具体的应用实例,但根据现有中医药语言处理模型的发展,我们可以预测Prompt Learning在中医药领域可能的应用方向包括:(1)对中药成分进行分析和质量评估,优化中药质量控制流程;(2)利用Prompt Learning进行中医药数据的深度挖掘,有助于发现新的中药成分或药物组合,加速新药研发;(3)优化中医处方的配伍规律,提高处方的疗效和安全性;(4)辅助中医临床诊断,提高中医病症分类模型的适用性与准确性;(5)挖掘中医药临床用药规律,为临床治疗提供数据支持和决策参考,等等。

4 小结

Prompt Learning的优势在于它不需要大量的标记数据,只需少量样本即可开始训练,这大大降低了训练成本。同时,通过使用不同的提示,大模型可以快速适应各种任务,无需重新训练或微调。然而,Prompt Learning也存在一些挑战和限制,如何构建有效的提示是一个关键问题,不同的任务和数据集可能需要不同的提示形式;此外,在某些场景下,我们仍然需要一定数量的标注数据来优化模型性能;由于Prompt Learning依赖于预训练模型,其性能也受到预训练模型质量的影响。

总的来说,Prompt Learning作为一种新型的训练方法,具有广阔的应用前景和巨大的发展潜力。随着技术的不断进步和研究的深入,Prompt Learning将在未来为人工智能领域带来更多的创新和突破。


参考文献:
[1]柳俊,阮彤,张欢欢.基于提示学习的生成式医疗对话理解方法[J].计算机科学,2024,51(5):258-266.
[2]刘智溢.基于提示学习和优化长尾分布的中医病症分类模型及应用[D].江西:江西师范大学,2023.
[3]Prompt Learning(提示学习)——新的低资源场景克星-CSDN博客.见于2024年8月27日.
https://blog.csdn.net/m0_/article/details/.
[4]提示学习(Prompt-learning)_prompt learning-CSDN博客.见于2024年8月27日.
https://blog.csdn.net/weixin_/article/details/.
[5] 提示学习(Prompt Learning)——低资源场景的福音 - 知乎 (zhihu.com) .见于2024年8月27日.
https://zhuanlan.zhihu.com/p/.

推荐阅读:
掩码语言模型:构建下一代智能语言处理系统的关键技术
N-gram生成式语言模型在中医药传承中也有大作用
卷积神经网络:具有表征学习能力的人工神经网络

到此这篇预训练模型可以( )新模型的训练(预训练模型怎么使用)的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章,希望大家都能在编程的领域有一番成就!

版权声明


相关文章:

  • pyd文件是什么(py2是什么文件)2025-03-06 17:18:07
  • 文件名批量删除字符(文件名批量删除字符怎么操作)2025-03-06 17:18:07
  • u盘制作pe系统启动盘后还能用吗(u盘做成pe系统之后还能恢复吗)2025-03-06 17:18:07
  • qq账号需要实名认证(qq账号实名认证在哪里查看)2025-03-06 17:18:07
  • 发送验证码一直收不到(为什么发送验证码,手机一直没收到?)2025-03-06 17:18:07
  • ssh免密登录失败怎么回事(ssh免密登录失败原因)2025-03-06 17:18:07
  • 谄怎么读(谄佞怎么读)2025-03-06 17:18:07
  • 社会阶级分层图片(社会阶级阶层结构划分标准)2025-03-06 17:18:07
  • hpg是什么文件(hpg文件是什么文件)2025-03-06 17:18:07
  • bt1120协议(bt1120协议将串行信号转成并行信号)2025-03-06 17:18:07
  • 全屏图片