#yyds干货盘点# CoCon: A Self-Supervised Approach for Controlled Text Generation | ICLR 2021 论文
弱龄寄事外,委怀在琴书。这篇文章主要讲述#yyds干货盘点# CoCon: A Self-Supervised Approach for Controlled Text Generation | ICLR 2021 论文相关的知识,希望能为你提供帮助。
本篇文章为:[2006.03535] CoCon: A Self-Supervised Approach for Controlled Text Generation (arxiv.org)
摘要基于transformer的预训练语言模型显示出了卓越的自然语言生成能力。
虽然目前有尝试控制文本高级属性(情感、主题等)的文本生成任务,但是在单词和短语级别仍然缺乏对内容的精确控制。
文章提出CoCon,对于输入内容,在细粒度级别上控制预训练语言模型的输出。
本文的自监督方法中,CoCon通过约束内容输入帮助语言模型完成文本序列。通过实验,我们发现CoCon可以自然地将目标内容合并到生成的文本中,并以zero-shot的方式控制高级文本属性。
introduction基于transformer的预训练语言模型作引领了自然语言处理任务的新潮流,其可以作为一种提取语境化word embedding的方法或者作为文本生成器。
因为大型预训练模型在大量文本语料库上训练过,可以非常流畅地进行文本生成,因此开始有文章开始探究如何对其输出的文本进行控制。
- arXiv:1909.05858, 2019.
- arXiv:1912.02164, 2019.
针对某一特定属性进行微调又会影响其泛化性。(arXiv:1909.08593, 2019)
在不改变预训练语言模型的情况下,可以尝试通过属性模块来控制生成的文本。(针对某一特定属性进行微调又会影响其泛化性。(arXiv:1909.08593, 2019)
虽然在控制高级文本属性(情感、主题)方面已经略有成效,但相同的目标属性会在单词级和短语级生成内容大不相同的文本。预训练语言模型文本生成的细粒度控制方面依旧存在空白。
提出CoCon:
- 预训练语言模型
- CoCon层
使用自监督学习。训练数据是预训练模型本身生成的文本样本。
CoCon优势:
- 保持细粒度控制输出的一致性的同时还可以影响到高级文本属性,比如情感、主题
- 可以综合处理多个影响因素并控制不同因素的影响大小
- 模块化,可以与不同的基于transformer的预训练语言模型进行随意组合
相关工作通过神经网络生成所需属性的文本的工作有很多。
使用条件生成模型。使用标记目标属性的文本数据对神经网络进行训练。网络可以借助强化学习或者对抗生成网络进行训练。
- Controlling output length in neural encoder-decoders.
- Controlling linguistic style aspects in neural language generation.
- Fine-tuning language models from human preferences.
- Sequence generative adversarial nets with policy gradient.
通过使用控制代码生成受控文本。因为结构类似于GPT-2,因此能生成高质量的文本,但它的控制代码在训练期间就确定了。
- A conditional transformer language model for controllable generation.
- Plug and play language models: a simple approach to controlled text generation.
用于问题生产的 条件语言生产方法,是关注上下文本,如主谓宾类型。
用于翻译的小型适配器要依赖于不同语言的标注句子资源。
将一种文本风格转换为另一种。
使用自动编码器分离文本风格特征和非风格潜在表征,通过分离可以使文本风格发生变化的同时还保留大部分原文内容。
确定文本语料库中特定风格的相关属性标记,通过替换来修改文本风格。这种更偏向于文本转换,并且需要对风格进行预定义。
推荐阅读
- 阿里云基本概念与基础架构 #yyds干货盘点#
- 来自面试官一面MySQL索引的连续灵魂拷问
- #私藏项目实操分享#如何利用 onlyoffice 实现文档格式转换
- 我嗨了,竟然能直接访问github了,真不是标题党
- # yyds干货盘点 # 怎么在第一个PDF文件的中间,插入第二个PDF文件的内容()
- #yyds干货盘点#HCIE-Security Day15(防火墙双机热备实验防火墙透明接入,上下行连接交换机)
- #yyds干货盘点#Android C++系列(访问Assets 文件夹)
- #yyds干货盘点#WordPress搭建个人网站后台问题汇总
- Python使用.kv文件的Kivy中的弹出窗口小部件