解读RE2《Simple|解读RE2《Simple and Effective Text Matching with Richer Alignment Features》解读RE2《SimpleandEffectiveTextMat

Paper: https://www.aclweb.org/anthology/P19-1465
【解读RE2《Simple|解读RE2《Simple and Effective Text Matching with Richer Alignment Features》】Code: https://github.com/hitvoice/RE2
文章摘要
????文中提出了一种快速、强悍神经网络方法来用于通用文本的匹配。我们研究了构建一个快速且性能良好的文本匹配模型的足够条件，并建议保持三个用于序列间对齐的关键特性:原始点对齐特性、先前对齐特性和上下文特性，同时简化所有剩余组件。我们在自然语言推理、意图识别和答案选择等任务中，对4个研究良好的基准数据集进行了实验。我们的模型性能与最先进的模型相当，并且使用的参数更少，除此之外，在推理速度方面与类似模型的相比，至少要快6倍。
本文模型算法RE2
下图给出了总体架构的说明，两个文本序列在预测层前对称处理，除预测层中参数外的所有参数在两个序列之间共享。

文章图片

其中，对齐融合层的输入分为三个部分:原始点态特征(嵌入向量，用空白矩形表示)、先前对齐特征(剩余向量，用对角线矩形表示)和上下文特征(编码向量，用实矩形表示)。右边的架构与左边的架构相同，所以为了简洁起见省略了它。
Augmented Residual Connections（增强剩余链接）
????为了给对齐过程提供更丰富的特性，RE2采用了增强版的剩余连接来连接连续块。在增强剩余连接的情况下，对齐和融合层的输入分为三个部分，即原始的点方向特征(嵌入向量)、先前对齐特征(残差向量)和后编码层上下文特征(编码向量)。这三个部分在文本匹配过程中都起到了互补的作用。
对于长度为l的序列，我们将第n个块的输入和输出表示为
文章图片
和
文章图片
。令
文章图片
为零向量序列。如前所述，第一块
文章图片
的输入是嵌入层的输出（在图1中用空白矩形表示）。第n个块
文章图片
（n≥2）的输入是第一个块
文章图片
的输入和前两个块的输出的总和（由具有斜条纹的矩形表示）的串联图1）：

文章图片

AlignmentLayer（对齐层）
对齐层(如上面架构图所示)将来自两个序列的特性作为输入，并计算对齐后的表示形式作为输出。
如图1所示，将两个序列的特征作为输入，并将对齐的表示作为输出进行计算。从第一个序列输入长度
文章图片
的长度表示为
文章图片
并从第二个长度为lb的序列输入表示为
文章图片
。相似之处ai和bj之间的得分eij被计算为点投影向量的乘积：

文章图片

Fusion Layer（融合层）
????融合层比较三个透视图中的局部表示和对齐表示，然后将它们融合在一起。
Prediction Layer（预测层）
????预测层以池层中v1和v2两个序列的向量表示作为输入，预测最终目标。

解读RE2《Simple|解读RE2《Simple and Effective Text Matching with Richer Alignment Features》

推荐阅读

绮字五行属什么绮的组词

电线如何选择几方电线选2.5方还是4方

怎么才能把金牛座的男生追到手？

尼康fm2常见问题尼康FM2怎么启动电源

烤鸭架子汤怎么做好吃

qq空间怎么设置仅自己可见

百度网盘Svip如何购买便宜百度网盘vip共享

国际和平日手抄报文字国际宽容日手抄报内容

无症状感染者|广州新疫情传播力强，市民通宵排队打疫苗，专家：10天后可产生保护力

让你的打印机重获新生佳能MG6150废墨清零方法详解

新手开网店怎样开呢网店怎么样

核桃仁冷冻了三年还能吃吗

菲斯曼壁挂炉怎么调水压？

acl会议含金量,acl2023什么时候出结果

三角战略试玩版队友怎么招募三角战略试玩版队友招募方法

世界足球日小孩踢足球简笔画

郑州公租房在等待分房期间居住证换地址有影响吗？

如何正确清洗羽绒服？

iphone13第一次充电注意事项

一花一世界|一花一世界|小说连载