2021-05-16bert学习 2021-05-16bert学习

MASK单词与原本的数据one-hot编码进行cross-entropy的loss计算
【cls】开始
【sep】中间
预测上下句的话，要使用上面两个符号
使用[cls]作为输出判断两个句子yes or true
防止因为使用某位置的self-attention输出导致与某个单词相关度过大

文章图片
具体原因，图中分类为可以为情感分析，训练其中的线性分类器 bert的多任务，mask+预测的loss全加和，反向传播
【2021-05-16bert学习】bert加入三个embedding
多一个segment embedding就是多了一个句子分类（第一个句子，第二个句子）
position embedding不是正弦or余弦函数，而是可以训练的参数
bert任务3 自然语言推理NLI前提，后面是否正确
Q&A
[cls]question[segment]document
slot插槽填充
Embedding可以通过freeze=True冻死，防止反向传播时改变参数
可以使用nn.ModuleList保住多个模型，单单是一种数据结构

2021-05-16bert学习

推荐阅读

知识产权是做什么的开发app需要什么知识产权，知识产权是什么意思

Alex 双子座一周运势3.4-3.10

大米属于哪个类别大米商标属于哪个类别，大米属于哪个行业类型

低密度脂蛋白胆固醇|胆固醇高引发心梗脑梗，控制在正常范围就可避免！真相是……

晚上睡觉后半夜总是做梦睡觉老做梦怎么办

oracle存储创建表，oracle存储过程中创建表

春申门下三千客是什么意思春申门前三千客

slic3r源码分析

朋友圈晒早餐的幽默说说早餐心语2022最新

电子税务局下载

淘宝卖家如何申请贷款

msvcp140.dll文件的作用

宫颈糜烂检查项目有哪些？宫颈糜烂检查项目有哪些图片

手机|山寨iPhone 13已上架，配置离谱！售价500多元，销量破五千

淘宝店铺推广方式淘宝店推广平台有哪些

龙虾盖浇饭酱汁做法视频龙虾盖浇饭酱汁做法

维生素|80％的中国人都缺这种维生素，这样补简单又省钱！

阿里斯顿电热水器电脑板无显示阿里斯顿电热水器面板显示怎么回事

苏州有哪些好玩的旅游景点？

几副对联