【python|在bert的基础模型上训练自己的数据(只是过程源码解析后面更新)】1.第一步
从github上下载bert的源码链接,并且下载BERT模型链接
2.第二步
准备数据中文数据样式如图所示:
文章图片
(每一句话一行)
3.第三步
使用bert/create_pretraining_data.py来做数据的预处理
主要是修改改文件的FLAGS.参数即可
文章图片
4.第四步
运行bert/run_pretraining.py 同样只要修改FLAGS.参数 即可
文章图片
到这就可以了
推荐阅读
- 推荐系统论文进阶|CTR预估 论文精读(十一)--Deep Interest Evolution Network(DIEN)
- Python专栏|数据分析的常规流程
- Python|Win10下 Python开发环境搭建(PyCharm + Anaconda) && 环境变量配置 && 常用工具安装配置
- Python绘制小红花
- Pytorch学习|sklearn-SVM 模型保存、交叉验证与网格搜索
- OpenCV|OpenCV-Python实战(18)——深度学习简介与入门示例
- python|8. 文件系统——文件的删除、移动、复制过程以及链接文件
- 爬虫|若想拿下爬虫大单,怎能不会逆向爬虫,价值过万的逆向爬虫教程限时分享
- 分布式|《Python3网络爬虫开发实战(第二版)》内容介绍
- java|微软认真聆听了开源 .NET 开发社区的炮轰( 通过CLI 支持 Hot Reload 功能)