问题:简单的对电影评论进行情感分类的问题
方案:采用了最基础的基于tfidf的向量化+lr和word2vec向量+lr以及word2vec+单层lstm三种方案,供大家参考。
评分:tfidf在0.84左右,word2vec在0.86左右,30轮训练的word2vec+lstm的auc在0.86左右还需要调整。
源码如下。
点击打开链接
【自然语言处理|kaggle MovieSentiment 情感分类的简单套路】细做的话,还可以考虑ensemble主题向量,以及模型融合,应该效果会更好一些。
推荐阅读
- 人工智能|hugginface-introduction 案例介绍
- 中文分词预处理之N最短路径法小结(转)
- 深度学习|2019年CS224N课程笔记-Lecture 17:Multitask Learning
- 深度学习|2018年度总结和2019年度计划
- BERT微调做中文文本分类
- 【学习笔记】自然语言处理实践(新闻文本分类)- 基于深度学习的文本分类Bert
- 【学习笔记】自然语言处理实践(新闻文本分类)- 基于深度学习的文本分类Word2Vec
- 自然语言处理|答案选择|语义匹配任务目前表现最好的几个模型
- 深度学习|NLP重铸篇之BERT如何微调文本分类
- NLP实践-Task1