自然语言处理|kaggle MovieSentiment 情感分类的简单套路

问题:简单的对电影评论进行情感分类的问题
方案:采用了最基础的基于tfidf的向量化+lr和word2vec向量+lr以及word2vec+单层lstm三种方案,供大家参考。
评分:tfidf在0.84左右,word2vec在0.86左右,30轮训练的word2vec+lstm的auc在0.86左右还需要调整。
源码如下。
点击打开链接

【自然语言处理|kaggle MovieSentiment 情感分类的简单套路】细做的话,还可以考虑ensemble主题向量,以及模型融合,应该效果会更好一些。

    推荐阅读