word2vec+lstm做句子分类|word2vec+lstm做句子分类简单例子 word2vec+lstm做句子分类简单例子

数据 3万文本，train val test 6 2 2.
工具、手法 pytorch、sklearn、gensim的word2vec。
word2vec嵌入句子进行表示，padding后，用LSTM+linear对句序列向量分类。
代码

import jieba import xgboost as xgb from sklearn.model_selection import train_test_split import numpy as np from gensim.models import Word2Vec# reorganize data def get_split_sentences(file_path): res_sen=[] with open(file_path) as f: for line in f: split_query=jieba.lcut(line.strip()) res_sen.append(split_query) return res_senlabel2_sentences=get_split_sentences('label2.csv') label0_sentences=get_split_sentences('label0.csv') label1_sentences=get_split_sentences('label1.csv')all_sentences=[] all_sentences.extend(label0_sentences) all_sentences.extend(label1_sentences) all_sentences.extend(label2_sentences)# set params emb_size=128 win=3 model=Word2Vec(sentences=all_sentences,vector_size=emb_size,window=win,min_count=1) # retrieve word embeddings w2vec=model.wv# assemble sentence embeddings def assemble_x(w2vec:dict,sentences): sen_vs=[] for sen in sentences: v=np.vstack([w2vec[w] for w in sen]) v_len=v.shape[0]sen_v=np.concatenate((v,np.zeros((max_len-v_len,emb_size)))) if v_len



 
 结果 
 ACC: 0.4303

 
 macro:
Recall: 0.3333
F1-score: 0.2006
Precision: 0.1434

 
 micro:
Recall: 0.4303
F1-score: 0.4303
Precision: 0.4303

 
 小结 
 【word2vec+lstm做句子分类|word2vec+lstm做句子分类 简单例子】效果非常差，原因主要有

 
  
padding的0向量过于多了，导致模型得到的大部分都是0向量； 
并未对lstm做任何参数调整（懒 
 


		  	

    
    




    
    
    


推荐阅读

           
                  
              
                  蓦字五行属什么 蓦字读音及解释 
                
                   
                
              
            

                  
              
                  企业qq怎么登录邮箱 企业QQ邮箱登录的方法教程 
                
                   
                
              
            

                  
              
                  手工皂长出菌斑怎么回事 手工皂出现白斑 
                
                   
                
              
            

                  
              
                  如何结束mysql命令行，mysql怎么终止命令 
                
                   
                
              
            

                  
              
                  中国邮政在线客服 邮政客服电话人工服务，中国邮政快递法规 
                
                   
                
              
            

                  
              
                  元气骑士iOS破解版全无限下载，求元气骑士iOS无限宝石破解版不要越狱的最好带教程 
                
                   
                
              
            

                  
              
                  一篇文章带你入门Java数据结构 
                
                   
                
              
            

                  
              
                  原神各个角色升级材料 《原神》3.4瑶瑶升级材料介绍 
                
                   
                
              
            

                  
              
                  染头发为什么会爆顶 
                
                   
                
              
            

                  
              
                  电视机通电后无任何反应什么原因,各个方面来对比下 
                
                   
                
              
            

                  
              
                  2019一级演员名单 国家一级演员的全部名单 
                
                   
                
              
            

                  
              
                  测量机油的正确方法 测量机油的正确方法视频教程 
                
                   
                
              
            

                  
              
                  宋智孝结婚了吗 宋智孝男朋友 
                
                   
                
              
            

                  
              
                  贵妃芒怎么样才是熟了 
                
                   
                
              
            

                  
              
                  蕨菜什么时候采摘 
                
                   
                
              
            

                  
              
                  为什么有人说“当年流氓真君子,今日君子真流氓”呢？ 
                
                   
                
              
            

                  
              
                  黄瓜菌核病如何防治效果好 黄瓜病毒病怎样防治 
                
                   
                
              
            

                  
              
                  初次使用初忆云服务器的感受如何？ 初忆云服务器怎么样 
                
                   
                
              
            

                  
              
                  咖啡蛋糕的做法很需要啊 
                
                   
                
              
            

                  
              
                  六神装是什么 
                
                   
                
              
            

          

SQL也能做AI|SQL也能做AI （没错！MLOps Meetup V3 回顾｜OpenMLBD+SQLFlow+Byzer） 
 投稿|为什么下沉市场很难做出好公司：从拼多多和淘特开始聊起 
 教你简单做选择 
 故乡有约｜你有多久没吃一碗妈妈包的饺子爸爸做的手工面 
 斗地主技巧系列之四-------怎样做门板在斗地主中 
 你还在浪费生命（或者，和我们一起做这件事） 
 生无可恋 
 如果有来生，我要做你手上的一根指头 
 投稿|小红书下场做旅游和酒店，会不会有个好下场？ 
 依旧复习