deeplearn学习笔记 cs224n lecture2

WordNet 单词用不相关的符号组成 Word2Vec 概述 L(θ)和J(θ)L ( θ ) 和 J ( θ ) 的定义 L(θ)L ( θ ) likelihood J(θ)J ( θ )loss function Center word Context word Prediction function Train the model Word2vec更多细节 为什么用两个变量 更容易优化 可以取平均 两个模型变型 Skip-grams(SG) Continuous Bag of Words(CBOW) 梯度下降 随机梯度下降算法

    推荐阅读