刚刚打了半天没保存 突然崩溃 全毁了。!QAQ
心好累,不想多说什么了,说点重要的放几个连接就算了。
github连接:https://github.com/yuchenlin/RossetaSeg/
1.这个项目是大一上计算导论的大作业之一,感觉比较有挑战性就选了,也学到了很多东西,挺开心的。
【自然语言处理|【Rosseta中文分词】python下利用HMM思想进行中文分词】2.基本没什么心意,跟结巴分词的思路一模一样,但是因为结巴进行了太多工程性优化也没有很多文档,所以我的这个唯一的意义就是看起来比较容易懂。
3.思路主要是两层,一是基于词典和概率的动态规划搜索有向无环图的最大概率路径,二是针对多个连续单字进行HMM的标注构造,实现每个字都有一个状态,且这个状态链对应的概率是最大的。
4.一些连接,给了我很多帮助:
http://blog.csdn.net/likelet/article/details/7056068
http://ddtcms.com/blog/archive/2013/2/4/69/jieba-fenci-suanfa-lijie/
还有wiki的维特比算法词条。
推荐阅读
- 推荐系统论文进阶|CTR预估 论文精读(十一)--Deep Interest Evolution Network(DIEN)
- Python专栏|数据分析的常规流程
- Python|Win10下 Python开发环境搭建(PyCharm + Anaconda) && 环境变量配置 && 常用工具安装配置
- Python绘制小红花
- Pytorch学习|sklearn-SVM 模型保存、交叉验证与网格搜索
- OpenCV|OpenCV-Python实战(18)——深度学习简介与入门示例
- python|8. 文件系统——文件的删除、移动、复制过程以及链接文件
- 爬虫|若想拿下爬虫大单,怎能不会逆向爬虫,价值过万的逆向爬虫教程限时分享
- 分布式|《Python3网络爬虫开发实战(第二版)》内容介绍
- java|微软认真聆听了开源 .NET 开发社区的炮轰( 通过CLI 支持 Hot Reload 功能)