Shengqiang-Zhang / WordSegment
基于词典的正向最大匹配分词算法和基于词典的逆向最大匹配分词算法
☆12Updated 7 years ago
Alternatives and similar repositories for WordSegment
Users that are interested in WordSegment are comparing it to the libraries listed below
Sorting:
- 社会信息检索作业,实现简单的搜索引擎,计算TFIDF值以及两个句子的相似度☆19Updated 7 years ago
- 基于python3搭建了一个简单的搜索引擎☆29Updated 2 years ago
- 中文文本情感分类利用cnn☆20Updated 6 years ago
- 文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据中国知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照词频排序提取…☆106Updated 7 years ago
- ☆54Updated last year
- 天池零基础入门NLP - 新闻文本分类☆18Updated 4 years ago
- 2017 DF,CCF大数据与计算智能大赛——“中印对峙事件舆情分析”赛题全网数据☆25Updated 7 years ago
- 创建《Python自然语言处理》学习代码的中文注释版本。☆87Updated 3 years ago
- 使用Simhash对海量文本进行去重☆12Updated 6 years ago
- 文本聚类 k-means算法及实战☆54Updated 6 years ago
- 数据挖掘作业——关联分析、分类、聚类☆7Updated 6 years ago
- NLP 以及相关的学习实践☆40Updated 3 years ago
- CNN 实现文本分类☆181Updated 3 years ago
- 中国法研杯-司法人工智能挑战赛☆91Updated 6 years ago
- 组会ppt与论文--每一次的精心准备都值得留下记录😛☆147Updated 5 years ago
- 双向lstm+crf 序列标注☆63Updated 5 years ago
- 为了更好地管理博客文章,分享更好的知识,该系列资源为作者CSDN博客的备份文件。本资源为作者Python人工智能的系列博客,涉及Theano、TensorFlow、Keras搭建的回归神经网络、CNN、RNN、LSTM等内容。基础性文章,希望对您有所帮助。☆21Updated 4 years ago
- 朴素贝叶斯实现的文本分类(新闻分类)☆62Updated 9 years ago
- 基于卷积神经网络参数优化的情感分析论文code☆63Updated 7 years ago
- data analysis and visualization of knowledge graph for star war movies☆83Updated 8 years ago
- 医学类的中文命名实体识别☆9Updated 5 years ago
- 练习题︱基于今日头条开源数据的文本挖掘☆83Updated 6 years ago
- 结合python一起学习自然语言处理 (nlp): 语言模型、HMM、PCFG、Word2vec、完形填空式阅读理解任务、朴素贝叶斯分类器、TFIDF、PCA、SVD☆239Updated 6 years ago
- 这是一个类,里面包含的有关文本相似度的常用的计算算法,例如,最长公共子序列,最短标记距离,TF-IDF等算法☆63Updated 8 years ago
- 文本生成(Word2Vec + RNN/LSTM)☆36Updated 6 years ago
- The final teamwork of data mining course, CAIL-2018 competition. NOTE: this is just quite SIMPLE and TRIVIAL code.☆27Updated 3 years ago
- 机器学习、深度学习、NLP实战项目☆137Updated 7 years ago
- 人工智能Python全栈工程师 人工智能时代已经来临,再不学习就会被淘汰! python考试,已经被列为国家计算机二级考试 python课程,已经被浙江的中学列为必修课内容之一 python课程,已经被山东的小学列为选修课课程之一 零基础? 怕啥,君社教育来帮你! Pyt…☆103Updated 4 years ago
- 该工程是利用python3.6进行“特征提取+分类器”来实现美团评论的文本二分类问题。在特征提取部分提取了6种特征,分类器选择了python里面的包xgboost和lightGBM分别实现提升树和GBDT(梯度提升决策树)。☆93Updated 6 years ago
- CCKS2019 面向中文电子病历的命名实体识别☆33Updated 5 years ago