lilihongjava / leeblog_python
☆13Updated 4 years ago
Alternatives and similar repositories for leeblog_python:
Users that are interested in leeblog_python are comparing it to the libraries listed below
- 文本聚类☆34Updated 3 years ago
- 中文新词发现算法PNW算法,可以识别任意长度的新词。☆15Updated last year
- 一个基于 fasttext + faiss 的商品内容相关推荐实现,nginx+uwsgi+flask / gunicorn+uvicorn+fastapi 提供api查询接口,增加Spark实现 Ansj+Word2vec+LSH+Phoenix☆51Updated last year
- DeepDive Tutorial with Chinese Support☆34Updated 3 years ago
- ☆14Updated 7 years ago
- 中文文本分类,包含了语料库的基本处理,Wiki_zh的处理等☆15Updated 6 years ago
- 基于gensim对BOW,TFIDF,LDA,LSI,W2V等传统的文本表示模型进行简单的封装,并添加了chi2,互信息等特征选择方法☆12Updated 5 years ago
- self complemented WeiboIndexSpyder based on Selenium ,新浪微博指数(微指数)采集,包括综合指数,移动端指数,PC端指数☆31Updated 6 years ago
- 《实体数据挖掘与知识图谱构建》一书的代码和实验数据。☆43Updated 9 years ago
- 使用BERT构建多标签标注模型☆41Updated 4 years ago
- 这个是一个《电商标题数据相似度匹配系统》,使用方法有:tfidf+词袋模型,余弦相似度,word2vec☆25Updated 4 years ago
- 2018-“AIIA”杯-国家电网-电力专业领域词汇挖掘:5st/451☆25Updated 6 years ago
- 文本分类基准测试☆25Updated 6 years ago
- 中文关键词提取☆12Updated last year
- CausalKnowledgeBase, causal knowledge base including causal pairs extracted from web text using the methods like PMI, Collocation。基于网络文本的…☆48Updated 5 years ago
- bert-flat 简化版 添加了很多注释☆15Updated 3 years ago
- tensorflow2.0 实现的 DCN (Deep & Cross Network) ,使用 Criteo 子数据集加以实践。☆15Updated 4 years ago
- 从0学习深度学习课程,跟随Andrew Ng的Coursera课程,课后根据记忆用python代码实现课程作业☆11Updated 5 years ago
- 别名发现系统☆11Updated 3 years ago
- 用tf实现各种文本分类模型,并且封装restful接口,可以直接工程化☆32Updated 5 years ago
- NLP| 自动文本摘要| 热词发现| 新词发现☆18Updated 4 years ago
- self complemented BaiduIndexSpyder based on Selenium , index image decode and num image transfer,基于关键词的历时百度搜索指数自动采集☆41Updated 6 years ago
- Some solutions about kaggle compettions.☆16Updated 6 years ago
- “达观杯”长文本智能处理挑战赛。达观数据提供了一批长文本数据和分类信息,希望选手动用自己的智慧,结合当下最先进的NLP和人工智能技术,深入分析文本内在结构和语义信息,构建文本分类模型,实现精准分类。☆10Updated 6 years ago
- self implement of NLP toolkit 个人实现NLP汉语自然语言处理组件,提供基于HMM与CRF的分词,词性标注,命名实体识别接口,提供基于CRF的依存句法接口。☆52Updated 6 years ago
- NLP tools, word segmentation, sentence segmentation, New-Word-Discovery,新词发现☆25Updated last year
- AI100竞赛:http://competition.ai100.com.cn/html/game_det.html?id = 24&tab = 1 的代码,主要用于文本分类,其中涉及CHI选择特征词,TFIDF计算权重,朴素贝叶斯,决策树,SVM,XGBoost等算法☆15Updated 5 years ago
- 微调预训练语言模型(BERT、Roberta、XLBert等),用于计算两个文本之间的相似度(通过句子对分类任务转换),适用于中文文本☆89Updated 4 years ago
- 复现了论文《基于主题模型的短文本关键词抽取及扩展》的代码☆30Updated 4 years ago
- 个人实现的基于Django与semantic-ui的语言计算实验平台, 功能包括自然语言综合处理,词语计算,社会热点计算,人物计算,文学画像,职位画像等社会计算功能☆29Updated 6 years ago