ShaShiDiZhuanLan / Demo_TFIDF_Simhash_Python
python3 利用用TF特征向量和Simhash指纹计算中文文本的相似度的示例
☆10Updated 5 years ago
Alternatives and similar repositories for Demo_TFIDF_Simhash_Python:
Users that are interested in Demo_TFIDF_Simhash_Python are comparing it to the libraries listed below
- 利用kashgari轻松搭建文本分类模型。☆25Updated 5 years ago
- 个人实现的基于Django与semantic-ui的语言计算实验平台, 功能包括自然语言综合处理,词语计算,社会热点计算,人物计算,文学画像,职位画像等社会计算功能☆29Updated 6 years ago
- 通过机器学习进行敏感词的识别☆29Updated 6 years ago
- 医学类的中文命名实体识别☆9Updated 5 years ago
- Self complemented Key infomation extraction including keywords, abstract from text using algorithm like textrank ,tfidf 基于Textrank算法的文本摘要…☆53Updated 6 years ago
- 使用Simhash对海量文本进行去重☆12Updated 6 years ago
- 🦑 中文文本分类(支持 API 部署)☆18Updated 4 years ago
- 发现新词 无监督词库生成 医学词库生成 发现未登录词☆77Updated 4 years ago
- 用户画像,知识图谱挖掘☆10Updated 2 years ago
- self complemented WeiboIndexSpyder based on Selenium ,新浪微博指数(微指数)采集,包括综合指数,移动端指数,PC端指数☆31Updated 6 years ago
- 中文新词发现算法PNW算法,可以识别任意长度的新词。☆15Updated last year
- 使用BERT构建多标签标注模型☆41Updated 4 years ago
- pyspark+Word2Vec+Tfidf+LSH、文章相似性推荐☆26Updated 4 years ago
- bert,albert计算中文句子的相似度☆21Updated 4 years ago
- 该项目是短文本分类,目前应用于新闻标签的分类☆32Updated 7 years ago
- 文本标注工具,给文本打标签☆21Updated 5 years ago
- 文本聚类 k-means算法及实战☆54Updated 6 years ago
- LSTM,TextCNN,fastText情感分析,模型用 tf_serving 和 flask 部署成web应用☆41Updated 5 years ago
- 别名发现系统☆11Updated 3 years ago
- 第二届阿里巴巴大数据智能云上编程大赛冠军解决方案☆31Updated 5 years ago
- 文章标签抽取☆15Updated 6 years ago
- fastText中文实践☆20Updated 6 years ago
- 开课吧&后厂理工学院_百度NLP项目2:试题数据集多标签文本分类 Models: FastText TextCNN GCN BERT et al.☆47Updated 5 years ago
- 用tf实现各种文本分类模型,并且封装restful接口,可以直接工程化☆32Updated 5 years ago
- 文本分类的目前测试效果较好的算法☆56Updated 5 years ago
- 利用tensorflow/serving进行单模型、多模型、同一模型多版本的部署,并进行模型预测,并用Prothemus进行服务监控。☆11Updated 3 years ago
- 企业事件抽取☆14Updated 3 years ago
- 中文对话资料,分别下载☆20Updated 6 years ago
- 深度学习用于近日头条用户画像☆27Updated 6 years ago
- some code for spark☆17Updated 7 years ago