ShaShiDiZhuanLan / Demo_TFIDF_Simhash_Python
python3 利用用TF特征向量和Simhash指纹计算中文文本的相似度的示例
☆10Updated 5 years ago
Alternatives and similar repositories for Demo_TFIDF_Simhash_Python:
Users that are interested in Demo_TFIDF_Simhash_Python are comparing it to the libraries listed below
- 使用Simhash对海量文本进行去重☆12Updated 6 years ago
- 使用BERT构建多标签标注模型☆41Updated 5 years ago
- 文本标注工具,给文本打标签☆20Updated 5 years ago
- 中文新词发现算法PNW算法,可以识别任意长度的新词。☆15Updated last year
- some code for spark☆17Updated 8 years ago
- 本项目采用Keras和ALBERT实现文本多标签分类任务,其中对ALBERT进行微调。☆13Updated 4 years ago
- LSTM,TextCNN,fastText情感分析,模型用 tf_serving 和 flask 部署成web应用☆42Updated 5 years ago
- 利用tensorflow/serving进行单模型、多模型、同一模型多版本的部署,并进行模型预测,并用Prothemus进行服务监控。☆11Updated 4 years ago
- 一个基于 fasttext + faiss 的商品内容相关推荐实现,nginx+uwsgi+flask / gunicorn+uvicorn+fastapi 提供api查询接口,增加Spark实现 Ansj+Word2vec+LSH+Phoenix☆51Updated last year
- Using tensorflow/serving to deploy kashgari model for time training and predicting.☆12Updated 5 years ago
- 个人实现的基于Django与semantic-ui的语言计算实验平台, 功能包括自然语言综合处理,词语计算,社会热点计算,人物计算,文学画像,职位画像等社会计算功能☆29Updated 7 years ago
- 记录☆16Updated last month
- 中文文本情感分类利用cnn☆20Updated 5 years ago
- 错别字纠正算法。调用pycorrector接口,使用规则。☆68Updated 5 years ago
- 一个基于trie树的具有联想功能的文本编辑器。采用python和pyqt☆11Updated 8 years ago
- 用tf实现各种文本分类模型,并且封装restful接口,可以直接工程化☆32Updated 5 years ago
- fastText中文实践☆20Updated 6 years ago
- 发现新词 无监督词库生成 医学词库生成 发现未登录词☆77Updated 4 years ago
- bert,albert计算中文句子的相似度☆21Updated 5 years ago
- 用户画像,知识图谱挖掘☆10Updated 2 years ago
- ☆82Updated 6 years ago
- Using CRF++ for NER☆20Updated 6 years ago
- 自然语言处理、机器学习、深度学习笔记☆48Updated 3 years ago
- 利用kashgari轻松搭建文本分类模型。☆25Updated 5 years ago
- 开课吧&后厂理工学院_百度NLP项目2:试题数据集多标签文本分类 Models: FastText TextCNN GCN BERT et al.☆48Updated 5 years ago
- 基于simhash的文本去重算法☆20Updated 3 years ago
- 天池比赛作品整理。实现从pdf中提取出姓名、出生年月、性别、电话、最高学历、籍贯、落户市县、政治面貌、毕业院校、工作单位、工作 内容、职务、项目名称、项目责任、学位、毕业时间、工作时间、项目时间共18个字段。☆113Updated 8 months ago
- ZhidaoChatbot, a chatbot that can be an expert on the common questions like why,how,when,who,what based on the online question-answer web…☆42Updated 6 years ago
- 近年来,随着微信、微博、市长信箱、阳光热线等网络问政平台逐步成为政府了解民意、汇聚民智、凝聚民气的重要渠道,各类社情民意相关的文本数据量不断攀升,给以往主要依靠人工来进行留言划分和热点整理的相关部门的工作带来了极大挑战。同时,随着大数据技术的发展,建立基于自然语言处理技术的…☆33Updated 4 years ago
- self complemented WeiboIndexSpyder based on Selenium ,新浪微博指数(微指数)采集,包括综合指数,移动端指数,PC端指数☆31Updated 6 years ago