ShaShiDiZhuanLan / Demo_TFIDF_Simhash_Python
python3 利用用TF特征向量和Simhash指纹计算中文文本的相似度的示例
☆10Updated 5 years ago
Alternatives and similar repositories for Demo_TFIDF_Simhash_Python
Users that are interested in Demo_TFIDF_Simhash_Python are comparing it to the libraries listed below
Sorting:
- 使用Simhash对海量文本进行去重☆12Updated 6 years ago
- 文本标注工具,给文本打标签☆20Updated 5 years ago
- 利用kashgari轻松搭建文本分类模型。☆25Updated 5 years ago
- flask+seq2seq【TensorFlow1.0, Pytorch】 在线聊天机器人 https://mp.weixin.qq.com/s/VpiAmVSTin3ALA8MnzhCJA 或 https://ask.hellobi.com/blog/python_s…☆68Updated 2 years ago
- 用户画像,知识图谱挖掘☆10Updated 2 years ago
- 使用BERT构建多标签标注模型☆41Updated 5 years ago
- 记录☆17Updated 3 months ago
- 瑞金医院MMC人工智能辅助构建知识图谱大赛TOP40解决方案☆19Updated 6 years ago
- 医学类的中文命名实体识别☆9Updated 5 years ago
- 发现新词 无监督词库生成 医学词库生成 发现未登录词☆77Updated 4 years ago
- 通过机器学习进行敏感词的识别☆28Updated 7 years ago
- 中文新词发现算法PNW算法,可以识别任意长度的新词。☆15Updated last year
- ZhidaoChatbot, a chatbot that can be an expert on the common questions like why,how,when,who,what based on the online question-answer web…☆42Updated 6 years ago
- 中文文本情感分类利用cnn☆20Updated 6 years ago
- 本项目采用Keras和ALBERT实现文本多标签分类任务,其中对ALBERT进行微调。☆13Updated 4 years ago
- 讯飞移动广告反欺诈算法竞赛☆34Updated 5 years ago
- pyspark+Word2Vec+Tfidf+LSH、文章相似性推荐☆26Updated 5 years ago
- LSTM,TextCNN,fastText情感分析,模型用 tf_serving 和 flask 部署成web应用☆42Updated 5 years ago
- self complemented WeiboIndexSpyder based on Selenium ,新浪微博指数(微指数)采集,包括综合指数,移动端指数,PC端指数☆31Updated 6 years ago
- 中文对话资料,分别下载☆20Updated 6 years ago
- fastText中文实践☆20Updated 7 years ago
- 基于标题分类的主题句提取方法可描述为: 给定一篇新闻报道, 计算标题与新闻主题词集的相似度, 判断标题是否具有提示性。对于提示性标题,抽取新闻报道中与其最相似的句子作为主题句; 否则, 综合利用多种特征计算新闻报道中句子的重要性, 将得分最高的句子作为主题句。☆40Updated 8 years ago
- 文本聚类 k-means算法及实战☆54Updated 6 years ago
- Using tensorflow/serving to deploy kashgari model for time training and predicting.☆12Updated 5 years ago
- ☆82Updated 6 years ago
- 该项目是短文本分类,目前应用于新闻标签的分类☆32Updated 7 years ago
- 中文语料库:包括情感词典 情感分析 文本分类 单轮对话 中文词典 知乎☆117Updated 7 years ago
- 个人实现的基于Django与semantic-ui的 语言计算实验平台, 功能包括自然语言综合处理,词语计算,社会热点计算,人物计算,文学画像,职位画像等社会计算功能☆29Updated 7 years ago
- 之江-电商评论观点挖掘的比赛,基于pytorch-transformers版本,暂时只实现了BERT做aspect+opinion+属性分类+情感极性的联合标注,还未加上CRF。☆32Updated 5 years ago
- 《NLP汉语自然语言处理——原理与实践》代码学习、修改与完善。☆8Updated 7 years ago