ShaShiDiZhuanLan / Demo_TFIDF_Simhash_Python
python3 利用用TF特征向量和Simhash指纹计算中文文本的相似度的示例
☆10Updated 4 years ago
Related projects: ⓘ
- 中文新词发现算法PNW算法,可以识别任意长度的新词。☆15Updated last year
- 使用Simhash对海量文本进行去重☆11Updated 6 years ago
- 文本标注工具,给文本打标签☆21Updated 4 years ago
- fastText中文实践☆22Updated 6 years ago
- textrank 提取文章摘要与结果优化☆30Updated 6 years ago
- 基于标题分类的主题句提取方法可描述为: 给定一篇新闻报道, 计算标题与新闻主题词集的相似度, 判断标题是否具有提示性。对于提示性标题,抽取新闻报道中与 其最相似的句子作为主题句; 否则, 综合利用多种特征计算新闻报道中句子的重要性, 将得分最高的句子作为主题句。☆38Updated 8 years ago
- ☆14Updated this week
- Using tensorflow/serving to deploy kashgari model for time training and predicting.☆12Updated 5 years ago
- ZhidaoChatbot, a chatbot that can be an expert on the common questions like why,how,when,who,what based on the online question-answer web…☆42Updated 5 years ago
- 用tf实现各种文本分类模型,并且封装restful接口,可以直接工程化☆31Updated 5 years ago
- 个人实现的基于Django与semantic-ui的语言计算实验平台, 功能包括自然语言综合处理,词语计算,社会热点计算,人物计算,文学画像,职位画像等社会计算功能☆28Updated 6 years ago
- 基于火力发电厂知识问答库的检索式问答系统/问答系统/对话系统☆49Updated 4 years ago
- self complemented WeiboIndexSpyder based on Selenium ,新浪微博指数(微指数)采集,包括综合指数,移动端指数,PC端指数☆32Updated 6 years ago
- Self complemented Key infomation extraction including keywords, abstract from text using algorithm like textrank ,tfidf 基于Textrank算法的文本摘要…☆53Updated 6 years ago
- 整理文本分类的比赛和解决方案☆8Updated 3 years ago
- 通过机器学习进行敏感词的识别☆29Updated 6 years ago
- 本项目使用Keras实现Transformer模型来进行文本分类(中文、英文均支持)。☆10Updated 2 years ago
- 中文文本情感分类利用cnn☆20Updated 5 years ago
- 自适应学习模型-应用于教育领域-知识图谱☆48Updated 6 years ago
- ☆42Updated this week
- 基于意图识别和命名实体识别的多轮对话场景设计☆36Updated 5 years ago
- 文本聚类 k-means算法及实战☆54Updated 5 years ago
- 基于知识图谱的林业法律法规问答☆16Updated last year
- 本项目由三个模块构成。意图识别:判断用户的意图是业务型还是闲聊型;模型检索:该部分构建一个语料库,当用户 发起新的query(通过意图识别判断为业务型对话)时,为用户匹配query检索的最佳response,使用HSWN进行召回(粗排), 然后构建句子的相似度,并利用Lig…☆10Updated 3 years ago
- 为了更好地管理博客文章,分享更好的知识,该系列资源为作者CSDN博客的备份文件。本资源为作者Python人工智能的系列博客,涉及Theano、TensorFlow、Keras搭建的回归神经网络、CNN、RNN、LSTM等内容。基础性文章,希望对您有所帮助。☆21Updated 3 years ago
- CCF大数据竞赛--垃圾短信基于文本内容的识别☆11Updated 8 years ago
- self complement of baike knowledge base info-box extraction by online analysis.基于互动百科,百度百科,搜狗百科的词条infobox结构化信息抽取,百科知识的融合☆36Updated 6 years ago
- 错别字纠正算法。调用pycorrector接口,使用规则。☆63Updated 4 years ago
- ☆13Updated this week
- 机器学习文本分类器☆47Updated 8 years ago
- 文本处理相关库,目前包括新词发现、字符串匹配等功能。☆15Updated 3 years ago