shuangge-jb / sklearn
CCF大数据竞赛--垃圾短信基于文本内容的识别
☆11Updated 8 years ago
Alternatives and similar repositories for sklearn:
Users that are interested in sklearn are comparing it to the libraries listed below
- 基于标题分类的 主题句提取方法可描述为: 给定一篇新闻报道, 计算标题与新闻主题词集的相似度, 判断标题是否具有提示性。对于提示性标题,抽取新闻报道中与其最相似的句子作为主题句; 否则, 综合利用多种特征计算新闻报道中句子的重要性, 将得分最高的句子作为主题句。☆40Updated 8 years ago
- 基于cnn+tensorflow实现的短文本分类☆28Updated 6 years ago
- 练习题︱基于今日头条开源数据的文本挖掘☆84Updated 6 years ago
- textcnn多标签文本分类☆36Updated 6 years ago
- 用tf实现各种文本分类模型,并且封装restful接口,可以直接工程化☆32Updated 5 years ago
- multi-label,classifier,text classification,多标签文本分类,文本分类,BERT,ALBERT,multi-label-classification☆27Updated 3 years ago
- 发现新词 无监督词库生成 医学词库生成 发现未登录词☆77Updated 4 years ago
- 基于keras的评论文本情感分类☆43Updated 4 years ago
- 天池大赛:金融大脑-金融智能NLP服务☆16Updated 6 years ago
- 之江-电商评论观点挖掘的比赛,基于pytorch-transformers版本,暂时只实现了BERT做aspect+opinion+属性分类+情感极性的联合标注,还未加上CRF。☆33Updated 5 years ago
- 依据香港中文大学设计的规则系统,先用小样本评论建立初始关键词库,再结合18种句式逐条匹配评论,能够快速准确地识别评论对象及情感极性。经多次迭代优化关键词库后,达到较高准确率的基础上,使用Tableau进一步分析数据,识别出客户集中关注的商品属性、普遍好评差评的商品属性;通过…☆53Updated 7 years ago
- 文本相似性☆23Updated 5 years ago
- Text Classification CNN RNN☆15Updated 7 years ago
- 主题模型(TopicModel)☆10Updated 7 years ago
- Bert中文文本分类☆40Updated 5 years ago
- Self complemented Key infomation extraction including keywords, abstract from text using algorithm like textrank ,tfidf 基于Textrank算法的文本摘要…☆53Updated 6 years ago
- 使用HMM模型实现的机构名实体识别☆46Updated 6 years ago
- Self complemented text feature extraction using algorithms including CHI, DF, IG, MI for the experiment of text classification based on s…☆49Updated 6 years ago
- self complemented WeiboIndexSpyder based on Selenium ,新浪微博指数(微指数)采集,包括综合指数,移动端指数,PC端指数☆31Updated 6 years ago
- Time entity recognition tool based on regular expression 基于正则表达式的中文时间实体识 别(时间提取)工具☆24Updated 6 years ago
- FastText 文本分类☆19Updated 6 years ago
- 多轮对话系统的多意图识别☆28Updated 6 years ago
- 用机器学习算法实现了一种有监督的句子对匹配方法,使用的机器学习分类算法有:逻辑回归(LR)、SVM、GBDT和随机森林(RandomForest),使用的工具是Sklearn。☆30Updated 7 years ago
- CSDN博客的关键词提取算法,融合TF,IDF,词性,位置等多特征。该项目用于参加2017 SMP用户画像测评,排名第四,在验证集中精度为59.9%,在最终集中精度为58.7%。启发式的方法,通用性强。☆30Updated 7 years ago
- self complemented SpellCorrection based pinyin similairity, edit distance ,基于拼音相似度与编辑距离的查询纠错。☆79Updated 2 years ago
- 文本标注工具,给文本打标签☆21Updated 5 years ago
- 蚂蚁金服:金融大脑-金融智能NLP大赛(26th/2632)☆14Updated 5 years ago
- 专业领域词库构建/中文新词发现/专业词库发现☆29Updated 5 years ago
- ☆17Updated 6 years ago
- 基于依存句法的句子级细粒度情感计算☆27Updated 7 years ago