yuanjie-ai / ChineseSensitiveVocabularyLinks
暴恐违禁 文本色情 政治敏感 恶意推广 低俗辱骂
☆101Updated 3 years ago
Alternatives and similar repositories for ChineseSensitiveVocabulary
Users that are interested in ChineseSensitiveVocabulary are comparing it to the libraries listed below
Sorting:
- 各大中文分词性能评测☆158Updated 6 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆170Updated 3 years ago
- Self complemented Pinyin2Chinese demo use algorithms including Trie and HMM model , 基于隐马尔科夫模型与Trie树的拼音切分与拼音转中文的简单demo实现。☆86Updated 7 years ago
- mirror of dongxiexidian/Chinese☆301Updated 6 years ago
- 常用的中文停用词表☆79Updated 7 years ago
- 中文预处理语料☆113Updated 6 years ago
- 中文文本错别字检测以及自动纠错 / Autochecker & autocorrecter for chinese☆296Updated 8 years ago
- 手把手教你搭建人工智能AI写诗平台,从模型搭建到前后端开发到SEO优化推广☆246Updated 3 years ago
- 中国古诗生成(文本生成)☆134Updated 7 years ago
- 中文语料库:包括情感词典 情感分析 文本分类 单轮对话 中文词典 知乎☆117Updated 7 years ago
- 中文谐音词/字库(同音词/字)Chinese Homophones☆111Updated 5 years ago
- 手动实现Elasticsearch的倒排索引以及BM25算法☆47Updated 6 years ago
- 维基百科中文语料整理☆299Updated 7 years ago
- 中文近义词表 Chinese Synonyms☆262Updated 7 years ago
- 短文本相似度☆102Updated 3 years ago
- ☆57Updated 3 years ago
- 李傲龍的博客☆82Updated last year
- DFA 实现中文敏感词检测☆101Updated 3 years ago
- 夸夸语料,来自豆瓣互相表扬组数据☆78Updated 6 years ago
- tensorflow+bert+seq2seq 周公解梦。AI遇上玄学,说出你的梦境(dream),模型自动解析decode梦境的征兆。类似聊天机器人(chatbot,QA),你问我答。☆128Updated 5 years ago
- 问题等价性判断数据 预处理,包含添加对抗样本(同音字、近义词替换等)、获取样本的pattern(用通配符替换相同词汇,提取相同和不同词汇)☆39Updated 5 years ago
- AC自动机python的实现,并进行了优化。 主要修复了 查询不准确的问题。☆75Updated 4 years ago
- Code for chinese error detection module, using n-gram and bi-lstm☆135Updated 6 years ago
- 教育行业新闻 自动文摘 语料库 自动摘要☆202Updated 7 years ago
- 常用中文停用词表及对比☆76Updated 6 years ago
- 收录常见业务安全场景中文脏词,如广告引流、辱骂、暴恐、黄赌毒政类。☆63Updated 2 years ago
- ChineseHumorSentiment, chinese humor sentiment mining including corpus build and mining nlp methods.中文文本幽默情绪计算项目,项目包括幽默文本语料库的构建,幽默计算模型,包括…☆127Updated 6 years ago
- 文本对关系比较 - 语义相似度、字面相似度、文本蕴含等等☆55Updated 5 years ago
- An exploration for Eventline (important news Rank organized by pulic time),针对某一事件话题下的新闻报道集合,通过使用docrank算法,对新闻报道进行重要性识别,并通过新闻报道时间挑选出时间线上重要…☆224Updated 6 years ago
- An Open-Source Package for Chinese Open-domain Conversational Chatbot (中文闲聊对话系统,一键部署微信闲聊机器人)☆109Updated 2 years ago