minitrill / TextAudit
一个短视频app文本审核模块的实现思路及demo
☆115Updated 6 years ago
Alternatives and similar repositories for TextAudit:
Users that are interested in TextAudit are comparing it to the libraries listed below
- Code for chinese error detection module, using n-gram and bi-lstm☆135Updated 5 years ago
- 语义理解/口语理解,项目包含有词法分析:中文分词、词性标注、命名实体识别;口语理解:领域分类、槽填充、意图识别。☆179Updated 6 years ago
- 中文文本错别字检测以及自动纠错 / Autochecker & autocorrecter for chinese☆294Updated 7 years ago
- 基于bert进行中文文本纠错☆232Updated last year
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆159Updated 3 years ago
- Self complemented Pinyin2Chinese demo use algorithms including Trie and HMM model , 基于隐马尔科夫模型与Trie树的拼音切分与拼音转中文的简单demo实现。☆86Updated 6 years ago
- Macadam是一个以Tensorflow(Keras)和bert4keras为基础,专注于文本分类、序列标注和关系抽取的自然语言处理工具包。支持RANDOM、WORD2VEC、FASTTEXT、BERT、ALBERT、ROBERTA、NEZHA、XLNET、ELECTRA…☆323Updated last year
- 文本相似度计算/文本匹配☆303Updated 5 years ago
- 基于ltp的简单评 论观点抽取模块☆116Updated 6 years ago
- 短文本相似度☆103Updated 3 years ago
- bert文本分类,ner, albert,keras_bert,bert4keras,kashgari,fastbert,flask + uwsgi + keras部署模型,时间实体识别,tfidf关键词抽取,tfidf文本相似度,用户情感分析☆194Updated 7 months ago
- 中文单词自动纠错☆121Updated 3 years ago
- 神策杯2018高校算法大师赛(中文关键词提取)第二名代码方案☆306Updated 4 years ago
- 中文语料库:包括情感词典 情感分析 文本分类 单轮对话 中文词典 知乎☆118Updated 6 years ago
- 文本相似度,语义向量,文本向量,text-similarity,similarity, sentence-similarity,BERT,SimCSE,BERT-Whitening,Sentence-BERT, PromCSE, SBERT☆73Updated 3 months ago
- 基于检索的任务型多轮对话☆77Updated 4 years ago
- 使用BERT模型做文本分类;面向工业用途☆220Updated 5 years ago
- 中文文本纠错模型,keras实现☆73Updated 3 years ago
- 各大中文分词性能评测☆157Updated 6 years ago
- Keyphrase or Keyword Extraction 基于预训练模型的中文关键词抽取方法(论文SIFRank: A New Baseline for Unsupervised Keyphrase Extraction Based on Pre-trained La…☆426Updated 4 years ago
- mirror of dongxiexidian/Chinese☆292Updated 6 years ago
- 天池比赛作品整理。实现从pdf中提取出姓名、出生年月、性别、电话、最高学历、籍贯、落户市县、政治面貌、毕业院校、工作单位、工作内容、职务、项目名称、项目责任、学位、毕业时间、工作时间、项目时间共18个字段。☆112Updated 7 months ago
- 本项目旨在识别长短文本中的敏感词,并对整段/句文本进行语义分类,从而达到文本审核的目的☆63Updated 5 years ago
- 提供一款中文版生成式摘要服务☆337Updated 3 weeks ago
- 3000000+语义理解与匹配数据集。可用于无监督对比学习、半监 督学习等构建中文领域效果最好的预训练模型☆292Updated 2 years ago
- 天池 疫情相似句对判定大赛 线上第一名方案☆432Updated 4 years ago
- 中文地址分词(地址元素识别与抽取),通过序列标注进行NER☆194Updated 4 years ago
- 汉字字符特征提取工具,可以提取出字符中的字音(声母、韵母、声调)、字形(偏旁、部首)、四角编码等特征,同时可作为tensor输入到模型☆134Updated 4 years ago
- 中文自然语言的实体抽取和意图识别(Natural Language Understanding),可选Bi-LSTM + CRF 或者 IDCNN + CRF☆183Updated 6 years ago
- DFA 实现中文敏感词检测☆97Updated 2 years ago