BarryZM / dataProcessorLinks
中英文语料数据清洗及分布式分句分词预处理工作
☆12Updated 5 years ago
Alternatives and similar repositories for dataProcessor
Users that are interested in dataProcessor are comparing it to the libraries listed below
Sorting:
- 基于知识图谱的QA系统,BERT模型☆18Updated 5 years ago
- 本项目由三个模块构成。意图识别:判断用户的意图是业务型还是闲聊型;模型检索:该部分构建一个语料库,当用户 发起新的query(通过意图识别判断为业务型对话)时,为用户匹配query检索的最佳response,使用HSWN进行召回(粗排), 然后构建句子的相似度,并利用Lig…☆11Updated 4 years ago
- chinesetokenization☆13Updated 12 years ago
- 多轮对话系统的多意图识别☆29Updated 7 years ago
- 使用fastNLP架构简单利用Bert-Bi-LSTM-CRF实现中文NER☆15Updated 4 years ago
- Self complemented Key infomation extraction including keywords, abstract from text using algorithm like textrank ,tfidf 基于Textrank算法的文本摘要…☆54Updated 7 years ago
- 基于文本相似度的win10智能客服问答系统☆15Updated 5 years ago
- 基于ELMo, tensorflow的中文命名实体标注 Chinese Named Entity Recognition Based on ELMo☆20Updated 5 years ago
- 本项目使用云问科技训练的中文版UniLM模型对微博数据集进行自动标题生成。☆39Updated last year
- 金庸小说人物关系图谱构建☆63Updated 5 years ago
- Self complemented sentiment words expansion using seed sentiment words and so-pmi , this method is tested to be effective, 基于情感种子词与so-pmi…☆87Updated 7 years ago
- 提出基于划分的LDA主题模型 (PLDA)。对传统LDA模型进行改进,考虑中长篇文档篇章结构较为清晰,传统LDA在处理中长篇文档时不能识别每个篇章的主题,提出基于划分的LDA主题模型,对中长篇文档如新闻报道】国务院工作报告等按照段落进行划分,先拆后合,并将其效果与传统LDA…☆41Updated 6 years ago
- 这是我2014级本科毕业论文项目,在深交所实习期间完成!☆20Updated 7 years ago
- 使用BERT构建多标签标注模型☆42Updated 5 years ago
- ☆82Updated 6 years ago
- Neural Relation Extraction implemented with LSTM in TensorFlow☆17Updated 7 years ago
- Chinese Subjective Dectection based on subjective knowlegebase, 中文主观性计算。基于中文主观性知识库的句子主观性评定方法。☆57Updated last year
- bert,albert计算中文句子的相似度☆21Updated 5 years ago
- 分别使用TextRank、BiLSTM和UniLM实现中文文章标题自动生成☆28Updated 4 years ago
- 闲聊机器人☆11Updated 5 years ago
- pytorch bert 版的 multi_label_text_classification☆10Updated 5 years ago
- ☆11Updated 5 years ago
- Vanilla Highway-LSTM Biaffine Dependency Parser for Chinese Semantic Dependency Parsing☆14Updated 5 years ago
- 根据文本相似 度实现问答的聊天机器人(简单版)☆52Updated 7 years ago
- 实现基于相似度匹配和检索的问答系统☆18Updated 6 years ago
- 依存句法解析☆15Updated 5 years ago
- 采用依存句法分析进行关系抽取☆21Updated 7 years ago
- 基于语义的中文文本关键词提取算法☆20Updated 4 years ago
- self complemented WeiboIndexSpyder based on Selenium ,新浪微博指数(微指数)采集,包括综合指数,移动端指数,PC端指数☆31Updated 7 years ago
- self implement of NLP toolkit 个人实现NLP汉语自然语言处理组件,提供基于HMM与CRF的分词,词性标注,命名实体识别接口,提供基于CRF的依存句法接口。☆55Updated 7 years ago