wjn1996 / scrapy_for_zh_wiki
基于scrapy的层次优先队列方法爬取中文维基百科,并自动抽取结构和半结构数据
☆147Updated last year
Alternatives and similar repositories for scrapy_for_zh_wiki:
Users that are interested in scrapy_for_zh_wiki are comparing it to the libraries listed below
- 中文命名 实体识别☆43Updated 3 years ago
- ☆37Updated 2 years ago
- 中文信息抽取,包含实体抽取、关系抽取、事件抽取☆243Updated last year
- OneRel在中文关系抽取中的使用☆119Updated last year
- 利用指针网络进行信息抽取,包含命名实体识别、关系抽取、事件抽取。☆123Updated 2 years ago
- 基于GlobalPointer的实体/关系/事件抽取☆146Updated 3 years ago
- KgCLUE: 大规模中文开源知识图谱问答☆446Updated 2 years ago
- 基于知识图谱的问答系统☆135Updated 5 years ago
- 实体关系抽取pipline方式,使用了BiLSTM+CRF+BERT☆139Updated 10 months ago
- 中文关系抽取☆459Updated last year
- 北京航空航天大学大数据高精尖中心自 然语言处理研究团队对信息抽取领域的调研。包括实体识别,关系抽取,属性抽取等子任务,每类子任务分别对学术界和工业界进行调研。☆466Updated 2 years ago
- 中文NER的那些事儿☆316Updated last year
- Using BERT+Bi-LSTM+CRF☆138Updated 3 years ago
- All NLP you Need Here. 目前包含15个NLP demo的pytorch实现(大量代码借鉴于其他开源项目,原先是自己玩的,后来干脆也开源出来)☆272Updated this week
- 基于pytorch的中文三元组提取(命名实体识别+关系抽取)☆347Updated last year
- Reimplement CasRel model in PyTorch.使用PyTorch对吉林大学CasRel模型进行复现,并在百度关系抽取数据集上训练测试。☆191Updated 2 years ago
- 基于词汇信息融合的中文NER模型☆166Updated 3 years ago
- A tutorial and implement of disease centered Medical knowledge graph and qa system based on it。知识图谱构建,自动问答,基于kg的自动问答。以疾病为中心的一定规模医药领域知识图谱…☆68Updated 6 years ago
- CMeIE/CBLUE/CHIP/实体关系抽取/SPO抽取☆228Updated 2 years ago
- experiments of some semantic matching models and comparison of experimental results.☆161Updated last year
- 实体关系抽取,使用了百度比赛的数据集。使用pytorch实现MultiHeadJointEntityRelationExtraction,包含Bert、Albert、gru的使用,并且添加了对抗训练。最后使用Flask和Neo4j图数据库对模型进行了部署☆120Updated last year
- CMeEE/CBLUE/NER实体识别☆129Updated 3 years ago
- 文本相似度,语义向量,文本向量,text-similarity,similarity, sentence-similarity,BERT,SimCSE,BERT-Whitening,Sentence-BERT, PromCSE, SBERT☆73Updated 4 months ago
- Implemention of NER model on chinese dataset.☆71Updated 2 years ago
- ☆132Updated 5 months ago
- Chinese-Text-Classification Project including bert-classification, textCNN and so on.☆156Updated 2 years ago
- 基于知识图谱的问答系统设计与实现,附带一个可视化的demo☆122Updated last year
- 基于pytorch + bert的多标签文本分类(multi label text classification)☆103Updated last year
- 超长文本分类(大于1000字);文档级/篇章级文本分类;主要是解决长距离依赖问题☆130Updated 3 years ago
- 爬取金融数据,利用neo4j构建金 融知识图谱,进而搭建金融问答系统。☆63Updated 2 years ago