wjn1996 / scrapy_for_zh_wikiLinks
基于scrapy的层次优先队列方法爬取中文维基百科,并自动抽取结构和半结构数据
☆152Updated 2 years ago
Alternatives and similar repositories for scrapy_for_zh_wiki
Users that are interested in scrapy_for_zh_wiki are comparing it to the libraries listed below
Sorting:
- 中文命名实体识别☆45Updated 3 years ago
- 利用指针网络进行信息抽取,包含命名实体识别、关系抽取、事件抽取。☆126Updated 2 years ago
- 中文信息抽取,包含实体抽取、关系抽取、事件抽取☆245Updated last year
- Implemention of NER model on chinese dataset.☆73Updated 2 years ago
- ☆39Updated 2 years ago
- A tutorial and implement of disease centered Medical knowledge graph and qa system based on it。知识图谱构建,自动问答,基于kg的自动问答。以疾病为中心的一定规模医药领域知识图谱…☆70Updated 6 years ago
- KgCLUE: 大规模中文开源知识图谱问答☆446Updated 2 years ago
- 基于知识图谱的问答系统设计与实现,附带一个可视化的demo☆123Updated last year
- 本项目使用大语言模型(LLM)进行开放领域三元组抽取。☆26Updated last year
- Chinese-Text-Classification Project including bert-classification, textCNN and so on.☆157Updated 2 years ago
- A PyTorch implementation of a BiLSTM \ BERT \ Roberta (+ BiLSTM + CRF) model for Chinese Word Segmentation (中文分词) .☆210Updated 2 years ago
- 基于pytorch_bert的中文多标签分类☆91Updated 3 years ago
- 使用多种方法 做中文命名实体识别(NER),代码包含详细注释☆49Updated 2 years ago
- 中文关系抽取☆461Updated last year
- 爬取金融数据,利用neo4j构建金融知识图谱,进而搭建金融问答系统。☆67Updated 2 years ago
- ☆139Updated 6 months ago
- Using BERT+Bi-LSTM+CRF☆139Updated 3 years ago
- OneRel在中文关系抽取中的使用☆126Updated last year
- 基于词汇信息融合的中文NER模型☆168Updated 3 years ago
- 基于BERT的中文命名实体识别☆41Updated 3 years ago
- 此项目完成了关于 NLP-Beginner:自然语言处理入门练习 的所有任务(文本分类、信息抽取、知识图谱、机器翻译、问答系统、文本生成、Text-to-SQL、文本纠错、文本挖掘、知识蒸馏、模型加速、OCR、TTS、Prompt、embedding等),所有代码都经过测试…☆203Updated last year
- 北京航空航天大学大数据高精尖中心自然语言处理研究团队对信息抽取领域的调研。包括实体识别,关系抽取,属性抽取等子任务,每类子任务分别对学术界和工业界进行调研。☆471Updated 3 years ago
- bert_seq2seq的DDP版本,支持bert、roberta、nezha、t5、gpt2等模型,支持seq2seq、ner、关系抽取等任务,无需添加额外代码,轻松启动DDP多卡训练。☆52Updated 2 years ago
- 常见疾病相关信息构建knowledge graph☆158Updated 4 years ago
- 基于pytorch的中文三元组提取(命名实体识别+关系抽取)☆349Updated 2 years ago
- 基于知识图谱的问答系统☆136Updated 5 years ago
- 超长文本分类(大于1000字);文档级/篇章级文本分类;主要是解决长距离依赖问题☆130Updated 3 years ago
- 基于pytorch + bert的多标签文本分类(multi label text classification)☆103Updated last year
- Reimplement CasRel model in PyTorch.使用PyTorch对吉林大学CasRel模型进行复现,并在百度关系抽取数据集上训练测试。☆192Updated 2 years ago
- SimCSE中文语义相似度对比学习模型☆85Updated 3 years ago