gl-coding / OpenSpider
爬取各种数据的爬虫的样例(百度百科、知乎、微博、简书、搜狗词库),可用于自然语言处理语料收集
☆11Updated 5 years ago
Alternatives and similar repositories for OpenSpider:
Users that are interested in OpenSpider are comparing it to the libraries listed below
- 本人项目进行中搜集的数据集,包含原始数据和经过处理后的数据,项目持续更新。☆112Updated 4 years ago
- 基于Pytorch+BERT+CRF的NLP序列标注模型,目前包括分词,词性标注,命名实体识别等☆58Updated 2 years ago
- 基于词汇信息融合的中文NER模型☆164Updated 2 years ago
- A PyTorch implementation of a BiLSTM \ BERT \ Roberta (+ BiLSTM + CRF) model for Chinese Word Segmentation (中文分词) .☆207Updated 2 years ago
- 基于SpanBert的中文指代消解,pytorch实现☆96Updated 2 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆152Updated 3 years ago
- chinese-sequence-ner多模型中文命名实体识别☆75Updated 4 years ago
- 中文语料库:包括情感词典 情感分析 文本分类 单轮对话 中文词典 知乎☆117Updated 6 years ago
- 基于Pytorch的BERT-IDCNN-BILSTM-CRF中文实体识别实现☆88Updated 2 years ago
- pytorch实现 基于Bert+BiLSTM+CRF的中文命名实体识别☆42Updated 3 years ago
- 基于Pytorch的命名实体识别框架,支持LSTM+CRF、Bert+CRF、RoBerta+CRF等框架☆82Updated last year
- A light NER Tool,NER标注工具,基于Vue & FastAPI,带NER数据增强☆64Updated 4 years ago
- NER(命名实体识别)中文语料,一站式获取☆129Updated 5 years ago
- nlp codes for study☆15Updated last year
- An exploration for Eventline (important news Rank organized by pulic time),针对某一事件话题下的新闻报道集合,通过使用docrank算法,对新闻报道进行重要性识别,并通过新闻报道时间挑选出时间线上重要…☆215Updated 6 years ago
- Keyphrase or Keyword Extraction 基于预训练模型的中文关键词抽取方法(论文SIFRank: A New Baseline for Unsupervised Keyphrase Extraction Based on Pre-trained La…☆421Updated 4 years ago
- 搜集、整理、发布 中文 自然语言处理 语料/数据集,与 有志之士 共同 促进 中文 自然语言处理 的 发展。☆96Updated 6 years ago
- Bert预训练模型fine-tune计算文本相似度☆100Updated last year
- bert实现中文NER☆30Updated 2 years ago
- 端到端的长本文摘要模型(法研杯2020司法摘要赛道)☆391Updated 8 months ago
- 教育行业新闻 自动文摘 语料库 自动摘要☆196Updated 6 years ago
- Source code for the paper "PLOME: Pre-training with Misspelled Knowledge for Chinese Spelling Correction" in ACL2021☆234Updated 2 years ago
- 中文命名实体识别NER。用keras实现BILSTM+CRF、IDCNN+CRF、BERT+BILSTM+CRF进行实体识别。结果当然是BERT+BILSTM+CRF最好啦。☆286Updated 5 years ago
- 基于pytorch的中文拼写纠错,使用的模型是Bert以及SoftMaskedBert☆31Updated 3 years ago
- 实体识别和关系抽取的联合模型☆121Updated 6 years ago
- Unilm for Chinese Chitchat Robot.基于Unilm模型的夸夸式闲聊机器人项目。☆157Updated 4 years ago
- 超长文本分类(大于1000字);文档级/篇章级文本分类;主要是解决长距离依赖问题☆126Updated 3 years ago
- 全局指针统一处理嵌套与非嵌套NER☆254Updated 3 years ago
- A full-process dialogue system that can be deployed online☆98Updated 2 years ago
- ChineseNER based on BERT, with BiLSTM+CRF layer☆447Updated 3 years ago