gl-coding / OpenSpiderLinks
爬取各种数据的爬虫的样例(百度百科、知乎、微博、简书、搜狗词库),可用于自然语言处理语料收集
☆13Updated 2 months ago
Alternatives and similar repositories for OpenSpider
Users that are interested in OpenSpider are comparing it to the libraries listed below
Sorting:
- 大连理工大学情感词汇本体库及其他相关操作☆138Updated 8 years ago
- 本人项目进行中搜集的数据集,包含原始数据和经过处理后的数据,项目持续更新。☆116Updated 4 years ago
- 中文文本摘要(text summarization)工具包, 抽取式中文文本摘要 Extractive text summary of Lead3、keyword、textrank、text teaser、word significance、LDA、LSI、NMF。(gra…☆421Updated last year
- An collection of Chinese nlp corpus including basic Chinese syntatic wordset, semantic wordset, historic corpus and evaluate corpus. 中文自然…☆450Updated 6 years ago
- 利用bert预训练的中文模型进行文本分类 数据集中文情感分析语料chnsenticorp☆350Updated 6 years ago
- Chinese Embedding collection incling token ,postag ,pinyin,dependency,word embedding.中文自然语言处理向量合集,包括字向量,拼音向量,词向量,词性向量,依存关系向量.共5种类型的向量☆456Updated 6 years ago
- ChineseNER based on BERT, with BiLSTM+CRF layer☆455Updated 4 years ago
- SikuBERT:四库全书的预训练语言模型(四库BERT) Pre-training Model of Siku Quanshu☆142Updated 2 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、 敏感词、问答、问答数据、知识图谱、文本语料。☆171Updated 3 years ago
- 基于Pytorch+BERT+CRF的NLP序列标注模型,目前包括分词,词性标注,命名实体识别等☆62Updated 2 years ago
- An off-the-shelf tool for Chinese Keyphrase Extraction 一个快速从中文里抽取关键短语的工具,仅占35M内存 www.jionlp.com☆553Updated last year
- 人民日报1998年1-4月中文标注语料库☆32Updated 6 years ago
- 使用预训练语言模型ALBERT做中文NER☆478Updated 4 years ago
- 教育行业新闻 自动文摘 语料库 自动摘要☆202Updated 7 years ago
- 端到端的长本文摘要模型(法研杯2020司法摘要赛道)☆399Updated last year
- 维基百科中文语料整理☆299Updated 7 years ago
- Comparison of Chinese Named Entity Recognition Models between NeuroNER and BertNER☆334Updated 6 years ago
- 中文文本摘要/关键词提取☆440Updated 4 years ago
- 中文文本分析工具包(包括- 文本分类 - 文本聚类 - 文本相似性 - 关键词抽取 - 关键短语抽取 - 情感分析 - 文本纠错 - 文本摘要 - 主题关键词-同义词、近义词-事件三元组抽取)☆721Updated last year
- Core Data of HowNet and OpenHowNet Python API☆623Updated 3 years ago
- 使用谷歌预训练bert做字嵌入的BiLSTM-CRF序列标注模型☆481Updated 6 years ago
- 中文命名实体识别NER。用keras实现BILSTM+CRF、IDCNN+CRF、BERT+BILSTM+CRF进行实体识别。结果当然是BERT+BILSTM+CRF最好啦。☆294Updated 5 years ago
- ☆357Updated 4 years ago
- 基于BI-LSTM+CRF的中文命名实体识别 Pytorch☆400Updated 2 years ago
- 人民日报语料处理工具集 | Tools for Corpus of People's Daily☆285Updated 2 years ago
- 中文文本语义相似度(Chinese Semantic Text Similarity)语料库建设☆481Updated 7 years ago
- Pytorch BERT-BiLSTM-CRF For NER☆420Updated 5 years ago
- 基于Tensorflow2.3开发的NER模型,都是CRF范式,包含Bilstm(IDCNN)-CRF、Bert-Bilstm(IDCNN)-CRF、Bert-CRF,可微调预训练模型,可对抗学习,用于命名实体识别,配置后可直接运行。☆431Updated 9 months ago
- Rasa-Doctor-Friende.A chinese medical chatbot based on Neo4j knowledge graph and Rasa.☆283Updated 2 years ago
- Bert预 训练模型fine-tune计算文本相似度☆109Updated 2 years ago