JiangYanting / Word_list_dataset_terminology
术语词典数据集/分词词典/专业词表语料库/词汇知识库/领域词表下载/主题词表/词库/自然语言处理/数据挖掘/深度学习
☆26Updated 4 years ago
Alternatives and similar repositories for Word_list_dataset_terminology:
Users that are interested in Word_list_dataset_terminology are comparing it to the libraries listed below
- 本人项目进行中搜集的数据集,包含原始数据和经过处理后的数据,项目持续更新。☆111Updated 4 years ago
- 中文语料库:包括情感词典 情感分析 文本分类 单轮对话 中文词典 知乎☆117Updated 6 years ago
- 基于Pytorch+BERT+CRF的NLP序列标注模型,目前包括分词,词性标注,命名实体识别等☆57Updated 2 years ago
- An exploration for Eventline (important news Rank organized by pulic time),针对某一事件话题下的新闻报道集合,通过使用docrank算法,对新闻报道进行重要性识别,并通过新闻报道时间挑选出时间线上重要…☆216Updated 6 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆149Updated 3 years ago
- 根据维基中文语料库预训练 GloVe 中文词向量;Pre-train GloVe word-embedding From Chinese Wiki corpus☆70Updated last year
- ☆73Updated 4 years ago
- SikuBERT:四库全书的预训练语言模型(四库BERT) Pre-training Model of Siku Quanshu☆119Updated last year
- 使用torch整合两种经典的指针NER抽取范式,分别是SpanBert和苏神的GlobalPointer,简单加了些tricks,配置后一键运行☆130Updated 7 months ago
- Self complemented sentiment words expansion using seed sentiment words and so-pmi , this method is tested to be effective, 基于情感种子词与so-pmi…☆86Updated 6 years ago
- 基于BERT+BiLSTM+CRF实现中文命名实体识别☆141Updated 4 years ago
- Bert预训练模型fine-tune计算文本相似度☆100Updated last year
- 基于ltp的简单评论观点抽取模块☆116Updated 6 years ago
- 针对3个语料库,玻森数据 (https://bosonnlp.com) 、1998年人民日报标注数据、MSRA微软亚洲研究院开源数据,在前人的基础上,重新升级换代,达到更高的精确率。☆13Updated 5 years ago
- Chinese Sentiment Classification Tool. 情感极性分类,基于知网、清华、BosonNLP情感词典,易扩展,基准方法,开箱即用。☆90Updated last year
- “万创杯”中医药天池大数据竞赛——中医文献问题生成挑战 决赛 第一名方案☆131Updated 4 years ago
- A light NER Tool,NER标注工具,基于Vue & FastAPI,带NER数据增强☆64Updated 4 years ago
- 本NER项目包含多个中文数据集,模型采用BiLSTM+CRF、BERT+Softmax、BERT+Cascade、BERT+WOL等,最后用TFServing进行模型部署,线上推理和线下推理。☆80Updated 3 years ago
- 端到端的长本文摘要模型(法研杯2020司法摘要赛道)☆391Updated 7 months ago
- TF-IDF+Word2vec做文本相似度计算,最好是长文本☆24Updated 5 years ago
- 使用开源的Bert-as-Service预训练生成文档特征向量,基于k-means对COVID-19文献聚类,t-SNE可视化数据,通过LDA为每个簇生成主题关键词,画Bokeh图实现按簇、关键词搜索和筛选数据。☆19Updated 4 years ago
- WordMultiSenseDisambiguation, chinese multi-wordsense disambiguation based on online bake knowledge base and semantic embedding similarit…☆124Updated 6 years ago
- Chinese Embedding collection incling token ,postag ,pinyin,dependency,word embedding.中文自然语言处理向量合集,包括字向量,拼音向量,词向量,词性向量,依存关系向量.共5种类型的向量☆449Updated 6 years ago
- Sequential Event Experiment based on Travel note crawled from XieCheng,基于50W携程出行游记的采集与顺承事件图谱构建.☆181Updated 6 years ago
- ChineseTextualInference project including chinese corpus build and inferecence model, 中文文本推断项目,包括88万文本蕴含中文文本蕴含数据集的翻译与构建,基于深度学习的文本蕴含判定模型构建…☆167Updated 6 years ago
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆46Updated last month
- 人民日报语料处理工具集 | Tools for Corpus of People's Daily☆272Updated last year
- Clustering text with Bert☆56Updated 4 years ago
- 搜集、整理、发布 中文 自然语言处理 语料/数据集,与 有志之士 共同 促进 中文 自然语言处理 的 发展。☆64Updated 5 years ago