shangfr / Embedding-Analysis
nlp分析工具是一款基于NLP开源算法和模型库(jieba、spacy、paddlenlp)对文本数据进行向量化,然后通过机器学习算法(聚类、主成分分析、图网络GraphicalLasso)对文本数据词向量之间进行关联性分析的小工具。
☆14Updated last year
Alternatives and similar repositories for Embedding-Analysis:
Users that are interested in Embedding-Analysis are comparing it to the libraries listed below
- 文本相似度,语义向量,文本向量,text-similarity,similarity, sentence-similarity,BERT,SimCSE,BERT-Whitening,Sentence-BERT, PromCSE, SBERT☆73Updated 2 months ago
- Minimal keyword extraction with BERT☆79Updated 3 years ago
- A light NER Tool,NER标注工具,基于Vue & FastAPI,带NER数据增强☆64Updated 4 years ago
- 超长文本分类(大于1000字);文档级/篇章级文本分类;主要是解决长距离依赖问题☆126Updated 3 years ago
- 基于开源保险产品数据构建的保险知识图谱及简易问答系统☆35Updated 5 years ago
- 无监督中文关键词抽取(Keyphrase Extraction),基于统计,基于图【LDA与PageRank(TextRank, TPR, Salience Rank, Single TPR等)】,基于嵌入【SIFRank等】,开箱即用!☆105Updated 2 years ago
- NER实体识别模型,快速高效简单一键部署docker部署 调用模型。能识别:地址、人名、机构名实体。☆35Updated last year
- 中文文本纠错模型,keras实现☆70Updated 3 years ago
- 基于Qwen2模型进行通用信息抽取【实体/关系/事件抽取】☆29Updated 7 months ago
- 基于ERNIE的中文NER☆34Updated 2 years ago
- LLM for NER☆61Updated 6 months ago
- 🌈 NERpy: Implementation of Named Entity Recognition using Python. 命名实体识别工具,支持BertSoftmax、BertSpan等模型,开箱即用。☆115Updated 11 months ago
- 基于pytorch的百度UIE命名实体识别。☆56Updated 2 years ago
- 基于pytorch的中文意图识别和槽位填充☆157Updated 7 months ago
- 基于pytorch_bert的中文多标签分类☆87Updated 3 years ago
- 基于词汇信息融合的中文NER模型☆164Updated 2 years ago
- 文本智能校对大赛(Chinese Text Correction)的baseline☆67Updated 2 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆152Updated 3 years ago
- easy-bert是一个中文NLP工具,提供诸多bert变体调用和调参方法,极速上手;清晰的设计和代码注释,也很适合学习☆77Updated 2 years ago
- prompt engineering ,llm,text2sql☆34Updated last year
- 基于意图识别和命名实体识别的多轮对话场景设计☆37Updated 5 years ago
- 政务公文知识图谱构建☆19Updated 2 years ago
- NLP tools, word segmentation, sentence segmentation, New-Word-Discovery,新词发现☆25Updated last year
- 基于火力发电厂知识问答库的检索式问答系统/问答系统/对话系统☆50Updated 4 years ago
- 基于汽车知识图谱的汽车问答多轮对话系统☆34Updated 5 years ago
- Bert预训练模型fine-tune计算文本相似度☆100Updated last year
- 使用torch整合两种经典的指针NER抽取范式,分别是SpanBert和苏神的GlobalPointer,简单加了些tricks,配置后一键运行☆131Updated 8 months ago
- 通用版面分析 | 中文文档解析 |Document Layout Analysis | layout paser☆45Updated 8 months ago
- 使用bert做领域分类、意图识别和槽位填充任务☆75Updated 4 years ago
- 天池比赛作品整理。实现从pdf中提取出姓名、出生年月、性别、电话、最高学历、籍贯、落户市县、政治面貌、毕业院校、工作单位、工作内容、职务、项目名称、项目责任、学位、毕业时间、工作时间、项目时间共18个字段。☆113Updated 6 months ago