shangfr / Embedding-AnalysisLinks
nlp分析工具是一款基于NLP开源算法和模型库(jieba、spacy、paddlenlp)对文本数据进行向量化,然后通过机器学习算法(聚类、主成分分析、图网络GraphicalLasso)对文本数据词向量之间进行关联性分析的小工具。
☆16Updated last year
Alternatives and similar repositories for Embedding-Analysis
Users that are interested in Embedding-Analysis are comparing it to the libraries listed below
Sorting:
- 政务公文知识图谱构建☆21Updated 2 years ago
- 中文世界的NLP自动标注开源工具,简单样本,交给LabelFast。☆73Updated 5 months ago
- 基于ERNIE的中文NER☆37Updated 3 years ago
- 中文标注工具,支持NER、文本分类、关系标注、对话标注等。☆76Updated 10 months ago
- Minimal keyword extraction with BERT☆84Updated 3 years ago
- NER实体识别模型,快速高效简单一键部署docker部署调用模型。能识别: 地址、人名、机构名实体。☆36Updated last year
- 🌈 NERpy: Implementation of Named Entity Recognition using Python. 命名实体识别工具,支持BertSoftmax、BertSpan等模型,开箱即用。☆114Updated last year
- 超长文本分类(大于1000字);文档级/篇章级文本分类;主要是解决长距离依赖问题☆130Updated 3 years ago
- llama信息抽取实战☆100Updated 2 years ago
- 无监督中文关键词抽取(Keyphrase Extraction),基于统计,基于图【LDA与PageRank(TextRank, TPR, Salience Rank, Single TPR等)】,基于嵌入【SIFRank等】,开箱即用!☆105Updated 3 years ago
- 基于pytorch的百度UIE命名实体识别。☆56Updated 2 years ago
- 使用sentence-transformers(SBert)训练自己的文本相似度数据集并进行评估。☆48Updated 3 years ago
- 毕业设计:基于Bert_Position_BiLSTM_Attention_CRF_LSTMDecoder的法律文书要素识别☆56Updated 4 years ago
- 利用指针网络进行信息抽取,包含命名实体识别、关系抽取、事件抽取。☆126Updated 2 years ago
- 本方案在以下赛事中获得TOP3名次:1.2021百度paddlepaddle&国家电网AI创新大赛 语义解析赛道 三等奖 2.千言·语义解析 冠军 3.CCKS 2022 金融NL2SQL 亚军 4. WAIC 2022 Text2SQL 三等奖☆31Updated 3 years ago
- 文本相似度,语义向量,文本向量,text-similarity,similarity, sentence-similarity,BERT,SimCSE,BERT-Whitening,Sentence-BERT, PromCSE, SBERT☆74Updated 7 months ago
- 本项目采用Keras和Keras-bert实现文本多分类任务,对BERT进行微调。☆48Updated 4 years ago
- prompt engineering ,llm,text2sql☆37Updated last year
- BLOOM 模型的指令微调☆24Updated 2 years ago
- 基于pytorch的中文意图识别和槽位填充☆178Updated 11 months ago
- 中文文本纠错模型,keras实现☆74Updated 3 years ago
- 文本智能校对大赛(Chinese Text Correction)的baseline☆67Updated 2 years ago
- 本项目由三个模块构成。意图识别:判断用户的意图是业务型还是闲聊型;模型检索:该部分构建一个语料库,当用户 发起新的query(通过意图识别判断为业务型对话)时,为用户匹配query检索的最佳response,使用HSWN进行召回(粗排), 然后构建句子的相似度,并利用Lig…☆11Updated 4 years ago
- Clustering text with Bert☆56Updated 5 years ago
- 基于pytorch的级联Bert用于中文命名实体识别。☆21Updated 2 years ago
- 基于pytorch + bert的多标签文本分类(multi label text classification)☆105Updated last year
- A light NER Tool,NER标注工具,基于Vue & FastAPI,带NER数据增强☆64Updated 5 years ago
- 基于pytorch的GlobalPointer进行中文命名实体识别。☆36Updated last year
- 时间抽取、解析、标准化工具☆52Updated 2 years ago
- 通用版面分析 | 中文文档解析 |Document Layout Analysis | layout paser☆46Updated last year