shangfr / Embedding-AnalysisLinks
nlp分析工具是一款基于NLP开源算法和模型库(jieba、spacy、paddlenlp)对文本数据进行向量化,然后通过机器学习算法(聚类、主成分分析、图网络GraphicalLasso)对文本数据词向量之间进行关联性分析的小工具。
☆18Updated last year
Alternatives and similar repositories for Embedding-Analysis
Users that are interested in Embedding-Analysis are comparing it to the libraries listed below
Sorting:
- 基于pytorch的中文意图识别和槽位填充☆190Updated last month
- 中文标注工具,支持NER、文本分类、关系标注、对话标注等。☆82Updated last year
- 基于文本相似度的win10智能客服问答系统☆15Updated 5 years ago
- Minimal keyword extraction with BERT☆88Updated 3 years ago
- 超长文本分类(大于1000字);文档级/篇章级文本分类;主要是解决长距离依赖问题☆132Updated 3 years ago
- 🌈 NERpy: Implementation of Named Entity Recognition using Python. 命名实体识别工具,支持BertSoftmax、BertSpan等模型,开箱即用。☆115Updated last year
- 天池比赛作品整理。实现从pdf中提取出姓名、出生年月、性别、电话、最高学历、籍贯、落户市县、政治面貌、毕业院校、工作单位、工作内容、职务、项目名称、项目责任、学位、毕业时间、工作时间、项目时间共18个字段。☆115Updated last year
- 文本相似度,语义向量,文本向量,text-similarity,similarity, sentence-similarity,BERT,SimCSE,BERT-Whitening,Sentence-BERT, PromCSE, SBERT☆74Updated 9 months ago
- 一个基于预训练的句向量生成工具☆138Updated 2 years ago
- 基于RASA3.0+搭建的中文对话系统☆45Updated 3 years ago
- 基于BERT模型的深度学习中文文本分类实现,包含大约20000条新闻的训练和测试集,包装有简单HTTP接口可供调用。☆24Updated 5 years ago
- OpenTextClassification is all you need for text classification! Open text classification for everyone, enjoy your NLP journey! 这可能是目前为止最全…☆208Updated last year
- prompt engineering ,llm,text2sql☆38Updated last year
- 基于ERNIE的中文NER☆37Updated 3 years ago
- Tensorflow2.3的文本分类项目,支持各种分类模型,支持相关tricks。☆178Updated 9 months ago
- multi-label,classifier,text classification,多标签文本分类,文本分类,BERT,ALBERT,multi-label-classification☆141Updated 3 years ago
- 使用sentence-transformers(SBert)训练自己的文本相似度数据集并进行评估。☆49Updated 3 years ago
- 使用torch整合两种经典的指针NER抽取范式,分别是SpanBert和苏神的GlobalPointer,简单加了些tricks,配置后一键运行☆134Updated last year
- 行业知识图谱,关系抽取,数据清洗,ncov,疫情数据,百科,医疗,保险,汽车,垃圾分类,产业链,投资,高考,行业专家圈子,CXO圈子☆115Updated last year
- FAQ智能问答系统。实现FAQ的问题-模板匹配功能。部署轻量级的Web服务应用。☆63Updated last year
- 地址标准化☆125Updated last year
- 中文世界的NLP自动标注开源工具,简单样本,交给LabelFast。☆76Updated 8 months ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆170Updated 3 years ago
- 利用指针网络进行信息抽取,包含命名实体识别、关系抽取、事件抽取。☆129Updated 2 years ago
- NER实体识别模型,快速高效简单一键部署docker部署调用模型。能识别:地址、人名、机构名实体。☆36Updated 2 years ago
- 中文文本纠错模型,keras实现☆74Updated 4 years ago
- 基于pytorch的百度UIE命名实体识别。☆56Updated 2 years ago
- 基于火力发电厂知识问答库的检索式问答系统/问答系统/对话系统☆56Updated 5 years ago
- 中文文本分类、序列标注工具包(pytorch),支持中文长文本、短文本的多类、多标签分类任务,支持中文命名实体识别、词性标注、分词、抽取式文本摘要等序列标注任务。 Chinese text classification and sequence labeling toolk…☆349Updated last year
- 使用bert做领域分类、意图识别和槽位填充任务☆77Updated 5 years ago