shangfr / Embedding-AnalysisLinks
nlp分析工具是一款基于NLP开源算法和模型库(jieba、spacy、paddlenlp)对文本数据进行向量化,然后通过机器学习算法(聚类、主成分分析、图网络GraphicalLasso)对文本数据词向量之间进行关联性分析的小工具。
☆16Updated last year
Alternatives and similar repositories for Embedding-Analysis
Users that are interested in Embedding-Analysis are comparing it to the libraries listed below
Sorting:
- 基于BERT模型的深度学习中文文本分类实现,包含大约20000条新闻的训练和测试集,包装有简单HTTP接口可供调用。☆24Updated 4 years ago
- 中文世界的NLP自动标注开源工具,简单样本,交给LabelFast。☆71Updated 4 months ago
- 中文标注工具,支持NER、文本分类、关系标注、对话标注等。☆76Updated 10 months ago
- NLP tools, word segmentation, sentence segmentation, New-Word-Discovery,新词发现☆25Updated last year
- 地址标准化☆120Updated last year
- 文本相似度,语义向量,文本向量,text-similarity,similarity, sentence-similarity,BERT,SimCSE,BERT-Whitening,Sentence-BERT, PromCSE, SBERT☆73Updated 6 months ago
- 基于Qwen2模型进行通用信息抽取【实体/关系/事件抽取】☆31Updated 10 months ago
- 基于意图识别和命名实体识别的多轮对话场景设计☆39Updated 6 years ago
- 基于火力发电厂知识问答库的检索式问答系统/问答系统/对话系统☆53Updated 5 years ago
- 基于文本相似度的win10智能客服问答系统☆15Updated 5 years ago
- Minimal keyword extraction with BERT☆85Updated 3 years ago
- 超长文本分类(大于1000字);文档级/篇章级文本分类;主要是解决长距离依赖问题☆130Updated 3 years ago
- 打造人人都会的NLP,开源不易,记得star哦☆101Updated 2 years ago
- easy-bert是一个中文NLP工具,提供诸多bert变体调用和调参方法,极速上手;清晰的设计和代码注释,也很适合学习☆78Updated 2 years ago
- 政务公文知识图谱构建☆21Updated 2 years ago
- 学习开源chatGPT类模型的指南,汇总各种训练数据获取、模型微调、模型服务的方法,以及记录自己操作总遇到的各种常见坑,欢迎收藏、转发,希望能帮你省一些时间☆75Updated last year
- A light NER Tool,NER标注工具,基于Vue & FastAPI,带NER数据增强☆64Updated 5 years ago
- 基于pytorch_bert的中文多标签分类☆91Updated 3 years ago
- LSTM,TextCNN,fastText情感分析,模型用 tf_serving 和 flask 部署成web应用☆42Updated 5 years ago
- 任务型对话系统(Task-based Dialogue System)☆65Updated 3 years ago
- 使用BERT构建多标签标注模型☆41Updated 5 years ago
- 基于ERNIE的中文NER☆37Updated 3 years ago
- 中文新词发现算法PNW算法,可以识别任意长度的新词。☆15Updated last year
- 基于知识图谱的林业法律法规问答☆20Updated 2 years ago
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆51Updated 3 months ago
- 无监督中文关键词抽取(Keyphrase Extraction),基于统计,基于图【LDA与PageRank(TextRank, TPR, Salience Rank, Single TPR等)】,基于嵌入【SIFRank等】,开箱即用!☆105Updated 2 years ago
- Clustering text with Bert☆56Updated 4 years ago
- chatglm-6B for tools application using langchain☆75Updated 2 years ago
- 使用python自动构建知识图谱,百万、千万、亿万级别☆39Updated 2 years ago
- 供AI训练的中文数据集(持续更新。。。)与AI公司图谱,目前的数据集餐饮行业8000问,百度知道,Alpaca中文数据集,计算机领域数据集,Vicuna数据集,RedPajama数据集,Wikipedia中文词条数据集,网站论坛问答数据集☆57Updated last year