shangfr / Embedding-AnalysisLinks
nlp分析工具是一款基于NLP开源算法和模型库(jieba、spacy、paddlenlp)对文本数据进行向量化,然后通过机器学习算法(聚类、主成分分析、图网络GraphicalLasso)对文本数据词向量之间进行关联性分析的小工具。
☆18Updated 2 years ago
Alternatives and similar repositories for Embedding-Analysis
Users that are interested in Embedding-Analysis are comparing it to the libraries listed below
Sorting:
- 基于pytorch的中文意图识别和槽位填充☆202Updated 3 months ago
- 文本相似度,语义向量,文本向量,text-similarity,similarity, sentence-similarity,BERT,SimCSE,BERT-Whitening,Sentence-BERT, PromCSE, SBERT☆75Updated 11 months ago
- 中文标注工具,支持NER、文本分类、关系标注、对话标注等。☆82Updated last year
- 🌈 NERpy: Implementation of Named Entity Recognition using Python. 命名实体识别工具,支持BertSoftmax、BertSpan等模型,开箱即用。☆116Updated last year
- 一个基于预训练的句向量生成工具☆138Updated 2 years ago
- Minimal keyword extraction with BERT☆88Updated 4 years ago
- 天池比赛作品整理。实现从pdf中提取出姓名、出生年月、性别、电话、最高学历、籍贯、落户市县、政治面貌、毕业院校、工作单位、工作内容、职务、项目名称、项目责任、学位、毕业时间、工作时间、项目时间共18个字段。☆116Updated last year
- 基于火力发电厂知识问答库的检索式问答系统/问答系统/对话系统☆57Updated 5 years ago
- 超长文本分类(大于1000字);文档级/篇章级文本分类;主要是解决长距离依赖问题☆132Updated 4 years ago
- 学习开源chatGPT类模型的指南,汇总各种训练数据获取、模型微调、模型服务的方法,以及记录自己操作总遇到的各种常见坑,欢迎收藏、转发,希望能帮你省一些时间☆76Updated 2 years ago
- chatglm-6B for tools application using langchain☆77Updated 2 years ago
- OpenTextClassification is all you need for text classification! Open text classification for everyone, enjoy your NLP journey! 这可能是目前为止最全…☆208Updated last year
- 基于BERT模型的深度学习中文文本分类实现,包含大约20000条新闻的训练和测试集,包装有简单HTTP接口可供调用。☆23Updated 5 years ago
- 中文世界的NLP自动标注开源工具,简单样本,交给LabelFast。☆80Updated 10 months ago
- 基于Qwen2模型进行通用信息抽取【实体/关系/事件抽取】☆38Updated last year
- llama信息抽取实战☆101Updated 2 years ago
- 无监督中文关键词抽取(Keyphrase Extraction),基于统计,基于图【LDA与PageRank(TextRank, TPR, Salience Rank, Single TPR等)】,基于嵌入【SIFRank等】,开箱即用!☆108Updated 3 years ago
- 基于pytorch的百度UIE命名实体识别。☆56Updated 2 years ago
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆53Updated 8 months ago
- kbqa,langchain,large langauge model, chatgpt☆83Updated last year
- Ziya-LLaMA-13B是IDEA基于LLaMa的130亿参数的大规模预训练模型,具备翻译,编程,文本分类,信息抽取,摘要,文案生成,常识问答和数学计算等能力。目前姜子牙通用大模型已完成大规模预训练、多任务有监督微调和人类反馈学习三阶段的训练过程。本文主要用于Ziya-…☆45Updated 2 years ago
- ChatGLM2-6B微调, SFT/LoRA, instruction finetune☆110Updated 2 years ago
- FAQ智能问答系统。实现FAQ的问题-模板匹配功能。部署轻量级的Web服务应用。☆65Updated last year
- LLM for NER☆81Updated last year
- 行业知识图谱,关系抽取,数据清洗,ncov,疫情数据,百科,医疗,保险,汽车,垃圾分类,产业链,投资,高考,行业专家圈子,CXO圈子☆119Updated last year
- 政务公文知识图谱构建☆21Updated 3 years ago
- 通用版面分析 | 中文文档解析 |Document Layout Analysis | layout paser☆47Updated last year
- 地址标准化☆125Updated last year
- 采用一个模型同时实现问题生成和答案生成☆29Updated 2 years ago
- 一个短视频app文本审核模块的实现思路及demo☆122Updated 7 years ago