shibing624 / similarities
Similarities: a toolkit for similarity calculation and semantic search. 相似度计算、匹配搜索工具包,支持亿级数据文搜文、文搜图、图搜图,python3开发,开箱即用。
☆828Updated 3 months ago
Alternatives and similar repositories for similarities:
Users that are interested in similarities are comparing it to the libraries listed below
- unified embedding model☆849Updated last year
- TextGen: Implementation of Text Generation models, include LLaMA, BLOOM, GPT2, BART, T5, SongNet and so on. 文本生成模型,实现了包括LLaMA,ChatGLM,BLO…☆950Updated 5 months ago
- PromptCLUE, 全中文任务支持零样本学习模型☆661Updated last year
- 中文CLIP预训练模型☆399Updated 2 years ago
- 人工精调的中文对话数据集和一段chatglm的微调代码☆1,166Updated 9 months ago
- text2vec, text to vector. 文本向量表征工具,把文本转化为向量矩阵,实现了Word2Vec、RankBM25、Sentence-BERT、CoSENT等文本表征、文本相似度计算模型,开箱即用。☆4,612Updated last month
- Tuning LLMs with no tears💦; Sample Design Engineering (SDE) for more efficient downstream-tuning.☆984Updated 9 months ago
- 一个简单快速的分词、命名实体识别工具☆568Updated 7 months ago
- The online version is temporarily unavailable because we cannot afford the key. You can clone and run it locally. Note: we set defaul ope…☆807Updated 8 months ago
- ChatGLM-6B 指令学习|指令数据|Instruct☆653Updated last year
- PaddleNLP UIE模型的PyTorch版实现☆613Updated last year
- 开源SFT数据集整理,随时补充☆485Updated last year
- 雅意信息抽取大模型:在百万级人工构造的高质量信息抽取数据上进行指令微调,由中科闻歌算法团队研发。 (Repo for YAYI Unified Information Extraction Model)☆289Updated 6 months ago
- 3000000+语义理解与匹配数据集。可用于无监督对比学习、半监督学习等构建中文领域效果最好的预训练模型☆291Updated 2 years ago
- 使用peft库,对chatGLM-6B/chatGLM2-6B实现4bit的QLoRA高效微调,并做lora model和base model的merge及4bit的量化(quantize)。☆356Updated last year
- [COLING 2022] CSL: A Large-scale Chinese Scientific Literature Dataset 中文科学文献数据集☆597Updated last year
- MiniRBT (中文小型预训练模型系列)☆265Updated last year
- chatglm多gpu用deepspeed和☆405Updated 7 months ago
- An Open-sourced Knowledgable Large Language Model Framework.☆1,270Updated last month
- Mengzi Pretrained Models☆533Updated 2 years ago
- pCLUE: 1000000+多任务提示学习数据集☆478Updated 2 years ago
- 《ChatGPT原理与实战:大型语言模型的算法、技术和私有化》☆348Updated last year
- chatglm 6b finetuning and alpaca finetuning☆1,540Updated 10 months ago
- 探索中文instruct数据在ChatGLM, LLaMA上的微调表现☆390Updated last year
- 为ChatGLM设计的微调数据集生成工具,速来制作自己的猫娘。☆603Updated 11 months ago
- 骆驼:A Chinese finetuned instruction LLaMA. Developed by 陈启源 @ 华中师范大学 & 李鲁鲁 @ 商汤科技 & 冷子昂 @ 商汤科技☆712Updated last year
- pke_zh, python keyphrase extraction for chinese(zh). 中文关键词或关键句提取工具,实现了KeyBert、PositionRank、TopicRank、TextRank等算法,开箱即用。☆197Updated 10 months ago
- 中文命名实体识别。包含目前最新的中文命名实体识别论文、中文实体识别相关工具、数据集,以及中文预训练模型、词向量、实体识别综述等。☆659Updated last month
- 语言模型中文认知能力分析☆236Updated last year
- 本项目旨在收集开源的表格智能任务数据集(比如表格问答、表格-文本生成等),将原始数据整理为指令微调格式的数据并微调LLM,进而增强LLM对于表格数据的理解,最终构建出专门面向表格智能任务的大型语言模型。☆529Updated 10 months ago