liwenju0 / cutword
一个简单快速的分词、命名实体识别工具
☆568Updated 8 months ago
Alternatives and similar repositories for cutword:
Users that are interested in cutword are comparing it to the libraries listed below
- unified embedding model☆851Updated last year
- Phi2-Chinese-0.2B 从0开始训练自己的Phi2中文小模型,支持接入langchain加载本地知识库做检索增强生成RAG。Training your own Phi2 small chat model from scratch.☆533Updated 7 months ago
- 中文Mixtral混合专家大模型(Chinese Mixtral MoE LLMs)☆598Updated 10 months ago
- 中文Mixtral-8x7B(Chinese-Mixtral-8x7B)☆648Updated 6 months ago
- An easy-to-use framework for modular RAG☆327Updated this week
- PromptCLUE, 全中文任务支持零样本学习模型☆660Updated last year
- A Python Package to Access World-Class Generative Models☆126Updated 8 months ago
- 语言模型中文认知能力分析☆236Updated last year
- 基于开源embedding模型的中文向量效果测试☆131Updated last year
- Firefly中文LLaMA-2大模型,支持增量预训练Baichuan2、Llama2、Llama、Falcon、Qwen、Baichuan、InternLM、Bloom等大模型☆406Updated last year
- 一个适合学习、使用、自主扩展的RAG【检索增强生成】系统!可联网做AI搜 索☆454Updated 5 months ago
- ChatGLM2-6B 全参数微调,支持多轮对话的高效微调。☆399Updated last year
- Chat-甄嬛是利用《甄嬛传》剧本中所有关于甄嬛的台词和语句,基于ChatGLM2进行LoRA微调得到的模仿甄嬛语气的聊天语言模型。☆605Updated 6 months ago
- 雅意信息抽取大模型:在百万级人工构造的高质量信息抽取数据上进行指令微调,由中科闻歌算法团队研发。 (Repo for YAYI Unified Information Extraction Model)☆289Updated 6 months ago
- Q&A based on elasticsearch+langchain+chatglm2 | 基于elasticsearch,langchain,chatglm2的自有知识库问答☆236Updated last year
- ChatGLM-6B 指令学习|指令数据|Instruct☆656Updated last year
- Llama3-Chinese是以Meta-Llama-3-8B为底座,使用 DORA + LORA+ 的训练方法,在50w高质量中文多轮SFT数据 + 10w英文多轮SFT数据 + 2000单轮自我认知数据训练而来的大模型。☆294Updated 10 months ago
- 中文法律LLaMA (LLaMA for Chinese legel domain)☆905Updated 6 months ago
- 聚宝盆(Cornucopia): 中文金融系列开源可商用大模型,并提供一套高效轻量化的垂直领域LLM训练框架(Pretraining、SFT、RLHF、Quantize等)☆617Updated last year
- 企业级RAG系统从入门到精通☆341Updated this week
- 中文对话0.2B小模型(ChatLM-Chinese-0.2B),开源所有数据集来源、数据清洗、tokenizer训练、模型预训练、SFT指令微调、RLHF优化等流程的全部代码。支持下游任务sft微调,给出三元组信息抽取微调示例。☆1,429Updated 10 months ago
- 本项目旨在收集开源的表格智能任务数据集(比如表格问答、表格-文本生成等),将原始数据整理为指令微调格式的数据并微调LLM,进而增强LLM对于表格数据的理解,最终构建出专门面向表格智能任务的大型语言模型。☆535Updated 10 months ago
- Netease Youdao's open-source embedding and reranker models for RAG products.☆1,642Updated 3 weeks ago
- 本地知识库 + chatGLM6B + CustomAgent☆264Updated last year
- ChatPilot: Chat Agent Web UI,实现Chat对话前端,支持Google搜索、文件网址对话(RAG)、代码解释器功能,复现了Kimi Chat(文件,拖进来; 网址,发出来)。☆548Updated last month
- TextGen: Implementation of Text Generation models, include LLaMA, BLOOM, GPT2, BART, T5, SongNet and so on. 文本生成模型,实现了包括LLaMA,ChatGLM,BLO…☆952Updated 5 months ago
- 自然语言转SQL,直接连接数据库查询☆376Updated last year
- Z-Bench 1.0 by 真格基金:一个麻瓜的大语言模型中文测试集。Z-Bench is a LLM prompt dataset for non-technical users, developed by an enthusiastic AI-focused team…☆491Updated last year
- Alpaca Chinese Dataset -- 中文指令微调数据集☆192Updated 4 months ago
- 更纯粹、更高压缩率的Tokenizer☆470Updated 3 months ago