liwenju0 / cutword
一个简单快速的分词、命名实体识别工具
☆566Updated 6 months ago
Alternatives and similar repositories for cutword:
Users that are interested in cutword are comparing it to the libraries listed below
- unified embedding model☆846Updated last year
- Phi2-Chinese-0.2B 从0开始训练自己的Phi2中文小模型,支持接入langchain加载本地知识库做检索增强生成RAG。Training your own Phi2 small chat model from scratch.☆521Updated 6 months ago
- ChatPilot: Chat Agent Web UI,实现Chat对话前端,支持Google搜索、文件网址对话(RAG)、代码解释器功能,复现了Kimi Chat(文件,拖进来;网址,发出来)。☆531Updated 3 weeks ago
- A Python Package to Access World-Class Generative Models☆127Updated 7 months ago
- An easy-to-use framework for modular RAG☆311Updated this week
- 夫子•明察司法大模型是由山东大学、浪潮云、中国政法大学联合研发,以 ChatGLM 为大模型底座,基于海量中文无监督司法语料与有监督司法微调数据训练的中文司法大模型。该模型支持法条检索、案例分析、三段论推理判决以及司法对话等功能,旨在为用户提供全方位、高精准的法律咨询与解答…☆306Updated 3 months ago
- 中文对话0.2B小模型(ChatLM-Chinese-0.2B),开源所有数据集来源、数据清洗、tokenizer训练、模型预训练、SFT指令微调、RLHF优化等流程的全部代码。支持下游任务sft微调,给出三元组信息抽取微调示例。☆1,369Updated 9 months ago
- Q&A based on elasticsearch+langchain+chatglm2 | 基于elasticsearch,langchain,chatglm2的自有知识库问答☆234Updated last year
- 自然语言转SQL,直接连接数据库查询☆373Updated last year
- Llama3-Chinese是以Meta-Llama-3-8B为底座,使用 DORA + LORA+ 的训练方法,在50w高质量中文多轮SFT数据 + 10w英文多轮SFT数据 + 2000单轮自我认知数据训练而来的大模型。☆295Updated 9 months ago
- 中文Mixtral混合专家大模型(Chinese Mixtral MoE LLMs)☆594Updated 9 months ago
- 一个适合学习、使用、自主扩展的RAG【检索增强生成】系统!可联网做AI搜索☆428Updated 4 months ago
- Firefly中文LLaMA-2大模型,支持增量预训练Baichuan2、Llama2、Llama、Falcon、Qwen、Baichuan、InternLM、Bloom等大模型☆403Updated last year
- ChatGLM2-6B 全参数微调,支持多轮对话的高效微调。☆398Updated last year
- 📝 An Awesome Collection of Chinese Legal Dataset and Relevant Resources. 致力于收集全面的中文法律数据源☆810Updated last year
- PromptCLUE, 全中文任务支持零样本学习模型☆659Updated last year
- 企业级RAG系统从入门到精通☆297Updated last week
- 中文Mixtral-8x7B(Chinese-Mixtral-8x7B)☆646Updated 5 months ago
- An open-source educational chat model from ICALK, East China Normal University. 开源中英教育对话大模型。(通用基座模型,GPU部署,数据清理) 致敬: LLaMA, MOSS, BELLE, Z…☆742Updated 3 months ago
- LexiLaw - 中文法律大模型☆772Updated last week
- ☆352Updated 6 months ago
- Alpaca Chinese Dataset -- 中文指令微调数据集【人工+GPT4o持续更新】☆193Updated 3 months ago
- 中文法律LLaMA (LLaMA for Chinese legel domain)☆885Updated 5 months ago
- 🚀WebUI integrated platform for latest LLMs | 各大语言模型的全流程工具 WebUI 整合包。支持主流大模型API接口和开源模型。支持知识库,数据库,角色扮演,mj文生图,LoRA和全参数微调,数据集制作,live2d等全流程应用…☆508Updated 2 months ago
- 更纯粹、更高压缩率的Tokenizer☆468Updated 2 months ago
- ChatGLM-6B 指令学习|指令数据|Instruct☆653Updated last year
- Examples and guides for using the GLM APIs☆848Updated last week
- 多模态中文LLaMA&Alpaca大语言模型(VisualCLA)☆436Updated last year
- 使用peft库,对chatGLM-6B/chatGLM2-6B实现4bit的QLoRA高效微调,并做lora model和base model的merge及4bit的量化(quantize)。☆356Updated last year
- 本项目旨在收集开源的表格智能任务数据集(比如表格问答、表格-文本生成等),将原始数据整理为指令微调格式的数据并微调LLM,进而增强LLM对于表格数据的理解,最终构建出专门面向表格智能任务的大型语言模型。☆520Updated 9 months ago