shibing624 / pinyin-tokenizer
pinyintokenizer, 拼音分词器,将连续的拼音切分为单字拼音列表。
☆27Updated 10 months ago
Related projects ⓘ
Alternatives and complementary repositories for pinyin-tokenizer
- Tracking the hot Github repos and update daily 每天自动追踪Github热门项目☆42Updated this week
- 打造人人都会的NLP,开源不易,记得star哦☆101Updated last year
- clue chatyuan finetuning☆16Updated 6 months ago
- Agentica: Build Multi-Agent Workflow with 3 lines code. 三行代码打造个人助手智能体。☆85Updated 3 weeks ago
- 百度QA100万数据集☆49Updated 11 months ago
- 如需体验textin文档解析,请点击https://cc.co/16YSIy☆23Updated 4 months ago
- 百度百科 500 万数据集☆30Updated 11 months ago
- 基于 LoRA 和 P-Tuning v2 的 ChatGLM-6B 高效参数微调☆54Updated last year
- 基于ChatGPT构建的中文self-instruct数据集☆112Updated last year
- 中文纠错☆91Updated 2 years ago
- bge推理优化相关脚本☆24Updated 9 months ago
- 一个非常高效的字符串匹配工具,支持正向/反向最大匹配分词和多模式字符串精确匹配☆17Updated last year
- 该项目主要是抽取病历文件中的一些关键信息。并将抽取的内容进行streamlit前端的展示。目前支持的文件类型:图片,pdf文件,word文件☆22Updated 2 years ago
- 通用版面分析 | 中文文档解析 |Document Layout Analysis | layout paser☆45Updated 4 months ago
- Silk Road will be the dataset zoo for Luotuo(骆驼). Luotuo is an open sourced Chinese-LLM project founded by 陈启源 @ 华中师范大学 & 李鲁鲁 @ 商汤科技 & 冷子…☆37Updated last year
- ChatGLM-6B fine-tuning.☆135Updated last year
- GTS Engine: A powerful NLU Training System。GTS引擎(GTS-Engine)是一款开箱即用且性能强大的自然语言理解引擎,聚焦于小样本任务,能够仅用小样本就能自动化生产NLP模型。☆89Updated last year
- optimize your prompt like promptperfect|万能提示词|大语言模型提示词优化☆34Updated last year
- 时间抽取、解析、标准化工具☆49Updated 2 years ago
- 基于sentence transformers和chatglm实现的文档搜索工具☆154Updated last year
- Llama2开源模型中文版-全方位测评,基于SuperCLUE的OPEN基准 | Llama2 Chinese evaluation with SuperCLUE☆127Updated last year
- ☆90Updated 5 months ago
- 基于行块分布函数的通用网页正文抽取算法优化,Python实现☆57Updated 4 years ago
- 大语言模型训练和服务调研☆33Updated last year
- 大规模中文语料☆38Updated 5 years ago