konsheng / Sensitive-lexicon
敏感词库旨在建立一个词汇集,用于识别和过滤文本内容中的不当或不适宜的语言,以保护用户免受有害信息的影响并维持沟通环境的健康。
☆211Updated 2 months ago
Related projects ⓘ
Alternatives and complementary repositories for Sensitive-lexicon
- 腾讯的离线敏感词库☆1,103Updated last year
- 敏感词检测,违禁词过滤,敏感词过滤,敏感词库,一键启动,本地运行,私有化部署,1分钟接入完成,开箱即用,支持docker,支持在线api☆485Updated this week
- 本项目旨在识别长短文本中的敏感词,并对整段/句文本进行语义分类,从而达到文本审核的目的☆61Updated 4 years ago
- 收集的一些敏感词汇,挺全的 ,还细分了暴恐词库、反动词库、民生词库、色情词库、贪腐词库、其他词库等☆384Updated 7 years ago
- 利用LLM+敏感词库,来自动判别是否涉及敏感词。☆105Updated last year
- 轻量超严格敏感词库☆122Updated last year
- 超轻量的中文敏感字、敏感词库,字典词典,超低误识别率,另提供API调用☆82Updated 5 years ago
- 敏感词库整理☆167Updated 8 years ago
- 大语言模型微调,Qwen2VL、Qwen2、GLM4指令微调☆207Updated this week
- 基于chatglm3-6b模型的lora方法的微调☆75Updated 7 months ago
- 互联网常用敏感词、停止词词库☆1,284Updated 5 months ago
- 基于分词原理修改写的一个过滤敏感词库,可以改成动态,支持返回敏感词,高亮敏感词,替换敏感词等操作,本敏感词收集了5W多个违法词、敏感词、违禁词,已去重,最新追加了将近1W个最新词,几十个矫正词、变异词。☆191Updated 4 years ago
- 全方位大模型评测知识库 | 提示词工程(Prompt Engineer)、各渠道大模型榜单(LeaderBoard)、标杆数据集、安全检测、对抗攻击、智能体、优质数据、文本分类、关系抽取、语音识别、语音合成、多模态、文本生成图片、文本生成视频、点云、智能对话、摘要总结、问答…☆34Updated this week
- [EMNLP'24] CharacterGLM: Customizing Chinese Conversational AI Characters with Large Language Models☆410Updated 7 months ago
- 对深度学习中的NLP进行解释和代码使用☆37Updated 10 months ago
- 大模型中文测试题库-民间版本☆54Updated last year
- "桃李“: 国际中文教育大模 型☆168Updated last year
- Alpaca Chinese Dataset -- 中文指令微调数据集【人工+GPT4o持续更新】☆185Updated last month
- 专注于中文领域大语言模型,落地到某个行业某个领域,成为一个行业大模型、公司级别或行业级别领域大模型。☆112Updated 2 months ago
- DFA 实现中文敏感词检测☆94Updated 2 years ago
- chatglm3base模型的有监督微调SFT☆74Updated last year
- 论坛、社交网站、博客、微博等允许用户生成内容的网站,常常遇到屏蔽违禁词、敏感词、广告、色情等文字的问题。这里给出一份违禁词列表,供大家参考。☆41Updated 8 years ago
- Phi2-Chinese-0.2B 从0开始训练自己的Phi2中文小模型,支持接入langchain加载本地知识库做检索增强生成RAG。Training your own Phi2 small chat model from scratch.☆488Updated 4 months ago
- 使用聊天记录和播客文章,基于chatGLM-6B训练自己的数字克隆的方案实现,包括用到的脚本和最后部署成前端页面的代码☆243Updated last year
- 中文聊天小模型,用t5 base在大量数据上有监督。☆98Updated last year
- 中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库、汽…☆23Updated last year
- 中文对话0.2B小模型(ChatLM-Chinese-0.2B),开源所有数据集来源、数据清洗、tokenizer训练、模型预训练、SFT指令微调、RLHF优化等流程的全部代码。支持下游任务sft微调,给出三元组信息抽取微调示例。☆1,246Updated 7 months ago
- 【逐条进行中】人为审核+加修改每一条的弱智吧精选问题QA数据集☆94Updated last week
- 🚀 智谱清言 ChatGLM4大模型逆向API白嫖测试【特长:超强智能体】,支持高速流式输出、支持智能体对话、支持多轮对话、支持视频生成、支持AI绘图、支持联网搜索、支持长文档解读、支持代码调用、支持图像解析,零配置部署,多路token支持,自动清理会话痕迹。☆597Updated 3 months ago
- 360zhinao☆282Updated 2 months ago