konsheng / Sensitive-lexicon
敏感词库旨在建立一个词汇集,用于识别和过滤文本内容中的不当或不适宜的语言,以保护用户免受有害信息的影响并维持沟通环境的健康。
☆344Updated 4 months ago
Alternatives and similar repositories for Sensitive-lexicon:
Users that are interested in Sensitive-lexicon are comparing it to the libraries listed below
- Filter4J是一个极小化的,基于深度学习的,文本内容违规检测(文本内容安全、文本审核)库。☆82Updated last year
- 收集的一些敏感词汇,挺全的,还细分了暴恐词库、反动词库、民生词库、色情词库、贪腐词库、其他词库等☆407Updated 7 years ago
- 腾讯的离线敏感词库☆1,220Updated last year
- 敏感词检测,违禁词过滤,敏感词过滤,敏感词库,一键启动,本地运行,私有化部署,1分钟接入完成,开箱即用,支持docker,支持在线api☆518Updated 2 months ago
- 利用LLM+敏感词库,来自动判别是否涉及敏感词。☆112Updated last year
- [EMNLP'24] CharacterGLM: Customizing Chinese Conversational AI Characters with Large Language Models☆457Updated 2 months ago
- 互联网常用敏感词、停止词词库☆1,381Updated 9 months ago
- 开源的智能体项目 支持6种聊天平台 Onebotv11一对多连接 流式信息 agent 对话keyboard气泡生成 支持10+大模型接口(持续更新) 具有将多种大模型接口转化为带有上下文的通用格式的能力.☆122Updated 6 months ago
- ☆75Updated last year
- 从小说中提取对话数据集☆174Updated 9 months ago
- "他山之石、可以攻玉":复旦白泽智能发布面向国内开源和国外商用大模型的Demo数据集JADE-DB☆391Updated 2 weeks ago
- 本项目旨在识别长短文本中的敏感词,并对整段/句文本进行语义分类,从而达到文本审核的目的☆64Updated 5 years ago
- 🚀 智谱清言ChatGLM-4-Plus大模型逆向API【特长:超强智能体】,支持高速流式输出、支持智能体对话、支持多轮对话、支持Zero思考推理模型、支持视频生成、支持AI绘图、支持联网搜索、支持长文档解读、支持代码调用、支持图像解析,零配置部署,多路token支持,自…☆674Updated 2 months ago
- 🚀WebUI integrated platform for latest LLMs | 各大语言模型的全流程工具 WebUI 整合包。支持主流大模型API接口和开源模型。支持知识库,数据库,角色扮演,mj文生图,LoRA和全参数微调,数据集制作,live2d等全流程应用…☆531Updated 4 months ago
- 中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字 词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库、汽…☆23Updated 2 years ago
- 轻量超严格敏感词库☆128Updated last year
- 一个简单快速的分词、命名实体识别工具☆572Updated last week
- 为ChatGLM设计的微调数据集生成工具,速来制作自己的猫娘。☆603Updated last year
- 沐雪,一个会自动找你聊天的AI女孩子☆417Updated 3 weeks ago
- Filter4J的技术细节☆13Updated last year
- 大语言模型微调,Qwen2VL、Qwen2、GLM4指令微调☆348Updated 2 months ago
- 论坛、社交网站、博客、微博等允许用户生成内容的网站,常常遇到屏蔽违禁词、敏感词、广告、色情等文字的问题。这里给出一份违禁词列表,供大家参考。☆42Updated 8 years ago
- 超轻量的中文敏感字、敏感词库,字典词典,超低误识别率,另提供API调用☆83Updated 5 years ago
- ☆181Updated last month
- 👋 欢迎来到 ChatGLM 创意世界!你可以使用修订和续写的功能来生成创意内容!☆247Updated 8 months ago
- 大模型中文测试题库-民间版本☆75Updated last year
- 基于开源embedding模型的中文向量效果测试☆135Updated last year
- Llama3-Chinese是以Meta-Llama-3-8B为底座,使用 DORA + LORA+ 的训练方法,在50w高质量中文多轮SFT数据 + 10w英文多轮SFT数据 + 2000单轮自我认知数据训练而来的大模型。☆294Updated 11 months ago
- 支持将openai、claude、azure openai, gemini,kimi, 智谱AI,通义千问,讯飞星火API等模型服务方的调用转为openai方式调用。屏蔽不同大模型API的差异,统一用openai api标准格式使用大模型(Shield the differ…☆399Updated 11 months ago
- 基于chatglm3-6b模型的lora方法的微调☆76Updated 11 months ago