hqu-little-boy / Filter4J-pythonLinks
一个极小化的,基于深度学习的,文本内容违规检测(文本内容安全、文本审核)库
☆18Updated last year
Alternatives and similar repositories for Filter4J-python
Users that are interested in Filter4J-python are comparing it to the libraries listed below
Sorting:
- 基于多模态特征融合的即时社交软件违规图片检测系统。通过结合图像和文本信息,系统支持对OCR后的文本进行高效的敏感词检测,并允许用户自定义敏感词词库。此外,系统能够自动识别图片中的二维码并提取域名进行安全检测,实现对图片的三分类,包括正常、涉黄和敏感信息,并支持建立图片黑白名…☆65Updated last year
- 基于Tensorflow的文本内容安全审核☆17Updated last year
- 通用的图像分类项目,并以涉黄、涉政、涉恐和普通图片4分类为例。☆145Updated 5 years ago
- 一个短视频app文本审核模块的实现思路及demo☆122Updated 7 years ago
- 基于Flask Web的中文自动语音识别演示系统,包含语音识别、语音合成、声纹识别之说话人识别。☆171Updated last year
- transformer,机器翻译,中文--英文☆82Updated 2 years ago
- 中文:方便好用的文本分类模型训练加推理全公开!欢迎star后礼貌获取!大体上本项目采用ERINE3.0的base版本将文本转换为语义向量而后做特征进行分类,实测上限极高可以优化后在61分类任务中达到92%准确率。☆49Updated last year
- DFA 实现中文敏感词检测☆102Updated 3 years ago
- 使用python实现,基于DFA算法的敏感词屏蔽☆35Updated 6 years ago
- 使用Tensorflow实现声纹识别☆324Updated last year
- 计算社会学,爬虫,机器学习,情感分析,疫情舆论☆21Updated 4 years ago
- 本项目旨在识别长短文本中的敏感词,并对整段/句文本进行语义分类,从而达到文本审核的目的☆67Updated 5 years ago
- 使用transformer架构实现简单的英语翻译中文模型☆96Updated 5 years ago
- 基于 BERT 的中文情感分类任务 如何使用 transformers 库和相关工具实现情感分析任务。脚本基于预训练的 BERT 模型(bert-base-chinese),对文本进行分类,标签为正面(positive)、负面(negative)和中性(neutral)。☆39Updated 9 months ago
- 使用朴素贝叶斯、SVM、逻辑回归、RF、XGBoost、LightGBM的方法实现垃圾邮件分类任务,博客链接:https://blog.csdn.net/ljx0951/article/details/106116944☆53Updated 2 years ago
- 统计中文词频,去除停止词☆10Updated 8 years ago
- 中文情感分析,CNN,BI-LSTM,文本分类☆1,037Updated 2 years ago
- 豆瓣爬虫可视化项目☆37Updated 5 months ago
- 中文标点符号模型,可以给文本添加标点符号。☆144Updated 9 months ago
- xmnlp:提供中文分词, 词性标注, 命名体识别,情感分析,文本纠错,文本转拼音,文本摘要,偏旁部首,句子表征及文本相似度计算等功能☆1,291Updated 2 years ago
- dialogbot, provide search-based dialogue, task-based dialogue and generative dialogue model. 对话机器人,基于问答型对话、任务型对话、聊天型对话等模型实现,支持网络检索问答,领域知识…☆333Updated last year
- 情感分析、文本分类、词典、bayes、sentiment analysis、TextCNN、classification、tensorflow、BERT、CNN、text classification☆501Updated 4 months ago
- 说话人识别(声纹识别)算法的Python实现。包括GMM(已完成)、GMM-UBM、ivector、基于深度学习的声纹识别(self-attention已完成)。☆101Updated 2 years ago
- Pytorch实现的流式与非流式的自动语音识别框架,同时兼容在线和离线识别,目前支持Conformer、Squeezeformer、DeepSpeech2模型,支持多种数据增强方法。☆705Updated 4 months ago
- 收集的一些敏感词汇,挺全的,还细分了暴恐词库、反动词库、民生词库、色情词库、贪腐词库、其他词库等☆434Updated 8 years ago
- 基于语音的语种识别☆30Updated 2 years ago
- 对b站弹幕、评论进行爬虫,然后使用Word2Vec模型将其转化为词向量进行分析☆32Updated 3 years ago
- pytextclassifier is a toolkit for text classification. 文本分类,LR,Xgboost,TextCNN,FastText,TextRNN,BERT等分类模型实现,开箱即用。☆514Updated last year
- 【逐条处理完成】人为审核+修改每一条的弱智吧精选问题QA数据集☆230Updated 6 months ago
- This repository contains some sentiment analysis models and sequence tagging models, including BiLSTM, TextCNN, BERT for both tasks. All …☆12Updated 2 years ago