pacoyang / chinese-spam-filterLinks
朴素贝叶斯分类器在中文垃圾邮件分类上的实现
☆18Updated 4 years ago
Alternatives and similar repositories for chinese-spam-filter
Users that are interested in chinese-spam-filter are comparing it to the libraries listed below
Sorting:
- 垃圾邮件检测 词袋模型+机器学习、word2vec+cnn☆18Updated 6 years ago
- 爬取豆瓣电影官网上的前200条评论并进行情感分析,并且生成词云☆19Updated 4 years ago
- Deepdive: Deep iterative thinking slash command for Claude Code - enables multi-round exploratory reasoning and non-linear problem-solvin…☆36Updated last month
- 基于Qwen2模型进行通用信息抽取【实体/关系/事件抽取】☆40Updated last year
- LinChance Fine-tuning System 采用 Streamlit 结合 LLaMA-Factory 打造的模型微调 Web UI☆14Updated last year
- 一个微博毒舌AI,疯狂 diss 微博博主☆14Updated 11 months ago
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆53Updated 9 months ago
- 本项目用于文档问答,使用向量嵌入 + ES 做召回,使用Rerank模型作为精排,再使用LLM做文档问答,Web框架使用Flask。☆31Updated 9 months ago
- Naive Bayesian algorithm for spam classification 朴素贝叶斯算法用于垃圾邮件分类☆68Updated 2 years ago
- Datawhale自研数据标注工具☆72Updated last year
- 基于火力发电厂知识问答库的检索式问答系统/问答系统/对话系统☆57Updated 5 years ago
- 通过python爬虫获取人民网、新浪等网站新闻作为训练集,基于BERT构建新闻文本分类模型,并结合node.js + vue完成了一个可视化界面。☆42Updated 3 years ago
- 中文世界的NLP自动标注开源工具,简单样本,交给LabelFast。☆81Updated last week
- 基于 Scrapy 的新闻智能分类微信小程序,是一个文本分类相关的应用,目的是打造出一个可以对新闻进行智能分类的微信小程序。技术栈:Python + Scrapy + MongoDB + scikit-learn + Flask + 微信小程序,涉及爬虫、文本分类、Web …☆63Updated 6 years ago
- 2020年第八届泰迪杯数据挖掘C题“智慧政务文本挖掘”特等奖作品(论文与代码)☆68Updated 3 months ago
- 一个用于BiliBili网站实时热点&舆情分析的AI 智能体☆83Updated last year
- ☆14Updated 4 years ago
- 微博评论爬取及nlp情感分析☆20Updated 7 years ago
- Simple examples of text data visualization. 文本人物可视化,词云、人物关系图谱☆112Updated 8 years ago
- 本次课程体系由复旦大学肖仰华教授策划,讲者为复旦大学、华为云、湖南大学、华东师范大学、上海财经大学、东华大学、苏州大学等青年学者。课程在国内多次巡回演讲,受到参会人员一致好评。 知识图谱课程全面系统讲授、研讨知识图谱相关概念与技术主题,对当前行业落地过程的一系列困难进行答…☆10Updated 5 years ago
- Legal-Eagle-InternLM 是一个基于商汤科技和上海人工智能实验室推出的书生浦语大模型InternLM的法律问答机器人。旨在为用户提供符合3H(即Helpful、Honest、Harmless)原则的专业、智能、全面的法律服务的法律领域大模型。☆64Updated last year
- A Multi-Modal Dataset of Chinese Governmental Docunments☆39Updated 5 years ago
- 百度百科 500 万数据集☆44Updated 2 years ago
- 基于Python+Flask+MySQL的数据微中台,支持数据库管理、数据收集(某乎爬虫等)等功能☆10Updated 5 years ago
- 利用LLM+敏感词库,来自动判别是否涉及敏感词。☆135Updated 2 years ago
- qwen models finetuning☆105Updated 9 months ago
- 基于 LoRA 和 P-Tuning v2 的 ChatGLM-6B 高效参数微调☆55Updated 2 years ago
- Transformer模型训练的单轮对话聊天机器人☆87Updated 4 years ago
- 一个可以验证和计算文本消耗 Token 的小工具,支持在浏览器中使用,汉化自 OpenAI Tokenizer。☆61Updated last year
- 英中文本机器翻译的☆102Updated 6 years ago