JiangYanting / Chinese_Malicious_Web_Pages_Dataset_And_Detection
中文恶意网页检测数据集与检测方法
☆18Updated last year
Alternatives and similar repositories for Chinese_Malicious_Web_Pages_Dataset_And_Detection:
Users that are interested in Chinese_Malicious_Web_Pages_Dataset_And_Detection are comparing it to the libraries listed below
- 本仓主要实现并解决基于预训练bert,预训练字向量和词向量实现Bert_RCNN用于一个长文本对应对个标签的问题☆17Updated 3 years ago
- 基于PaddleNLP搭建评论观点抽取和属性级情感分析模型,并基于前后端分离式架构完成属性级情感分析Web系统搭建,通过细粒度情感分析帮助用户和商家更好决策。☆63Updated last year
- 几种GAN模型用于文本生成☆13Updated 5 years ago
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆46Updated last month
- bert文本多分类(情感分析)、bert-bilstm-crf序列标注任务(快递地址的序列标注任务)☆31Updated 3 years ago
- SMP2020微博情绪分类评测☆31Updated 4 years ago
- 利用指针网络进行信息抽取,包含命名实体识别、关系抽取、事件抽取。☆124Updated last year
- 文本分类baseline:BERT、半监督学习UDA、对抗学习、数据增强☆100Updated 3 years ago
- 面向数据安全治理的数据内容智能发现与分级分类——一种通用的应对中文无监督文本分类的解题思路分享☆48Updated 3 years ago
- 基于url特征的轻量级的恶意页面检测☆20Updated 7 years ago
- 2022字节跳动安全AI挑战赛赛道一冠军—— 基于文本和多模态数据的风险识别 题目名称:Emoji复杂文本识别☆13Updated 2 years ago
- RelExt: A Tool for Relation Extraction from Text. 文本实体关系抽取工具。☆48Updated 2 years ago
- 根据维基中文语料库预训练 GloVe 中文词向量;Pre-train GloVe word-embedding From Chinese Wiki corpus☆70Updated last year
- THUCNews中文文本分类数据集,该数据集包含84万篇新闻文档,总计14类;在该模型的基础上测试多个版本bert分类效果。☆58Updated 3 years ago
- 使用bert进行中文方面级情感识别。☆22Updated last year
- 毕业设计:基于Bert_Position_BiLSTM_Attention_CRF_LSTMDecoder的法律文书要素识别☆53Updated 3 years ago
- 领域自适应文本挖掘工具(新词发现、情感分析、实体链接等),基于少量种子词和背景知识☆13Updated 5 years ago
- 超长文本分类(大于1000字);文档级/篇章级文本分类;主要是解决长距离依赖问题☆125Updated 3 years ago
- 基于Bilstm + CRF的信息抽取模型☆32Updated 3 years ago
- Cascade bert+word vec and one layer FLAT, trained by adversarial FGM and Stochastic Weight Averaging☆23Updated 3 years ago
- Simple Transformers四种任务(分类、命名实体识别、机器阅读理解、语言模型微调)的代码样例,可以切换多种预训练模型。☆22Updated 2 years ago
- 今日头条中文新闻(文本)分类数据集☆63Updated 6 years ago
- 大模型文本分类☆31Updated 5 months ago
- 使用谷歌2020pegasus模型进行中文文档摘要☆26Updated 2 years ago
- Bert预训练模型fine-tune计算文本相似度☆100Updated last year
- 非结构化商业文本信息中隐私信息识别-rank2☆22Updated 3 years ago
- Pytorch进行长文本分类。这里用到的网络有:FastText、TextCNN、TextRNN、TextRCNN、Transformer☆46Updated 4 years ago
- 采用bert进行事件抽取,[cls]进行事件分类,最后一层向量进行序列标注,两个任务同时训练。☆12Updated 3 years ago
- 面向数据安全治理的数据内容智能发现与分级分类 A榜rank7 B榜rank10☆32Updated 3 years ago
- 使用bert进行事件抽取。☆42Updated last year