junchaoIU / pythonCenter
✨个人的python代码库(部分)。🌈包涵python基础、各类主流自然语言处理工具接口调用,Keras&Tensortflow实战,数据分析、爬虫等
☆11Updated 3 years ago
Alternatives and similar repositories for pythonCenter
Users that are interested in pythonCenter are comparing it to the libraries listed below
Sorting:
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆50Updated 2 months ago
- 一个新闻政策类爬虫项目,实现上万网站的实时监控、爬取、过滤、存储,具有高可用性和可扩展性。☆37Updated 2 years ago
- 使用Simhash对海量文本进行去重☆12Updated 6 years ago
- 文本自动摘要☆94Updated 2 years ago
- 互联网舆情企业风险事件的识别和预警,将公司名称进行实体提取,对新闻进行舆情分类,比赛地址为:http://ailab.aiwin.org.cn/competitions/48#learn_the_details☆16Updated 3 years ago
- 专业领域词库构建/中文新词发现/专业词库发现☆29Updated 5 years ago
- RelExt: A Tool for Relation Extraction from Text. 文本实体关系抽取工具。☆50Updated 2 years ago
- ☆23Updated last year
- 税收政策服务--政策爬虫,从国税总局,及其他税务相关机构的网站,爬取税收政策、解读、条约等信息,以备后续处理☆24Updated 5 years ago
- CCKS 2022 通用信息抽取☆12Updated 3 years ago
- 该项目是基于Scrapy框架的Python新闻爬虫,能够爬取网易,搜狐,凤凰和澎湃网站上的新闻,将标题,内容,评论,时间等内容整理并保存到本地☆39Updated 5 years ago
- 基于qlora对baichuan-7B大模型进行指令微调。☆23Updated last year
- 中文语料库:包括情感词典 情感分析 文本分类 单轮对话 中文词典 知乎☆117Updated 7 years ago
- 利用python爬虫从日本雅虎网站获取新闻(政治,经济,体育等类别),对新闻文本做相似度计算,训练新闻分类模型☆20Updated 7 years ago
- 基于新浪微博的面向食品安全的舆情话题检测与追踪系统☆12Updated 2 years ago
- 京东/淘宝客服对话数据公开,seq2seq生成模型设计对话系统获第二名☆43Updated 2 years ago
- 一个微博毒舌AI,疯狂 diss 微博博主☆12Updated 4 months ago
- 基于webMagic爬取知乎数据,并按天定时归档☆43Updated last week
- 通用新闻类网站分布式爬虫☆75Updated 6 years ago
- ☆12Updated last month
- 合同信息抽取☆17Updated 4 years ago
- 中文心理问答数据集☆75Updated 5 years ago
- 从jieba分词到BERT-wwm,一步步带你进入中文NLP的世界☆15Updated 2 years ago
- 百度百科 500 万数据集☆34Updated last year
- Sentence-Transformers Information Retrieval example on Chinese☆29Updated last year
- 新闻文本自动摘要, 以Textrank 为基础,融入 标题特征,单句位置特征,重要实体特征,线索词特征,做句子的综合权重计算,并使用MMR算法,兼顾自动摘要的主题相关性和摘要多样性。☆26Updated 3 years ago
- 医疗语料库。医疗机构名语料库。药品本位码。☆69Updated last year
- 文本对关系比较 - 语义相似度、字面相似度、文本蕴含等等☆55Updated 5 years ago
- deep training task☆29Updated 2 years ago
- A Multi-Modal Dataset of Chinese Governmental Docunments☆33Updated 4 years ago