junchaoIU / pythonCenterLinks
✨个人的python代码库(部分)。🌈包涵python基础、各类主流自然语言处理工具接口调用,Keras&Tensortflow实战,数据分析、爬虫等
☆12Updated 3 years ago
Alternatives and similar repositories for pythonCenter
Users that are interested in pythonCenter are comparing it to the libraries listed below
Sorting:
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆53Updated 5 months ago
- 澎湃新闻,新浪新闻,腾讯新闻,搜狐新闻,新闻联播,泰晤士报,纽约时报,BBCNews,旨在爬取所有新闻门户网站的新闻,禁止将所得数据商用!☆405Updated 2 years ago
- 77,370条敏感文本和22,823个敏感词的高质量数据集,并进行分类☆13Updated 5 months ago
- 基于弹幕情感分析的直播高光时刻判断模型设计与系统实现☆25Updated 2 years ago
- 文本自动摘要☆93Updated 2 years ago
- Ziya-LLaMA-13B是IDEA基于LLaMa的130亿参数的大规模预训练模型,具备翻译,编程,文本分类,信息抽取,摘要,文案生成,常识问答和数学计算等能力。目前姜子牙通用大模型已完成大规模预训练、多任务有监督微调和人类反馈学习三阶段的训练过程。本文主要用于Ziya-…☆45Updated 2 years ago
- Law Crime Mining Based on Corpus build and content analysis by NLP methods. 基于领域语料库构建与NLP方法的裁判文书与犯罪案例文本挖掘项目☆347Updated 6 years ago
- <数字人文教程>资源合集☆102Updated last year
- Mimix: A Text Generation Tool and Pretrained Chinese Models☆157Updated 10 months ago
- 中文心理问答数据集☆78Updated 5 years ago
- OpenTextClassification is all you need for text classification! Open text classification for everyone, enjoy your NLP journey! 这可能是目前为止最全…☆208Updated last year
- 利用python爬虫从日本雅虎网站获取新闻(政治,经济 ,体育等类别),对新闻文本做相似度计算,训练新闻分类模型☆19Updated 7 years ago
- mirror of dongxiexidian/Chinese☆301Updated 6 years ago
- 领域自适应文本挖掘工具(新词发现、情感分析、实体链接等),基于少量种子词和背景知识☆13Updated 6 years ago
- 打造人人都会的NLP,开源不易,记得star哦☆101Updated 2 years ago
- 爬取裁判文书网上的文书并进行特征分析和罪名预测☆31Updated 3 years ago
- A Multi-Modal Dataset of Chinese Governmental Docunments☆35Updated 4 years ago
- A Python toolkit for file processing, text cleaning and data splitting. 文件处理,文本清洗和数据划分的python工具包。☆33Updated 2 years ago
- 该项目是基于Scrapy框架的Python新闻爬虫,能够爬取网易,搜狐,凤凰和澎湃网站上的新闻,将标题,内容,评论,时间等内容整理并保存到本地☆39Updated 6 years ago
- 互联网在线翻译引擎爬虫集合,包含谷歌翻译、百度翻译、有道翻译、必应翻译等引擎。Internet online translation engine crawler collection, including Google translation, Baidu transla…☆81Updated 3 years ago
- ChatGPT WebUI using gradio. 给 LLM 对话和检索知识问答RAG提供一个简单好用的Web UI界面☆133Updated last year
- “法阿”中文分词:做最好的 Python 法律中文分词组件☆32Updated 4 years ago
- 从jieba分词到BERT-wwm,一步步带你进入中文NLP的世界☆15Updated 3 years ago
- 利用LLM+敏感词库,来自动判别是否涉及敏感词。☆127Updated 2 years ago
- 利用文本挖掘技术进行新闻热点关注问题分析☆163Updated 6 years ago
- 无监督中文仿真评论自动生成。 Unsupervised Automatic Generation of Chinese Fake Reviews.☆84Updated 6 years ago
- 中文文本相似度计算器☆158Updated 11 months ago
- 税收政策服务--政策爬虫,从国税总局,及其他税务相关机构的网站,爬取税收政策、解读、条约等信息,以备后续处理☆26Updated 6 years ago
- 今日头条中文新闻(文本)分类数据集☆68Updated 7 years ago
- 基于webMagic爬取知乎数据,并按天定时归档☆46Updated 3 months ago