junchaoIU / pythonCenterLinks
✨个人的python代码库(部分)。🌈包涵python基础、各类主流自然语言处理工具接口调用,Keras&Tensortflow实战,数据分析、爬虫等
☆12Updated 3 years ago
Alternatives and similar repositories for pythonCenter
Users that are interested in pythonCenter are comparing it to the libraries listed below
Sorting:
- 77,370条敏感文本和22,823个敏感词的高质量数据集,并进行分类☆13Updated 9 months ago
- 文本自动摘要☆93Updated 2 years ago
- 澎湃新闻,新浪新闻,腾讯新闻,搜狐新闻,新闻联播,泰晤士报,纽约时报,BBCNews,旨在爬取所有新闻门户网站的新闻,禁止将所得数据商用!☆425Updated 3 years ago
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆53Updated 9 months ago
- 中文文本相似度计算器☆166Updated last year
- Mimix: A Text Generation Tool and Pretrained Chinese Models☆157Updated last year
- 天眼查的快速傻瓜爬虫脚本。输入目标企业的模糊名称/简称,即可将目标企业的工商信息分门别类地保存为Excel文件。☆23Updated 7 years ago
- 基于webMagic爬取知乎数据,并按天定时归档☆45Updated 7 months ago
- The most complete Chinese dictionaries ever. 史上最全的中文分类词库,包含地理信息、电子游戏、工程应用、农林牧渔、人文科学、社会科学、生活百 科、医学医药、艺术设计、娱乐休闲、运动休闲、自然科学等12大类的超级字典。☆85Updated 5 years ago
- Ziya-LLaMA-13B是IDEA基于LLaMa的130亿参数的大规模预训练模型,具备翻译,编程,文本分类,信息抽取,摘要,文案生成,常识问答和数学计算等能力。目前姜子牙通用大模型已完成大规模预训练、多任务有监督微调和人类反馈学习三阶段的训练过程。本文主要用于Ziya-…☆45Updated 2 years ago
- 通用新闻类网站分布式爬虫☆79Updated 7 years ago
- 智能营销文案生成☆35Updated 7 months ago
- <数字人文教程>资源合集☆110Updated last year
- 基于 Simhash 的论文查重系统☆81Updated 3 years ago
- 基于弹幕情感分析的直播高光时刻判断模型设计与系统实现☆25Updated 3 years ago
- An exploration for Eventline (important news Rank organized by pulic time),针对某一事件话题下的新闻报道集合,通过使用docrank算法,对新闻报道进行重要性识别,并通过新闻报道时间挑选出时间线上重要…☆225Updated 7 years ago
- RelExt: A Tool for Relation Extraction from Text. 文本实体关系抽取工具。☆51Updated 3 years ago
- 互联网在线翻译引擎爬虫集合,包含谷歌翻译、百度翻译、有道翻译、必应翻译等引擎。Internet online translation engine crawler collection, including Google translation, Baidu transla…☆82Updated 4 years ago
- A Python toolkit for file processing, text cleaning and data splitting. 文件处理,文本清洗和数据划分的python工具包。☆34Updated 3 years ago
- 中文心理问答数据集☆79Updated 5 years ago
- 中文图书数据集/数据挖掘/自然语言处理/中国图书分类法/图书情报学/数据挖掘/文本分类/☆96Updated 9 months ago
- Law Crime Mining Based on Corpus build and content analysis by NLP methods. 基于领域语料库构建与NLP方法的裁判文书与犯罪案例文本挖掘项目☆350Updated 7 years ago
- “法阿”中文分词:做最好的 Python 法律中文分词组件☆34Updated 5 years ago
- OpenTextClassification is all you need for text classification! Open text classification for everyone, enjoy your NLP journey! 这可能是目前为止最全…☆209Updated last year
- 该项目是基于Scrapy框架的Python新闻爬虫,能够爬取网易,搜狐,凤凰和澎湃网站上的新闻,将标题,内容,评论,时间等内容整理并保存到本地☆38Updated 6 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆170Updated 4 years ago
- Chinese Sentiment Classification Tool. 情感极性分类,基于知网、清华、BosonNLP情感词典,易扩展,基准方法,开箱即用。☆102Updated 2 years ago
- 多线程爬虫Get豆瓣电影、演员、书籍、作者信息☆71Updated 6 years ago
- 记录今日头条热门搜索,每小时更新,按天归档。☆59Updated this week
- pke_zh, python keyphrase extraction for chinese(zh). 中文关键词或关键句提取工具,实现了KeyBert、PositionRank、TopicRank、TextRank等算法,开箱即用。☆215Updated last year