xiaoqin00 / text-converter
文本格式转换(pdf、word、txt、xls)
☆100Updated 7 years ago
Related projects ⓘ
Alternatives and complementary repositories for text-converter
- 谷歌翻译,360翻译,iCIBA翻译,有道翻译,免费API☆179Updated 2 years ago
- 一个基于关键词爬虫生成词云的网络内容可视化工具,可爬取百度、谷歌、必应、知乎、微博、微信公众平台☆33Updated 4 years ago
- 各种爬虫:爱企查爬虫,网上114企业信息爬虫,抖音视频爬虫,wipo爬虫, 专利信息爬虫(patentscope)☆69Updated 3 years ago
- [2023.05.09]基于selenium的新浪微博关键字搜索结果全自动爬虫,支持自定义搜素关键字、搜索起始时间、爬取起始页数(以实现中断后接上次继续爬取)。爬取内容包括微博账号、发文时间、发送平台、微博内容、转发次数、评论次数、点赞次数、原博地址。☆28Updated last year
- Python开发的图片批量处理工具,可以为图片添加文字水印、图片水印,也可以对图片批量重命名☆31Updated 5 years ago
- 爬虫学习。实战:微博各种类型爬虫,唯品会商品,淘宝商品等☆79Updated 9 months ago
- 知网爬虫cnkispider,输入关键字爬取知网检索数据☆32Updated 6 years ago
- 知网爬虫,专利、论文项目。仅供学习交流,严禁盈利☆40Updated 2 years ago
- 一些 Python 爬虫练习:bilibili用户信息爬取、下载工具、房天下新房二手房redis分布式爬虫、简书全站文章爬取、观察者网站首页新闻爬取、淘宝模拟登陆、淘宝搜索商品信息爬取及可视化展示、知乎问题回答信息爬取\抖音无水印视频下载☆118Updated 4 years ago
- Django使用python-docx-template,并基于word模板来对模板填充数据及图表,自动化生成word报告文档。☆22Updated 4 years ago
- 文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据中国知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照词频排序提取…☆102Updated 6 years ago
- django+es搭建的前后端分离,唐诗宋词搜索引擎。☆36Updated 2 years ago
- 新闻爬虫,爬取新浪、搜狐、新华网即时财经新闻。☆169Updated 4 years ago
- 澎湃新闻,新浪新闻,腾讯新闻,搜狐新闻,新闻联播,泰晤士报,纽约时报,BBCNews,旨在爬取所有新闻门户网站的新闻,禁止将所得数据商用!☆348Updated 2 years ago
- python办公自动化☆18Updated 3 years ago
- 最快的Python入门教程,包含Python基础、爬虫、Django、Flask等内容。☆181Updated 2 years ago
- 60行代码实现多线程PDF转Word☆806Updated 3 months ago
- 视频转帧、帧转图片、图片转文字,文字语义分析,辅助视频打标签☆34Updated 5 years ago
- 项目介绍: 智能交互金融智能聊天。具体实现用户在所有关于股票话题的智能问答。其中难点是问题 分类、数据预处理、参数提取。 ☆个人工作: 实现金融智能聊天,实现所有股票问题的精确回答。通过提取通用特征将5亿+条训练语料缩减为10w条,语料内存占用量从10G减少到2M,并将…☆61Updated 5 years ago
- python GUI 百度文库、知网直接下载保存、wifi破解器(内含8200+个密码)、古诗生成器(目前只录入了一部分)☆42Updated 5 years ago
- 提取pdf内容写入Excel☆108Updated 6 years ago
- 系统从互联网爬取资讯,对热点公共事件进行检测、聚合和追踪,多维度分析事件内容,监测时间传播路径,分析用户的观点和和情绪,形成摘要、报告、图表等分析结果,实现公共事件的舆情分析可视化系统,提供专业的舆情监测、分析和预警服务☆78Updated 6 years ago