Deep2018530 / FileParseUtilLinks
可以将word(doc、docx)、excel、pdf、ppt、csv、txt文件的文本内容提取出来,同时能够提取出word、pdf文件的目录
☆77Updated 3 years ago
Alternatives and similar repositories for FileParseUtil
Users that are interested in FileParseUtil are comparing it to the libraries listed below
Sorting:
- 文本查重SDK,可用于论文查重、标书查重、文档查重、作业查重、合同查重、防串标等场景。关联:duplicate check☆153Updated last month
- 各种文件格式相互转换,支持ppt、Excel、pdf、doc、rtf等格式转html、txt、pdf等☆123Updated 2 years ago
- 使用poi解析word文档(.docx)中的表格内容及格式,并以html形式输出☆38Updated 9 months ago
- 优客服,是一个多渠道融合的客户支持服务平台(智能客服系统),和电话销售平台(电销系统),包含WebIM,微信,电话,邮件,短信等接入渠道 http://www.youkefu.cn☆101Updated 6 years ago
- 文档转换 doc转pdf excel转pdf ppt转pdf html转pdf 以及pdf与各文档互转 pdf转图片☆38Updated 7 years ago
- opencv处理图片 ,灰度化、二值化、降噪、切割、归一、矫正☆252Updated 7 years ago
- 生成带有背景图片、用户网络头像、用户名称的二维码图片☆34Updated 8 years ago
- 视频、音频、图片内容识别、语音转写、语音合成 / easy convert video audio image to text, and revert text to audio(base64)☆24Updated last month
- 中文分词、统计词频、比对文本相似度☆40Updated 6 years ago
- 敏感词过滤、广告词过滤、包含敏感词库,停顿词库。☆181Updated 9 years ago
- Fitting是一个面向大数据的统一的开发框架,由大快搜索主导并完全开源,克服了大数据技术开发涉及技术面广,各组件间缺乏统一规范等问题,能有效降低大数据的学习难度,并提高大数据项目的开发效率并可与开源项目混用。 Fitting遵循Apache2.0开源协议,采用类黑箱框架模…☆181Updated 3 years ago
- POI将word文件转成HTML进行在线预览☆17Updated 9 months ago
- 这是 Jiguang REST API 的 Java 版本封装开发包,是由极光推送官方提供的,一般支持最新的 API 功能。☆30Updated 2 weeks ago
- 仿金山词霸每日一句的分享海报 (可添加网络图片、中英文对照句子、个人二维码)☆67Updated 6 years ago
- Java 表单注册常用正则表达式验证工具类,常用正则表达式大集合。 1. 电话号码 2. 邮编 3. QQ 4. E-mail 5. 手机号码 6. URL 7. 是否为数字 8. 是否为中文 9. 身份证 10. 域名 11. IP☆169Updated 7 years ago
- spark tutorial for big data mining。包括app流量运营分析、als推荐、smote样本采样、RFM客户价值分群、AHP层次分析客户价值得分、手机定位数据商圈挖掘、马尔可夫智能邮件预测、时序预测、关联规则、推荐电影好友等。☆40Updated 3 years ago
- 🗂️ SpringBoot实现文件上传系统☆86Updated 6 years ago
- word,excel转pdf☆11Updated 7 years ago
- java 安全工具类 (信息摘要MD5,对称加密AES,非对称加密RSA,数字签名DSA)☆21Updated last year
- 基于分词原理修改写的一个过滤敏感词库,可以改成动态,支持返回敏感词,高亮敏感词,替换敏感词等操作,本敏感词收集了5W多个违法词、敏感词、违禁词,已去重,最新追加了将近1W个最新词,几十个矫正词、变异词。☆199Updated 5 years ago
- java将文档转换成html,支持word、excel、ppt、pdf☆57Updated 7 years ago
- 使用springboot搭建的项目,用于文件的预览。支持文件类型:文本文件 、压缩文件 、office文件、pdf文件等。☆79Updated last year
- 蜂巢爬虫系统 是一套只需要定义XPath,就可实现爬取网站,APP的系统, 支持多种解析方式(XPath,正则表达式),多种下载方式(HttpClient库, PhantomJs, Selenium),多种输出方式(Excel,MongoDB)。 可不做任何修改发布到Yar…☆10Updated 9 years ago
- JAVA实现的IP代理池,支持HTTP与HTTPS两种方式☆43Updated 7 years ago
- 通过LibreOffice / WPS / Microsoft Office / 第三方库 实现多种word转pdf格式的方案☆177Updated last year
- java音频格式转换工具☆37Updated 8 years ago
- PFMS-一套由Java语言写的私人文件管理系统。☆75Updated 5 months ago
- 盲水印,隐形水印,Blind Watermark。添加的盲水印显示效果是两个在原图上中心对称的水印(解密后,实际上不可见),实际上是在时域上均匀分布的,即使图片被剪去三分之,解密出来的水印照样很清晰。☆78Updated 7 years ago
- JFinalCMS,极速开发,动态添加字段,自定义标签,动态创建数据库表并crud数据,数据库备份、还原,动态添加站点(多站点功能),一键生成模板代码,让您轻松打造自己的独立网站,同时也方便二次开发,让您快速搭建个性化独立网站,为您节约更多时间,去陪恋人、家人和朋友☆21Updated 2 years ago
- 黑龙江某医学检验中心的新冠病毒OA系统后端,主要给医学检验中心做核酸、抗体、双联(抗体+核酸)报告的生成与导出。截至到目前(2020年11月3日)已经生成了50多万个核酸、抗体和双联报告,算是鄙人小渣硕为祖国的新冠疫情事业出的一份力。 前端使用的是Vue2.x+Eleme…☆27Updated 4 years ago