Deep2018530 / FileParseUtilLinks
可以将word(doc、docx)、excel、pdf、ppt、csv、txt文件的文本内容提取出来,同时能够提取出word、pdf文件的目录
☆76Updated 3 years ago
Alternatives and similar repositories for FileParseUtil
Users that are interested in FileParseUtil are comparing it to the libraries listed below
Sorting:
- 文本查重SDK,可用于论文查重、标书查重、文档查重、作业查重、合同查重、防串标等场景。关联:duplicate check☆149Updated 6 months ago
- 各种文件格式相互转换,支持ppt、Excel、pdf、doc、rtf等格式转html、txt、pdf等☆122Updated 2 years ago
- opencv处理图片,灰度化、二值化、降噪、切割、归一、矫正☆250Updated 6 years ago
- 优客服,是一个多渠道融合的客户支持服务平台(智能客服系统),和电话销售平台(电销系统),包含WebIM,微信,电话,邮件,短信等接入渠道 http://www.youkefu.cn☆98Updated 6 years ago
- 采用Spring、Spring Boot、Redis、MyBatis、Shiro、Druid框架开发,搭载mysql数据。 如果你厌烦了MyBatis中需要手动创建表的事情,这个项目非常适合你,自动为你生成表。 从此你不在需要导入sql文件了,项目初始化变得异常简单,结…☆44Updated this week
- 中文分词、统计词频、比对文本相似度☆40Updated 6 years ago
- 仿金山词霸每日一句的分享海报(可添加网络图片、中英文对照句子、个人二维码)☆67Updated 6 years ago
- 视频、音频、图片内容识别、语音转写、语音合成 / easy convert video audio image to text, and revert text to audio(base64)☆22Updated last year
- java将文档转换成html,支持word、excel、ppt、pdf☆55Updated 7 years ago
- 本地作业查重系统。对本地某一目录下所有word文档和txt文档进行两两之间的相似度计算。图片相似度采用PHash算法,文字相似度采用jaccard相似度和余弦相似度结合进行计算。程序已经生成了32位和64位exe文件,直接解压后选择作业查重x32和作业查重x64文件夹即可运…☆81Updated 5 months ago
- 基于分词原理修改写的一个过滤敏感词库,可以改成动态,支持返回敏感词,高亮敏感词,替换敏感词等操作,本敏感词收集了5W多个违法词、敏感词、违禁词,已去重,最新追加了将近1W个最新词,几十个矫正词、变异词。☆196Updated 5 years ago
- 使用springboot搭建的项目,用于文件的预览。支持文件类型:文本文件 、压缩文件 、office文件、pdf文件等。☆79Updated last year
- Fitting是一个面向大数据的统一的开发框架,由大快搜索主导并完全开源,克服了大数据技术开发涉及技术面广,各组件间缺乏统一规范等问题,能有效降低大数据的学习难度,并提高大数据项目的开发效率并可与开源项目混用。 Fitting遵循Apache2.0开源协议,采用类黑箱框架模…☆180Updated 2 years ago
- 三行代码导出自定义样式word☆82Updated 3 months ago
- Java 表单注册常用正则表达式验证工具类,常用正则表达式大集合。 1. 电话号码 2. 邮编 3. QQ 4. E-mail 5. 手机号码 6. URL 7. 是否为数字 8. 是否为中文 9. 身份证 10. 域名 11. IP☆168Updated 7 years ago
- 博客猎手,基于webMagic的博客爬取工具,支持慕课、csdn、iteye、cnblogs、掘金和V2EX等各大主流博客平台。博客千万篇,版权第一条。狩猎不规范,亲人两行泪。☆70Updated 3 years ago
- java 安全工具类 (信息摘要MD5,对称加密AES,非对称加密RSA,数字签名DSA)☆21Updated last year
- 生成带有背景图片、用户网络头像、用户名称的二维码图片☆34Updated 8 years ago
- 盲水印,隐形水印,Blind Watermark。添加的盲水印显示效果是两个在原图上中心对称的水印(解密后,实际上不可见),实际上是在时域上均匀分布的,即使图片被剪去三分之,解密出来的水印照样很清晰。☆77Updated 6 years ago
- Licence GitHub Release 简介 Spring Boot API Project Seed 是一个基于Spring Boot & MyBatis的种子项目,用于快速构建中小型API、RESTful API项目,该种子项目已经有过多个真实项目的实践,稳定…☆71Updated 3 years ago
- 基于百度AI 的图片搜索、以图搜图、相似图查找☆39Updated 2 years ago
- changeMax医疗健康助手(以下简称为:医疗助手)是一个在android平台上开发的一款应用,主要通过对话式人工智能和文字式两种交互方式共同配合实现低门槛性人机交互。在医疗助手后台数据库中,存在2000条疾病和2000条症状信息,在每一条数据信息中都包含了疾病简介,疾病…☆35Updated 6 years ago
- PFMS-一套由Java语言写的私人文件管理系统。☆75Updated 2 months ago
- 敏感词过滤、广告词过滤、包含敏感词库,停顿词库。☆180Updated 9 years ago
- 使用java和jpcap库实现一个网络抓包程序,实现监听本地网络接口、数据包捕获和分析等功能☆35Updated 5 years ago
- 使用poi解析word文档(.docx)中的表格内容及格式,并以html形式输出☆36Updated 6 months ago
- 音频转码工具,主要用于将微信语音 amr 格式转换为 mp3 格式以便在 html5 的 audio 标签中进行播放☆221Updated 5 years ago
- RuoYi-RAG 是一个基于 Spring AI框架开发的 AI 知识库检索增强生成(RAG)系统的服务端。该系统为 AI知识库管理系统 和 AI知识库用户端 提供接口服务,支持多种 AI 模型进行知识检索和问答。☆83Updated last month
- google 语音转文字☆271Updated 6 years ago
- Spider网络爬虫Demo,主要功能有:抓取小说并保存到本地TXT文件;小说线上采集阅读;ip代理池维护,并制作简易流量爬虫;乐心健康步数测试;☆20Updated 3 months ago