xstongxue / XS-VLM-OCRLinks
XS-VLM-OCR:大模型时代的OCR工具🚀
☆72Updated last month
Alternatives and similar repositories for XS-VLM-OCR
Users that are interested in XS-VLM-OCR are comparing it to the libraries listed below
Sorting:
- PushToTalk 是一个高性能的桌面语音输入工具。它不仅仅是一个语音转文字工具,更集成了大语言模型(LLM)能力。你可以按住 Ctrl+Win 说话,松开后应用会自动将你的语音转为文字,并根据你的设定进行润色、翻译或整理成邮件,最后自动粘贴到当前光标位置。支持豆包/千问☆136Updated this week
- A specialized workbench for developers to engineer high-performance AI interactions, featuring a System Prompt Architect and a Conversati…☆64Updated 5 months ago
- Midjourney prompt generator☆176Updated last month
- 即梦海外版 | Dreamina (CapCut AI) 图像生成 API | Text-to-Image & Image-to-Image | 支持 Image 4.5/4.1/4.0 模型☆29Updated last week
- Gemini polling proxy service (gemini轮询代理服务)☆59Updated 4 months ago
- The Ultimate Course Scheduling Solution.☆37Updated 9 months ago
- 一个简洁且优秀的描述是:这是一款在任何网页上实现无缝语音转文字的 Chrome 扩展,使用先进的 ASR API。☆38Updated 3 months ago
- 腾讯元宝逆向Chat2API。☆83Updated 8 months ago
- Chrome extension that can convert web pages to PDF, supports reading mode, editing, lazy loading of pictures. -- 可以将网页转换为 PDF的Chrome扩展,支持…☆63Updated last week
- 重置你的设备码,更新和设置token☆94Updated 9 months ago
- Http图片列表程序☆55Updated 5 months ago
- 该仓库是一个基于Mistral API的文档识别工具,支持处理PDF和图片文件(如JPG、JPEG、PNG)。它提供图形用户界面和命令行界面,能够自动保存处理结果为Markdown格式,并支持配置文件管理和批量处理文件☆88Updated 10 months ago
- OnlineGPT 是一个基于 Python 和 PyQt5 的桌面应用程序,为用户提供了一个功能强大的图形用户界面,支持使用多个搜索引擎(Google、Bing、百度)进行网络搜索。它的主要目的是让语言模型能够连接到互联网,获取实时的网络信息,以提供更准确和丰富的回答。☆80Updated 11 months ago
- HE-Music is a multi-platform online music player based on SPlayer.☆81Updated this week
- MarkMuse is an innovative tool developed using Python that elegantly converts PDF files to Markdown format. By utilizing Mistral AI's OCR…☆33Updated 8 months ago
- Modern AI image generator with multi-provider support (Gitee AI, HuggingFace, ModelScope), OpenAI-compatible API, token rotation, and one…☆177Updated last week
- 一个用于创建、管理和共享 AI 提示词的平台,支持多用户协作、版本控制和分类管理。☆51Updated 2 months ago
- 使用硅基流动相关模型,将您的音频转换为文字☆54Updated 5 months ago
- 一个智能的网页内容提取API服务,基于magic-html和jina-ai/reader。支持多种内容类型(文章/论坛/微信/知乎),多种输出格式(文本/Markdown/HTML)。只保留主要文章内容,使AI能够更好地理解和分析文本。☆68Updated last year
- 部署于 CloudFlare Pages 的 AI 语音服务,使用 siliconflow 的语音转录模型 SenseVoiceSmall 和 openai 的 gpt-4o-mini-tts☆46Updated 4 months ago
- ☆126Updated this week
- 一个简约无广,专注新闻的聚合体,完美适配Web端,手机端,《今日时事》为您实时聚合各大平台最新资讯,按时间序列 展示热点新闻 动态,包含头条、百度、知乎、哔哩哔哩、豆瓣、微博、贴吧、汽车之家、虎扑、Github、抖音、懂车帝等各种消息,给您提供极致的专注阅读的信息流体验!☆262Updated 3 months ago
- AI 有声书自动化生成工具☆240Updated 3 months ago
- 图片识别、自动化问答 AI助手☆48Updated 8 months ago
- 🚀 UniHub - 现代化的跨平台工具集应用,支持强大的插件系统 | Modern cross-platform toolkit with powerful plugin system☆130Updated this week
- PDF 预览小文件☆66Updated last month
- a novel program by you☆56Updated 7 months ago
- This server acts as a central hub for Model Context Protocol (MCP) resource servers.☆182Updated 6 months ago
- 将音频转换为文字,并进行校准、生成摘要。支持API调用。☆37Updated 7 months ago
- 让你的AI摆脱浏览器的束缚☆46Updated last year