xy2yp / Speech-To-TextLinks
将音频转换为文字,并进行校准、生成摘要。支持API调用。
☆35Updated 5 months ago
Alternatives and similar repositories for Speech-To-Text
Users that are interested in Speech-To-Text are comparing it to the libraries listed below
Sorting:
- 使用硅基流动相关模型,将您的音频转换为文字☆52Updated 2 months ago
- 部署于 CloudFlare Pages 的 AI 语音服务,使用 siliconflow 的语音转录模型 SenseVoiceSmall 和 openai 的 gpt-4o-mini-tts☆43Updated last month
- 基于Cloudflare Worker的AI图片生成脚本☆116Updated 6 months ago
- Gemini polling proxy service (gemini轮询代理服务)☆60Updated last month
- ☆53Updated 3 months ago
- 为所有AI增加思考链能力☆172Updated 3 months ago
- 将你的项目一键部署到huggingface spaces☆73Updated 4 months ago
- ☆51Updated 6 months ago
- 一个简约无广,专注新闻的聚合体,完美适配Web端,手机端,《今日时事》为您实时聚合各大平台最新资讯,按时间序列 展示热点新闻动态,包含头条、百度、知乎、哔哩哔哩、豆瓣、微博、贴吧、汽车之家、虎扑、Github、抖音、懂车帝等各种消息,给您提供极致的专注阅读的信息流体验!☆244Updated 2 weeks ago
- This server acts as a central hub for Model Context Protocol (MCP) resource servers.☆173Updated 3 months ago
- ☆94Updated 6 months ago
- ☆110Updated 4 months ago
- 一个用于管理 Gemini API 令牌的负载均衡服务,支持 Docker 部署和数据持久化☆128Updated 6 months ago
- All Model Chat 是一款功能强大、支持多模态输入的聊天机器人界面,旨在提供与 Google Gemini API 家族无缝交互的极致体验。它集成了动态模型选择、多模态文件输入、流式响应、全面的聊天历史管理以及广泛的自定义选项,为您带来无与伦比的 AI 互动体验。☆339Updated last month
- 一个简洁且优秀的描述是:这是一款在任何网页上实现无缝语音转文字的 Chrome 扩展,使用先进的 ASR API。☆35Updated last month
- ☆14Updated 2 months ago
- OneLine一线:AI驱动的热点事件分析工具☆239Updated last month
- MarkMuse is an innovative tool developed using Python that elegantly converts PDF files to Markdown format. By utilizing Mistral AI's OCR…☆32Updated 6 months ago
- 一款基于 PySide6 和 ElevenLabs API 的桌面应用,能将音视频或JSON转录稿智能地转换为高质量SRT字幕。特别为中、日、韩、英等语言优化了排版规则。☆105Updated 4 months ago
- OnlineGPT 是一个基于 Python 和 PyQt5 的桌面应用程序,为用户提供了一个功能强大的图形用户界面,支持使用多个搜索引擎(Google、Bing、百度)进行网络搜索。它的主要目的是让语言模型能够连接到互联网,获取实时的网络信息,以提供更准确和丰富的回答。☆80Updated 9 months ago
- A high-performance tool to validate Google Gemini API keys with batch processing capabilities.☆145Updated 2 months ago
- 让你的AI摆脱浏览器的束缚☆45Updated 10 months ago
- 个人书签导航☆61Updated last month
- 接口已恢复 | 基于 https://chat.qwenlm.ai/ 的OCR。测试Token:可见readme 。已支持Docker一键部署,切换分支可见☆258Updated 5 months ago
- Chat with web content by AI. web demo url: https://cerebr.yym68686.top☆272Updated 3 weeks ago
- ☆47Updated last month
- ☆58Updated 2 months ago
- 一个功能强大的API Key管理平台,不仅通过智能负载均衡算法自动选择可用API密钥,而且提供密钥有效性检测、管理、权限分享等功能实现。系统设计基于Cloudflare Worker脚本,部署简单,同时提供强大的可视化管理工具与全面的数据分析功能。☆319Updated 7 months ago
- 该仓库是一个基于Mistral API的文档识别工具,支持处理PDF和图片文件(如JPG、JPEG、PNG)。它提供图形用户界面和命令行界面,能够自动保存处理结果为Markdown格式,并支持配置文件管理和批量处理文件☆88Updated 7 months ago
- ☆275Updated this week