Liyulingyue / DesktopPetLinks
一个桌面宠物程序,现在似乎发展成为桌面便签了。桌面便签程序见develop-todolist分支。
☆11Updated last year
Alternatives and similar repositories for DesktopPet
Users that are interested in DesktopPet are comparing it to the libraries listed below
Sorting:
- 基于通义千问 Qwen2.5-Omni 的实时语音对话系统,使用在线API服务,支持实时语音交互、动态语音活动检测和流式音频处理。A real-time voice conversation system based on Qwen2.5-Omni Online-API, …☆83Updated 9 months ago
- ☆108Updated 11 months ago
- 该项目是为了使用layoutlmv3针对中文图片训练和推理。 其中主要解决三个问题: 1.数据标准化成可以的训练数据集格式 2.layoutlmv3-base-chinese 分词修改 2.超过512长度的文本切分和滑窗操作☆63Updated last year
- 视觉信息抽取任务中,使用OCR识别结果规范多模态大模型的回答☆44Updated last year
- 卡证和文档检测和矫正☆79Updated last year
- In this fast-paced world, we all need a little something to spice up life. Whether you need a glass of sweet talk to lift your spirits or…☆59Updated 8 months ago
- A Simple MLLM Surpassed QwenVL-Max with OpenSource Data Only in 14B LLM.☆38Updated last year
- ☆74Updated last year
- 一个基于多模态向量模型及视觉多模态模型构建的图片搜索引擎&管理系统,实现精准的以文搜文,文搜图、以图搜图多种智能检索方式。An image search engine management system built upon multimodal vector models…☆77Updated 4 months ago
- PDF Parsing Tool: GOT's vLLM acceleration implementation, MinerU for layout recognition, and GOT for table formula parsing.☆65Updated last year
- 基于TrOCR + UniMER-1M数据集,训练一个小而美的公式识别模型☆29Updated 7 months ago
- 基于《西游记》原文、白话文、ChatGPT生成数据制作的,以InternLM2微调的角色扮演多LLM聊天室。 本项目将介绍关于角色扮演类 LLM 的一切,从数据获取、数据处理,到使用 XTuner 微调并部署至 OpenXLab,再到使用 LMDeploy 部署,以 op…☆106Updated last year
- A Multi-modal RAG Project with Dataset from Honor of Kings, one of the most popular smart phone games in China☆73Updated last year
- 一些大语言模型和多模态模型的生态,主要包括跨模态搜索、投机解码、QAT量化、多模态量化、ChatBot、OCR☆197Updated last week
- Paddle Multimodal Integration and eXploration, supporting mainstream multi-modal tasks, including end-to-end large-scale multi-modal pret…☆714Updated last week
- 一个开源的GPU服务器管理平台;可以实时查看模型训练状态、GPU资源占用、模型训练日志、IP访问记录等☆39Updated last year
- 通过此代码可以免训练模型并通过轻量级服务器定制数字人 形象☆106Updated last year
- 🍰🍎ColugoMum: Intelligent Retail Settlement Platform can accurately locate and identify each commodity, and can return a complete shoppi…☆287Updated 3 years ago
- 轻量模型的图像分析web服务,包括倾斜矫正OCR,公章(印章)检测+识别,车牌识别。api方案使用FastAPI+Gunicorn,提供gradio展示。☆102Updated last year
- ✅Deploy PaddleOCR with flask | 利用Flask对PaddleOCR进行部署,方便调用☆43Updated 3 years ago
- 本项目使用了EcapaTdnn、ResNetSE、ERes2Net、CAM++等多种先进的声纹识别模型,同时本项目也支持了MelSpectrogram、Spectrogram、MFCC、Fbank等多种数据预处理方法☆304Updated last month
- 供AI训练的中文数据集(持续更新。。。)与AI公司图谱,目前的数据集餐饮行业8000问,百度知道,Alpaca中文数据集,计算机领域数据集,Vicuna数据集,RedPajama数据集,Wikipedia中文词条数据集,网站论坛问答数据集☆64Updated 2 years ago
- ☆20Updated last year
- 将SmolVLM2的视觉头与Qwen3-0.6B模型进行了拼接微调☆526Updated 5 months ago
- chatglm-6B for tools application using langchain☆76Updated 2 years ago
- ☆341Updated 4 months ago
- A mini assistant to help you read paper quickly☆55Updated 9 months ago
- ☆242Updated 11 months ago
- ERNIE Bot Agent is a Large Language Model (LLM) Agent Framework, powered by the advanced capabilities of ERNIE Bot and the platform resou…☆378Updated last year
- 主要写er-nerf从零到一所有部署过程☆43Updated last year