CodingMonkey12 / Semantic-Search-using-PaddleLinks
基于Paddle进行语义检索并部署上线,支持多语言 This code is based on Paddle to do a semantic search, and deploy it. Multilingual support
☆13Updated 3 years ago
Alternatives and similar repositories for Semantic-Search-using-Paddle
Users that are interested in Semantic-Search-using-Paddle are comparing it to the libraries listed below
Sorting:
- 通用版面分析 | 中文文档解析 |Document Layout Analysis | layout paser☆48Updated last year
- bge推理优化相关脚本☆29Updated last year
- 一站式自动化开源标注平台☆78Updated 3 years ago
- 基于sentence-transformers实现文本转向量的机器人☆46Updated 3 years ago
- 时间抽取、解析、标准化工具☆56Updated 3 years ago
- Let ChatGPT (Large Language Models) Serve As Data Annotator and Zero-shot/few-shot Information Extractor.☆31Updated 2 years ago
- ☆28Updated last year
- Graph QABot Demo| 图谱问答案例☆15Updated 2 years ago
- 这里将paddle中的ocr等模型转为onnx格式,并利用java版深度框架djl加载这些onnx模型进行推理预测尝试。☆13Updated 3 years ago
- This repository provides an implementation of "A Simple yet Effective Training-free Prompt-free Approach to Chinese Spelling Correction B…☆85Updated 6 months ago
- A large high-quality corpus of Chinese synonyms 一个大型、高质量的中文同义词语料库。☆69Updated 4 years ago
- 🌈 NERpy: Implementation of Named Entity Recognition using Python. 命名实体识别工具,支持BertSoftmax、BertSpan等模型,开箱即用。☆116Updated last year
- 文档方向分类☆224Updated last year
- Based on RapidOCR, extract the PDF content☆184Updated 8 months ago
- ☆23Updated 4 years ago
- Python3 package for Chinese/English OCR,use paddleocr-v5 onnx model(~20MB), with ultra-fast inference speed. 基于ppocr-v5-onnx模型推理,中英文OCR开源…☆122Updated 5 months ago
- 该项目是为了使用layoutlmv3针对中文图片训练和推理。 其中主要解决三个问题: 1.数据标准化成可以的训练数据集格式 2.layoutlmv3-base-chinese 分词修改 2.超过512长度的文本切分和滑窗操作☆62Updated last year
- 打造人人都会的NLP,开源不易,记得star哦☆102Updated 2 years ago
- 供AI训练的中文数据集 (持续更新。。。)与AI公司图谱,目前的数据集餐饮行业8000问,百度知道,Alpaca中文数据集,计算机领域数据集,Vicuna数据集,RedPajama数据集,Wikipedia中文词条数据集,网站论坛问答数据集☆62Updated 2 years ago
- 在kaggle部署ChatGLM API,和ChatGPT api使用相同的调用方式☆15Updated 2 years ago
- 视觉信息抽取任务中,使用OCR识别结果规范多模态大模型的回答☆43Updated last year
- 该项目主要是抽取病历文件中的一些关键信息。并将抽取的内容进行streamlit前端的展示。目前 支持的文件类型:图片,pdf文件,word文件☆24Updated 3 years ago
- 闲聊机器人☆11Updated 5 years ago
- aigc evals☆10Updated 2 years ago
- 阅读顺序、Layoutreader☆19Updated 8 months ago
- share data, prompt data , pretraining data☆36Updated 2 years ago
- 中文新词发现算法PNW算法,可以识别任意长度的新词。☆16Updated 2 years ago
- 长文本相似度模型☆21Updated 2 years ago
- 音乐类语料的意图识别填槽以及槽值纠错模型☆17Updated 2 years ago
- 记录有用的Git repos☆12Updated last year