CodingMonkey12 / Semantic-Search-using-Paddle
基于Paddle进行语义检索并部署上线,支持多语言 This code is based on Paddle to do a semantic search, and deploy it. Multilingual support
☆11Updated 2 years ago
Related projects ⓘ
Alternatives and complementary repositories for Semantic-Search-using-Paddle
- FinCUGE Instruction dataset☆10Updated last year
- Having fun with ML☆11Updated 7 months ago
- aigc evals☆10Updated 11 months ago
- 该项目主要是抽取病历文件中的一些关键信息。并将抽取的内容进行streamlit前端的展示。目前支持的文件类型:图片,pdf文件,word文件☆22Updated 2 years ago
- Large-scale exact string matching tool☆15Updated last week
- 中文关键词提取☆12Updated last year
- Graph QABot Demo| 图谱问答案例☆15Updated last year
- nlp分析工具是一款基于NLP开源算法和模型库(jieba、spacy、paddlenlp)对文本数据进行向量化,然后通过机器学习算法(聚类、主成分分析、图网络GraphicalLasso)对文本数据词向量之间进行关联性分析的小工具。☆14Updated last year
- 通用版面分析 | 中文文档解析 |Document Layout Analysis | layout paser☆45Updated 5 months ago
- 记录有用的Git repos☆10Updated 3 months ago
- 有一个通用实体关系事件抽取的任务,需要使用到UIE模框架,而且需要将起部署到昇腾310服务器上,因为UIE模型底层使用的是ernie3.0,但是目前paddle官方还不支持ernie3.0模型在昇腾310上部署,所以才有了以下的操作,主要过程是,先试用paddle训练处模型…☆17Updated 2 years ago
- 中文新词发现算法PNW算法,可以识别任意长度的新词。☆15Updated last year
- Sentence-Transformers Information Retrieval example on Chinese☆29Updated 9 months ago
- 在kaggle部署ChatGLM API,和ChatGPT api使用相同的调用方式☆14Updated last year
- 基于pytorch的不平衡数据的文本分类☆9Updated 2 years ago
- 本项目由三个模块构成。意图识别:判断用户的意图是业务型还是闲聊型;模型检索:该部分构建一个语料库,当用户 发起新的query(通过意图识别判断为业务型对话)时,为用户匹配query检索的最佳response,使用HSWN进行召回(粗排), 然后构建句子的相似度,并利用Lig…☆10Updated 3 years ago
- ☆22Updated last month
- Tracking the hot Github repos and update daily 每天自动追踪Github热门项目☆42Updated this week
- 时间抽取、解析、标准化工具☆49Updated 2 years ago
- Chinese Grammatical Error Diagnosis☆11Updated 3 years ago
- benchmark of KgCLUE, with different models and methods☆26Updated 2 years ago
- TensorRT☆11Updated 4 years ago
- 采用一个模型同时实现问题生成和答案生成☆26Updated last year
- Unsupervised tableQA and databaseQA on chinese finance question and tabular data☆12Updated last year
- source code of EMNLP2021: A Lightweight Pretrained Model for Chinese Spelling Check☆13Updated 3 years ago
- GoGPT中文指令数据集构造☆10Updated 9 months ago
- 一个用于训练句子embedding的工具,支持Cosent以及Simcse☆17Updated this week
- 基于simcse的中文句向量生成☆15Updated 2 years ago
- ☆10Updated 2 years ago
- FinanceEventGraph,金融领域事件图谱开放数据集,可用于事件图谱搭建于实验,包括3865个acquire并购事件、9093个invest投资事件,总计12960的事件☆19Updated 10 months ago