url2io / url2io-python-clientLinks
ULR2io Python Client 用于网页信息提取、文本处理等,如正文提取、中文分词等。
☆8Updated last year
Alternatives and similar repositories for url2io-python-client
Users that are interested in url2io-python-client are comparing it to the libraries listed below
Sorting:
- 一个简单易用的 Python 模块,用于通过字符串来操作日期/时间。正则时间提取,字符串时间解析,字符串时间提取。中文时间提取,一句话里面提取时间☆75Updated 11 months ago
- 图片向量检索服务,包含Numpy、Faiss、ES、Milvus多种计算引擎☆136Updated 2 years ago
- 基于sentence transformers和chatglm实现的文档搜索工具☆156Updated 2 years ago
- 利用LLM+敏感词库,来自动判别是否涉及敏感词。☆124Updated last year
- Humanable Chat Generative-model Fine-tuning | LLM微调☆207Updated last year
- chatglm-6b微调/LORA/PPO/推理, 样本为自动生成的整数/小数加减乘除运算, 可gpu/cpu☆164Updated last year
- 中文文本的向量表示方法(Sentence-BERT, CoSENT)的PyTorch简单实现,可以用于文本相似度计算。☆9Updated 3 years ago
- 千问14B和7B的逐行解释☆60Updated last year
- 中文文本改写☆20Updated 4 years ago
- CamelBell(驼铃) is be a Chinese Language Tuning project based on LoRA. CamelBell is belongs to Project Luotuo(骆驼), an open sourced Chinese-…☆174Updated last year
- ⛔ [DEPRECATED] URL2io Python SDK,用于网页信息提取,如正文提取☆41Updated 4 years ago
- Python3 package for Chinese/English OCR, with paddleocr-v4 onnx model(~14MB). 基于ppocr-v4-onnx模型推理,可实现 CPU 上毫秒级的 OCR 精准预测,通用场景中英文OCR达到开源SO…☆87Updated 5 months ago
- ChatGLM-6B fine-tuning.☆135Updated 2 years ago
- pinyintokenizer, 拼音分词器,将连续的拼音切分为单字拼音列表。☆30Updated 4 months ago
- 这个项目是用来从文本中提取时间段信息,采用树状的结构☆9Updated 6 years ago
- 元搜索引擎 searchengine 元数据 元搜索☆15Updated 4 years ago
- 中文AI写作(写诗或写对联)☆120Updated last year
- 时间关键词正则提取以及标准化☆21Updated 3 years ago
- 经过强化的goose3通用网页提取器(添加作者VX: 862187570 , Python交流学习)☆16Updated 3 years ago
- 首个llama2 13b 中文版模型 (Base + 中文对话SFT,实现流畅多轮人机自然语言交互)☆90Updated last year
- 针对口语进行时间抽取并标准化☆13Updated 5 years ago
- 基于chatglm快速搭建文档问答机器人☆88Updated 2 years ago
- share data, prompt data , pretraining data☆36Updated last year
- 基于文字密度的新闻正文提取模块,兼容python2和python3,传入新闻网址或者网页源码即可返回标题,发布时间和正文内容。☆14Updated 7 years ago
- 该项目主要是抽取病历文件中的一些关键信息。并将抽取的内容进行streamlit前端的展示。目前支持的文件类型:图片,pdf文件,word文件☆23Updated 2 years ago
- 全球首个StableVicuna中文优化版。☆64Updated last year
- 中文聊天小模型,用t5 base在大量数据上有监督。☆100Updated last year
- 演示 vllm 对中文大语言模型的神奇效果☆31Updated last year
- Self complemented Pinyin2Chinese demo use algorithms including Trie and HMM model , 基于隐马尔科夫模型与Trie树的拼音切分与拼音转中文的简单demo实现。☆86Updated 7 years ago
- 从langchain-ChatGLM基础上修改的一个可以加载TigerBot模型的基于本地知识库的问答应用,目标期望建立一套对中文场景与开源模型支持友好、可离线运行的知识库问答解决方案。☆107Updated last year