Gaoshiguo / python-spider-wikiLinks
这个项目使用python来实现爬取维基百科的关键词条以及其超链接,并写入MySQL数据库中
☆11Updated 5 years ago
Alternatives and similar repositories for python-spider-wiki
Users that are interested in python-spider-wiki are comparing it to the libraries listed below
Sorting:
- java文档转换工具。目前已实现: pdf转md(pdf转markdown:能够将pdf格式的文件转换成markdown格式的文件,支持同步同时转换图片和文本。);☆10Updated 5 years ago
- Python爬虫项目集合☆61Updated 7 years ago
- 大模型LLM,RAG实战☆139Updated 6 months ago
- 此项目已经重构,不再维护,请关注重构项目django-vue3-online-exam☆154Updated 3 years ago
- 大模型模拟面试&面试提词器☆45Updated last year
- 可以将word(doc、docx)、excel、pdf、ppt、csv、txt文件的文本内容提取出来,同时能够提取出word、pdf文件的目录☆77Updated 3 years ago
- 该资源是作者《Python从零到壹》系列文章的对应代码,该系列包括200篇原创博客,涉及基础语法、网络爬取、大数据分析、机器学习、图像处理、人工智能、文本挖掘、图像识别等领域。希望打造一个高质量的Python Family系列,帮助更多初学者,感谢您的点赞~☆211Updated 2 years ago
- 💼法律AI助手,法律RAG,通过全部200+本法律手册📖、网页搜索内容💻结合LLM回答你的问题,并且给出相应的法规和网站,基于⚡️ langchain,Gradio,openai,chroma,duckduckgo-search☆203Updated 2 years ago
- 🍥 CSDN 爬虫,批量爬取指定用户全部博文并输出为 markdown 格式☆61Updated 7 months ago
- 程序员需要懂得的中医养生☆145Updated 7 years ago
- 数据科学教程、大模型实践案例☆147Updated 7 months ago
- 官方权威数据:统计年签,统计公报,互联网行业报告,工信部数据,ICT报告等 Official authoritative data (Chinese)☆194Updated 6 months ago
- 国家统计用区划代码和城乡划分代码---爬虫及数据☆172Updated 2 years ago
- 基于Fasttext的中文医疗问答系统☆42Updated last year
- 基于文心一言和树莓派Pico的最简易桌面宠物☆86Updated 4 months ago
- 基于Flask框架 爬取百度文库的python web 项目☆25Updated 4 years ago
- PDF解析(文字,章节,表格,图片,参考),基于大模型(ChatGLM2-6B, RWKV)+langchain+streamlit的PDF问答,摘要,信息抽取☆213Updated 2 years ago
- 爬虫牛客网帖子,获取工作内推等感兴趣信息☆12Updated 3 years ago
- RAG+ChatGPT+LangChain搭建本地知识库文档问答系统☆83Updated 2 years ago
- ☆60Updated 9 months ago
- ☆32Updated 2 years ago
- 提取pdf内容写入Excel☆122Updated 7 years ago
- Legal-Eagle-InternLM 是一个基于商汤科技和上海人工智能实验室推出的书生浦语大模型InternLM的法律问答机器人。旨在为用户提供符合3H(即Helpful、Honest、Harmless)原则的专业、智能、全面的法律服务的法律领域大模型。☆65Updated last year
- 基于大语言模型的专属知识库☆44Updated 2 years ago
- Tutorials on how to write ChatGPT prompts☆98Updated 2 years ago
- 一个面向小白的大模型应用开发课程☆62Updated 2 years ago
- 基于 LLM Lora 微调的金融问答系统,主要结合了 PDF 解析、LLM 微调、vllm 推理优化框架等技术☆49Updated 10 months ago
- 从零搭建大模型知识库(Build LLM RAG Corpus from scratch)☆82Updated last year
- 基于ChatGLM3基座模型和LLAMA-Factory框架进行微调的一个中医问答机器人☆107Updated 2 years ago
- RAG-QA-Generator 是一个用于检索增强生成(RAG)系统的自动化知识库构建与管理工具。该工具通过读取文档数据,利用大规模语言模型生成高质量的问答对(QA对),并将这些数据插入数据库中,实现RAG系统知识库的自动化构建和管理。☆262Updated last year