BetaStreetOmnis / WebExtractoLinks
通用爬虫工具,内嵌了google、bing和duckduckgo的搜索引擎,并可以用过requests、selenium或者palywright来爬取页面信息,并能遍历官网所有有效网页,实现整个网站的内容解析,可以用户自动化获取网站信息,提升信息收集效率。
☆14Updated 7 months ago
Alternatives and similar repositories for WebExtracto
Users that are interested in WebExtracto are comparing it to the libraries listed below
Sorting:
- 教程《追女神必备!使用 Python 构建小红书用户动态监控系统》配套教学代码☆55Updated 5 months ago
- AI自动采集多平台发布----万能新闻助手-根据关键字 自助抓取新闻资讯-AI总结-一键发布多平台(微信公众号、掘金、知识星球、知乎)。☆23Updated 2 months ago
- 公开信息收集 人肉搜索测试☆17Updated 7 months ago
- AIAST智能客服系统,AI知识库系统,问答知识库,企业GPT知识库私有化,企业话术管理,API接口调用🔮🤖🚀☆37Updated this week
- 使用langchain/Ollama开发智能体agent聊天机器人框架,基于VChat框架支持微信的群聊和个人用户聊天,实现飞书机器人的接入,也可接入使用react进行前端UI(支持二次开发)开发框架的AI支持。☆65Updated 5 months ago
- 🌟🌟🌟 AI数据可视化分析平台, 仅需提供 Excel 表格、输入想要分析的结论,自动调用 AIGC 提供智能图表生成,扇形图、折线图、多种图表格式任你挑选,分析结论智能生成,小白也可以分析数据啦!☆27Updated last year
- 文本、文件快速搜索 —— 这是一个windows系统下目前、文件、文本内容查找的工具,满足文件名、文本关键的模糊搜索、任意匹配搜索、同时匹配搜索等功能☆18Updated 2 years ago
- 一款利用爬虫技术实现前端JS加密自动化绕过的爆破登陆渗透测试工具☆330Updated 2 months ago
- 免费开源的微信公众号SVG编辑器☆11Updated 2 weeks ago
- 微信公众号聚合平台,获取多个公众号的博文进行筛选、过滤,使用户更方便的读取公众号上的所有文章,每日爬取文章并在个人博客上更新 https://zejuncao.github.io/☆56Updated 3 weeks ago
- AI 结构化生成论文。☆25Updated 10 months ago
- Douyin AI Wenan 是一个基于Vue 3和coze的智能文案处理工作流。 它能够自动修正从抖音视频中提取的文本,处理同音字错误,并优化标点符号使用。 获取到修正文本之后,可以推送到Memos在线备忘录,方便后续继续学习。☆27Updated 6 months ago
- AIGC系统,系统pc+小程序+app,chatai商业源码/文心一言/星火/知识库/aippt/ai问答/ai绘画/mj+sd☆28Updated last year
- 工信部(https://beian.miit.gov.cn )ICP备案爬虫,支持APP、网站、小程序☆16Updated last year
- Mooder是一款开源、安全、简洁、强大的团队内部知识分享平台。☆13Updated 3 months ago
- 矩阵运营解决方案 |软件|内容生产 智能体平台研发 |AI智能体|效率工具 获客成交 小红书数据采集,小红书逆向,小红书 x-s逆向,小红书爬虫,小红书账号、推广、各种 app 逆向爬虫数据接口。抖音,小红书, 快手 ,京东, 美团 ,饿了么 ,大众点评, douyin…☆15Updated last month
- ☆37Updated 4 months ago
- 基于大语言模型的RAG问答知识库,大模型检索增强生成工具,可部署在个人电脑上,实现本地知识库智能问答☆15Updated 3 months ago
- Dk是一款运行在安卓手机上的抖音/小红书平台自动化人工智能营销黑科技软件,主要通过在抖音/小红书平台自动点赞、评论、私信增加曝光量从而实现精准引流获客增加粉丝的功能。☆15Updated 4 months ago
- 爬虫管理平台,轻量级Python任务调度,可视化操作,完整监控,灵活的Python环境管理,,环境隔离,资源占用小,支持 Scrapy 等主流爬虫框架,支持 Selenium、Playwright、DrissionPage 等浏览器自动化工具,支持node环境下的js逆向代…☆114Updated last month
- WechatBot with ASR & LLM 集成Gemini大语言模型API接口和微软ASR服务,华尔街见闻、币安、东方财富等金融数据,可识别语音的微信机器人☆43Updated 4 months ago
- PyWxDump 的网页端☆57Updated 4 months ago
- 批量自动化生成儿童绘本故事书☆43Updated 6 months ago
- The use of multimodal large model technology enables automatic generation of web scraping code. 使用多模态大模型技术实现了爬虫代码自动生成☆20Updated 5 months ago
- 新一代的关键词URL采集系统,采用GO语言开发。可突破搜索引擎的反爬虫机制!根据用户录入的关键词,批量自动化使用主流多个搜索引擎进行采集与统一处理。支持精准采集与大规模深度采集(自动采集相关词),日采集可轻松千万条不重复域名。☆11Updated 3 years ago
- 基于Node.js、Vue3、uniapp的ChatGPT+智能体+Midjourney绘画+PPT生成+Suno音乐+Pika/Runway/Sora视频 网页服务 | 个人、团队、企业私有化AIGC平台☆253Updated 2 months ago
- 分布式通用爬虫平台(可视化生成css选择器,自定义设置抓取流程,正文自动提取,邮件通知)☆18Updated 3 years ago
- 黑马程序员Java最新AI+若依框架项目开发新方案视频教程,基于RuoYi-Vue3前后端分离版本,从前端到后端再到AI智能化应用全通关☆34Updated 10 months ago
- 🤖 扣子智能体对接微信 - WeChat Integration with Coze AI 🤖☆22Updated 6 months ago
- 万媒易发,是一款由AI驱动的多平台多账号管理神器,旨在帮助内容创作者解放双手,提高生产力。可以让您轻松实现自媒体内容同步、营销、分发。支持跨平台多账号管理,一键同步发布文章,解放双手,释放生产力,是内容运营必备的一文多发工具。适用于新媒体运营、SEO优化和矩阵营销等场景。用…☆32Updated last year