chadqiu / newcoder-crawlerLinks
爬虫牛客网帖子,获取工作内推等感兴趣信息
☆12Updated 2 years ago
Alternatives and similar repositories for newcoder-crawler
Users that are interested in newcoder-crawler are comparing it to the libraries listed below
Sorting:
- 智慧教室监考系统,作弊检测和考生点名功能(智慧教室的最后一个项目,尝试使用c++部署算法,使用TensorRT进行加速)☆59Updated last year
- FunAi - web - 前端☆25Updated last year
- 知网爬虫,专利、论文项目。仅供学习交流,严禁盈利☆50Updated 3 years ago
- ResumeSDK简历解析 - 中英文简历解析☆37Updated last year
- XiuSearch是一款搜索技术博客的搜索引擎,当然,如果你将种子网址换成新闻网站,这就是一个新闻搜索引擎,它对于文章搜索来说是通用的。☆59Updated 3 years ago
- 专为AIPC设计,致力于打破传统教育的局限,通过一个集成化的本地大模型应用平台,提供AI助教、互动问答、智能出题、教学大纲与思维导图生成 以及代码助手功能等个性化学习与教学体验,为学生与教师创造前所未有的教学与学习体验。☆61Updated last year
- 大模型LLM,RAG实战☆134Updated 3 months ago
- 从零搭建大模型知识库(Build LLM RAG Corpus from scratch)☆78Updated last year
- 文本查重SDK,可用于论文查重、标书查重、文档查重、作业查重、合同查重、防串标等场景。关联:duplicate check☆149Updated 6 months ago
- 基于LDA+SVM可拓展的短文本分类。股市舆情监控系统☆28Updated 6 years ago
- 基于webMagic爬取知乎数据,并按天定时归档☆45Updated 6 months ago
- 智能简历解析系统,支持多维度信息提取☆111Updated 8 months ago
- 一个基于Neo4j图形数据库的社交推荐系统(一周时间,从学习到完成的垃圾练手课设小项目)☆26Updated 4 years ago
- 通过CSDN爬虫爬取博客,利用Whoosh实现倒排索引与排序,django作为后端实现小型CSDN搜索引擎。并实现高亮、相关搜索等功能。☆30Updated 7 years ago
- AI Hub 是一个为了接入包括ChatGPT、Baichuan、Zhipu、混元、MiniMax、Moonshot等多种大型语言模型而设计的服务。它旨在积累和管理各种有效的模型调用提示(prompt),并对这些大型语言模型进行持续的测试和评估。☆73Updated last year
- 基于python和llm大模型开发的数据处理和任务调度系统。 支持数据源管理,数据模型管理,数据集成,数据查询API接口,低代码自定义数据处理任务模版,单任务及dag任务工作流调度等功能。集成了llm模块实现rag知识库问答,链接各数据源数据进行数据对话问答,交互式数据分析…☆253Updated 2 months ago
- 基于 Scrapy 的新闻智能分类微信小程序,是一个文本分类相关的应用,目的是打造出一个可以对新闻进行智能分类的微信小程序。技术栈:Python + Scrapy + MongoDB + scikit-learn + Flask + 微信小程序,涉及爬虫、文本分类、Web …☆63Updated 6 years ago
- 这是一个在线设计调查问卷、考试问卷、登记报名表、满意度调查表的问卷设计系统☆30Updated 3 years ago
- 大模型模拟面试&面试提词器☆44Updated last year
- 这是一个Python FastAPI项目工程库,包含DB、Redis、MongoDB、JSON等工具和基础服务类。☆22Updated 4 years ago
- 基于多模态特征融合的即时社交软件违规图片检测系统。通过结合图像和文本信息,系统支持对OCR后的文本进行高效的敏感词检测,并允许用户自定义敏感词词库。此外,系统能够自动识别图片中的二维码并提取域名进行安全检测,实现对图片的三分类,包括正常、涉黄和敏感信息,并支持建立图片黑白名…☆67Updated last year
- 网上法律咨询系统Spring Boot开发项目,项目文件包括需求分析文档,项目源代码,系统测试文档。部分功能使用了文本挖掘算法与深度学习模型。☆44Updated 2 years ago
- 可以将word(doc、docx)、excel、pdf、ppt、csv、txt文件的文本内容提取出来,同时能够提取出word、pdf文件的目录☆76Updated 3 years ago
- 职业推荐系统---指标分析☆13Updated 6 years ago
- Python网络爬虫与推荐算法新闻推荐平台:网络爬虫:通过Python实现新浪新闻的爬取,可爬取新闻页面上的标题、文本、图片、视频链接(保留排版) 推荐算法:权重衰减+标签推荐+区域推荐+热点推荐☆119Updated 4 years ago
- 实现了一整套电商数仓的搭建,包括数据采集平台的搭建,将用户的行为数据分为四层分别分层搭建,并实现业务数据库的分层搭建,针对数据仓库中的数据进行,留存、转化率、复购率、GMV、活跃等报表分析,使用当下主流程数的框架,这个项目采用Apache版本的框架实现,后续会上传CDH版本…☆56Updated 3 years ago
- 从零开始构建的一个宠物识别系统,包括爬虫、深度学习模型和WEB服务。爬虫使用requests+beautifulsoup4+gevent,深度学习模型使用TensoFlow 2.0,WEB服务使用Vue.js+Element UI。☆72Updated 2 years ago
- 与Datawhale组织的现有仓库以及学习内容对话——快速找到你想学习的内容和贡献内容!☆52Updated last year
- 考研政治刷题小程序NodeJS后端代码☆27Updated 3 years ago
- 智谱AI大模型开放SDK - By 小傅哥版本☆96Updated last year