tom523 / crawlCnki
爬取知网论文
☆31Updated 7 years ago
Alternatives and similar repositories for crawlCnki
Users that are interested in crawlCnki are comparing it to the libraries listed below
Sorting:
- 猫头鹰搜索引擎,爬虫,分词,索引,搜索☆27Updated 9 years ago
- 新闻评论观点挖掘系统,粗粒度的分析出新闻网评观点的倾向和走势☆53Updated 9 years ago
- 个人实现的基于Django与semantic-ui的语言计算实验平台, 功能包括自然语言综合处理,词语计算,社会热点计算,人物计算,文学画像,职位画像等社会计算功能☆29Updated 7 years ago
- 儿童机器人相关的后台框架、AI引擎、自然语言处理、儿童教育知识图谱、APP框架☆46Updated 8 years ago
- 一个用BeautifulSoup写的简单的爬取百度搜索结果的爬虫☆20Updated 9 years ago
- 深度学习模型自动识别验证码,python爬虫库自动管理会话,通过简单易用的API,实现知乎数据的爬取☆78Updated 2 years ago
- Those years of learning Python - 这些年学习的Python☆116Updated 5 years ago
- 摘要、关键字、关键词组、文本相似度、分词分句(自然语言处理工具包)☆11Updated 5 years ago
- 今日头条科技新闻接口爬虫☆18Updated 7 years ago
- 中国股市从1990年发展至今才仅仅28年,正处于一个茁壮成长的黄金时期。 股票市场发展至今形成了两大流派,技术派和基本派,基本分析以公司的价值为投资对象,发掘公司未来的投资价值;而技术分析则以行为为主,通过股票的历史走势,各种形态指标为研究对象;在股票市场的推进中,信息越发 …☆9Updated 7 years ago
- 金融数据爬虫☆28Updated 9 years ago
- 基于scrapy-redis的分布式新闻爬虫,可同时获取腾讯、网易、搜狐、凤凰网、新浪、东方财富、人民网等各大平台新闻资讯☆44Updated 7 years ago
- 简单的搜索引擎, django 框架☆46Updated 5 years ago
- 今日头条爬虫,主要爬取关键词搜索结果,包含编辑距离算法、奇异值分解、k-means聚类。☆72Updated 5 years ago
- 百度知道爬虫,爬取问答对☆19Updated 9 years ago
- 企查查企业分类信息采集☆43Updated 5 years ago
- 爬虫项目☆70Updated 6 years ago
- 爬虫程序:支持爬取问答类网站(Quora/SO/Yahoo Answer/知乎/百度知道等)、百科类网站(百度百科/中英文维基百科等)、博客类网站(CSDN/Twitter等)☆27Updated 7 years ago
- openlaw数据爬虫v1.1 更新日期:2017.12.16 解决新版openlaw多种加密问题。引入celery轻松异步分布式,爬取速度再次翻倍!!☆57Updated 5 years ago
- 此文本分类项目主要面向机器学习初学者和文本分类效果测试者,项目内部含有朴素贝叶斯,余弦定理,逻辑回归多种分类算法以及mm,rmm分词器,同时从某新闻站点爬取了多个分类共6000多篇文章,以及一个中文词典。项目方便自由拓展各种分类器和分词器,并通过组装测试分类效果。☆35Updated 7 years ago
- 新闻爬虫 (腾讯,网易,新浪,今日头条,搜狐,凤凰网,腾讯滚动新闻)☆57Updated 6 years ago
- 语义搜索引擎-语义解析模块☆28Updated 3 years ago
- 多线程爬取互联网行业常用 招聘网站☆29Updated 7 years ago
- 限定域问答系统包括:自动构建知识库、问句检索、基于微信平台搭建问答系统。本项目所有代码已开源。用户通过简单配置,可以实现快速自动化搭建一个比较完备的领域知识库。另外,基于微信平台如何通过配置来搭建问答系统,具体操作见readme.txt☆71Updated 8 years ago
- 这是一个工具程序集合,方便我们平时对数据进行预处理。针对文本处理的内容较多。包括分词(集成了张华平分词、结巴分词)、文件处理增强(如读取文本到Map中,保存文本到Map)和语料模型(把文档转换成矩阵,就算单词数量等)☆22Updated 7 months ago
- 使用3w多唐诗训练好的lstm,能够自动生成诗词和藏头诗☆55Updated 8 years ago
- 语义相似度计算各种算法实现汇总☆45Updated 7 years ago
- 查询天气预报,以短信的形式发送☆51Updated 7 years ago
- Qimen表示的是奇门遁甲之术,用于抽取各种实体的工具。☆29Updated 5 years ago
- 使用Simhash对海量文本进行去重☆12Updated 6 years ago