smilelight / lightSpiderLinks
lightsmile个人的用于爬取网络公开语料数据的mini通用爬虫框架。
☆13Updated 5 years ago
Alternatives and similar repositories for lightSpider
Users that are interested in lightSpider are comparing it to the libraries listed below
Sorting:
- 基于电商导购机器人,自然语言理解(NLU),文本纠错,歧义词消歧☆12Updated 5 years ago
- English or Chinses GPT2Dialog model from GPT2-chitchat☆12Updated 5 years ago
- 词、句拼音转汉字、拼音分割、拼音补全、pygame输入中文☆15Updated 5 years ago
- 中文新词发现算法PNW算法,可以识别任意长度的新词。☆16Updated 2 years ago
- rasa_chinese 的服务 package☆18Updated 4 years ago
- TensorRT☆11Updated 5 years ago
- 🔥 专注于中文的「自然语言处理框架」:中文分词;平衡类别;数据集划分...☆12Updated 5 years ago
- Quick run NLP in many task 快速运行分类、序列标注、匹配、生成等NLP任务的Tensorflow框架 (中文 NLP 支持分布式)☆31Updated 5 years ago
- self complemented WeiboIndexSpyder based on Selenium ,新浪微博指数(微指数)采集,包括综合指数,移动端指数,PC端指数☆31Updated 7 years ago
- 基于rasa_框架实现指自然语言相关功能:实体识别、文本分类、代消解功能、关系抽取等☆17Updated 2 years ago
- 🤖️ 聊天机器人——夫子的「自然语言理解」模块☆89Updated 2 years ago
- 中文文本改写☆20Updated 5 years ago
- CLUE Emotion Analysis Dataset 细粒度情感分析数据集☆10Updated 6 years ago
- ZhidaoChatbot, a chatbot that can be an expert on the common questions like why,how,when,who,what based on the online question-answer web…☆43Updated 6 years ago
- chinese anti semantic word search interface based on dict crawled from online resources, ChineseAntiword,针对中文词语的反义词查询接口☆59Updated 7 years ago
- Seq2seqAttGeneration, an basic implementation of text generation that using seq2seq attention model to generate poem series. this project…☆18Updated 5 years ago
- 夸夸语料,来自豆瓣互相表扬组数据☆78Updated 6 years ago
- worddict crawler and transfer for sougpuinput wordict , 搜狗输入法词库抓取与格式转换☆26Updated 7 years ago
- 从门户网站爬取新闻的摘要-标题对使用seq2seq根据摘要生成标题☆45Updated 8 years ago
- baike schema crawler for baidu baike , hudongbaike. 面向百度百科与互动百科的概念分类体系抓取脚本☆38Updated 7 years ago
- 专业领域词库构建/中文新词发现/专业词库发现☆31Updated 6 years ago
- 本项目由三个模块构成。意图识别:判断用户的意图是业务型还是闲聊型;模型检索:该部分构建一个语料库,当用户 发起新的query(通过意图识别判断为业务型对话)时,为用户匹配query检索的最佳response,使用HSWN进行召回(粗排), 然后构建句子的相似度,并利用Lig…☆12Updated 4 years ago
- 一个完整的智能分诊系统实现☆19Updated 3 years ago
- 【今日头条】文本作者身份识别比赛☆10Updated 7 years ago
- EventKGNELL, event knowlege graph never end learning system, a event-centric knowledge base search system,实时事理逻辑知识库终身学习系统项目和事件为核心的知识库搜索系统…☆73Updated 5 years ago
- 网络表情NLP,颜文字识别,颜文字表情实体识别、属性检测、新颜发现☆44Updated 5 years ago
- 知识库问答系统☆13Updated 7 years ago
- 依据香港中文大学设计的规则系统,先用小样本评论建立初始关键词库,再结合18种句式逐条匹配评论,能够快速准确地识别评论对象及情感极性。经多次迭代优化关键词库后,达到较高准确率的基础上,使用Tableau进一步分析数据,识别出客户集中关注的商品属性、普遍好评差评的商品属性;通过…☆57Updated 8 years ago
- self complement of baike knowledge base info-box extraction by online analysis.基于互动百科,百度百科,搜狗百科的词条infobox结构化信息抽取,百科知识的融合☆37Updated 7 years ago
- Qimen表示的是奇门遁甲之术,用于抽取各种实体的工具。☆29Updated 6 years ago