wolfbing / roadrunner
datamining roadrunner
☆13Updated 8 years ago
Related projects ⓘ
Alternatives and complementary repositories for roadrunner
- 中文环境突发事件语料库(Chinese Environment Emergency Corpus)-上海大学-语义智能实验室☆43Updated 9 years ago
- ☆34Updated 10 years ago
- 🍎Wende Chinese QA system (experimental)☆10Updated 3 years ago
- gensim-fast2vec改造、灵活使用大规模外部词向量(具备OOV查询能力)☆21Updated 5 years ago
- 维基百科离线语料获取☆28Updated 7 years ago
- crf-seg:用于生产环境的中文分词处理工具,可自定义语料、可自定义模型、架构清晰,分词效果好。java编写。☆13Updated 2 years ago
- 使用python实现了一个简单的trie树结构,可增加/查找/删除关键词,用于中文文本的关键词匹配、停用词删除等。☆65Updated 4 years ago
- baike schema crawler for baidu baike , hudongbaike. 面向百度百科与互动百科的概念分类体系抓取脚本☆32Updated 6 years ago
- 新词发现☆68Updated 10 years ago
- 基于互信息和邻接信息熵的中文分词和新词发现☆13Updated 5 years ago
- Tookit-Sihui, a tool of some common algorithm, AI文本混合科学计算器(calculator-sihui), 句子词频-逆文本频率(TF-IDF),搜索BM25, 前缀树搜索关键词(trietree), 模板匹配-递归函数(fu…☆24Updated 3 years ago
- DeepDive 中文配置☆51Updated 7 years ago
- 使用simhash算法,快速索引和查询大量文本简历☆22Updated 8 years ago
- A deep text classifiers library.☆36Updated 6 years ago
- 《知网》中文词语语义相似度算法☆42Updated 11 years ago
- 把之前 hanLP-python-flask 裡面的 hanLP 單獨分出來☆60Updated 6 years ago
- a complete Java port of crfpp(crf++)☆31Updated 6 years ago
- 基于 标题分类的主题句提取方法可描述为: 给定一篇新闻报道, 计算标题与新闻主题词集的相似度, 判断标题是否具有提示性。对于提示性标题,抽取新闻报道中与其最相似的句子作为主题句; 否则, 综合利用多种特征计算新闻报道中句子的重要性, 将得分最高的句子作为主题句。☆39Updated 8 years ago
- DeepDive Tutorial with Chinese Support☆34Updated 3 years ago
- 知网相似度计算☆14Updated 7 years ago
- ☆42Updated 6 years ago
- AC自动机python的实现,并进行了优化。 主要修复了 查询不准确的问题。☆70Updated 3 years ago
- 常见中文知识图谱的链接☆22Updated 7 years ago
- Tutorial on Web Table Extraction, Retrieval and Augmentation☆11Updated 4 years ago
- self complemented SpellCorrection based pinyin similairity, edit distance ,基于拼音相似度与编辑距离的查询纠错。☆79Updated 2 years ago