xieyan0811 / pdfconv
中文PDF转TXT的实用工具
☆30Updated 3 years ago
Alternatives and similar repositories for pdfconv:
Users that are interested in pdfconv are comparing it to the libraries listed below
- 使用Simhash对海量文本进行去重☆12Updated 6 years ago
- 中文语料库:包括情感词典 情感分析 文本分类 单轮对话 中文词典 知乎☆117Updated 7 years ago
- 百度百科爬虫☆33Updated 5 years ago
- 电商评论观点挖掘☆39Updated 5 years ago
- 使用BiLSTM对人民日报语料进行分词☆56Updated 6 years ago
- 汉字字符特征提取工具,可以提取出字符中的字音(声母、韵母、声调)、字形(偏旁、部首)、四角编码等特征,同时可作 为tensor输入到模型☆137Updated 4 years ago
- self complemented SpellCorrection based pinyin similairity, edit distance ,基于拼音相似度与编辑距离的查询纠错。☆82Updated 2 years ago
- 各大中文分词性能评测☆157Updated 6 years ago
- 中国法研杯-司法人工智能挑战赛☆91Updated 6 years ago
- 利用文本分析算法和Python脚本,自动纠正word中的英语单词拼写错误☆47Updated 6 years ago
- Tookit-Sihui, a tool of some common algorithm, AI文本混合科学计算器(calculator-sihui), 句子词频-逆文本频率(TF-IDF),搜索BM25, 前缀树搜索关键词(trietree), 模板匹配-递归函数(fu…☆24Updated 4 years ago
- 手动实现Elasticsearch的倒排索引以及BM25算法☆47Updated 6 years ago
- 中文新词发现算法PNW算法,可以识别任意长度的新词。☆15Updated last year
- RelExt: A Tool for Relation Extraction from Text. 文本实体关系抽取工具。☆50Updated 2 years ago
- EventKGNELL, event knowlege graph never end learning system, a event-centric knowledge base search system,实时事理逻辑知识库终身学习系统项目和事件为核心的知识库搜索系统…☆71Updated 5 years ago
- chinese anti semantic word search interface based on dict crawled from online resources, ChineseAntiword,针对中文词语的反义词查询接口☆59Updated 6 years ago
- ☆46Updated 4 years ago
- 中文分词工具评估☆61Updated 2 years ago
- Word similarity computation based on Tongyici Cilin☆119Updated 7 years ago
- 物种名称语料库。植物名,动物名。☆48Updated last year
- 发现新词 无监督词库生成 医学词库生成 发现未登录词☆77Updated 4 years ago
- 基于gensim模块的中文句子相似度计算☆53Updated 6 years ago
- Quick run NLP in many task 快速运行分类、序列标注、匹配、生成等NLP任务的Tensorflow框架 (中文 NLP 支持分布式)☆30Updated 4 years ago
- Self complemented Key infomation extraction including keywords, abstract from text using algorithm like textrank ,tfidf 基于Textrank算法的文本摘要…☆54Updated 7 years ago
- ZhidaoChatbot, a chatbot that can be an expert on the common questions like why,how,when,who,what based on the online question-answer web…☆42Updated 6 years ago
- self complemented WeiboIndexSpyder based on Selenium ,新浪微博指数(微指数)采集,包括综合指数,移动端指数,PC端指数☆31Updated 6 years ago
- Cognitive Inference,认知推理、常识知识库、常识推理与常识推理评估的系统项目 ,以现有国内外已有的常识知识库为研究对象,从常识知识库资源建设和常识推理测试评估两个方面出发进行整理,并结合自己近几年来在逻辑性推理知识库的构建、应用以及理论思考进行介绍。具体包括…☆122Updated 4 years ago
- 收集的各类字典,欢迎大家提交。(专业、中草药、中药、交通、停用词、动物、健康、国家、地名、学校、植物、汽车品牌)☆71Updated 4 years ago
- ☆82Updated 6 years ago
- 中文纠错☆92Updated 3 years ago