lxbuaa2017 / jiebaDictsLinks
经过处理后可直接用于jieba的词典
☆16Updated 5 years ago
Alternatives and similar repositories for jiebaDicts
Users that are interested in jiebaDicts are comparing it to the libraries listed below
Sorting:
- 医疗语料库。医疗机构名语料库。药品本位码。☆69Updated last year
- 字符串地址查询,支持自定义地址词库,解析地址,地址识别,地址抽取,中文地址.☆97Updated 4 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆165Updated 3 years ago
- 中文新词发现算法PNW算法,可以识别任意长度的新词。☆15Updated 2 years ago
- 行业知识图谱,关系抽取,数据清洗,ncov,疫情数据,百科,医疗,保险,汽车,垃圾分类,产业链,投资,高考,行业专家圈子,CXO圈子☆112Updated last year
- company name parser, extract company name brand. 中文公司名称分词工具,支持公司名称中的地名,品牌名(主词),行业词,公司名后缀提取。☆91Updated 2 years ago
- Translation model based on sequence to sequence model. 基于seq2seq模型的翻译模型demo☆17Updated 7 years ago
- 一个简单易用的 Python 模块,用于通过字符串来操作日期/时间。正则时间提取,字符串时间解析,字符串时间提取。中文时间提取,一句话里面提取时间☆75Updated last year
- 基于 Simhash 的论文查重系统☆81Updated 3 years ago
- 文本自动摘要☆94Updated 2 years ago
- 一个快速确定文本(新闻)归属地的工具☆18Updated 4 years ago
- mirror of dongxiexidian/Chinese☆301Updated 6 years ago
- 金庸小说人物关系图谱构建☆63Updated 5 years ago
- 错别字纠正算法。调用pycorrector接口,使用规则。☆72Updated 5 years ago
- 图书名语料库。含部分电影、游戏名称。☆72Updated last year
- chinese anti semantic word search interface based on dict crawled from online resources, ChineseAntiword,针对中文词语的反义词查询接口☆59Updated 6 years ago
- ☆37Updated 6 years ago
- 使用pyltp的工具,基于中文依存句法的四大名著人物情节分析系统。分为整体分析和章节分析两大模块,实现了人物篇幅分析,故事发生地分析,主要人物情绪变化分析,人物互动情况分析.☆94Updated 7 years ago
- clueai工具包: 3行代码3分钟,自定义需要的API!☆233Updated 2 years ago
- 该项目主要是抽取病历文件中的一些关键信息。并将抽取的内容进行streamlit前端的展示。目前支持的文件类型:图片,pdf文件,word文件☆23Updated 2 years ago
- An exploration for Eventline (important news Rank organized by pulic time),针对某一事件话题下的新闻报道集合,通过使用docrank算法,对新闻报道进行重要性识别,并通过新闻报道时间挑选出时间线上重要…☆222Updated 6 years ago
- ☆142Updated 2 years ago
- 调研药品数据网站。基于网络爬虫爬取药源网药物数据,搭建药品数据库。含中成药和化学药品信息共计10万余条。爬取国家食品药品监督管理局药品数据对药源网数据进行修正。基于Selenium等工具应对反爬,爬取ICD10等数据共研究使用。☆119Updated 5 years ago
- 中文地址分词(地址元素识别与抽取),通过序列标注进行NER☆198Updated 5 years ago
- Sentence-Transformers Information Retrieval example on Chinese☆29Updated last year
- 百度百科爬虫☆73Updated last year
- self complemented WeiboIndexSpyder based on Selenium ,新浪微博 指数(微指数)采集,包括综合指数,移动端指数,PC端指数☆31Updated 7 years ago
- 菜谱名语料库。☆16Updated 3 years ago
- 中文纠错☆92Updated 3 years ago
- This is a corpus of Chinese abbreviation, including negative full forms.☆196Updated 4 years ago