lxbuaa2017 / jiebaDictsLinks
经过处理后可直接用于jieba的词典
☆16Updated 5 years ago
Alternatives and similar repositories for jiebaDicts
Users that are interested in jiebaDicts are comparing it to the libraries listed below
Sorting:
- 该项目主要是抽取病历文件中的一些关键信息。并将抽取的内容进行streamlit前端的展示。目前支持的文件类型:图片,pdf文件,word文件☆23Updated 2 years ago
- 医疗语料库。医疗机构名语料库。药品本位码。☆69Updated last year
- 物种名称语料库。植物名,动物名。☆49Updated last year
- ☆37Updated 6 years ago
- 图书名语料库。含部分电影、游戏名称。☆72Updated last year
- Translation model based on sequence to sequence model. 基于seq2seq模型的翻译模型demo☆17Updated 7 years ago
- Chinese Couplets Dataset without vulgar words. 不包含敏感内容的对联数据集。☆73Updated 5 years ago
- A Multi-Modal Dataset of Chinese Governmental Docunments☆34Updated 4 years ago
- 小说人名统计和关系提取(基于HanLP)☆43Updated 5 years ago
- 中文新词发现算法PNW算法,可以识别任意长度的新词。☆15Updated last year
- 菜谱名语料库。☆16Updated 3 years ago
- 一个简单易用的 Python 模块,用于通过字符串来操作日期/时间。正则时间提取,字符串时间解析,字符串时间提取。中文时间提取,一句话里面提取时间☆75Updated 11 months ago
- 基于 Simhash 的论文查重系统☆81Updated 3 years ago
- 一个快速确定文本(新闻)归属地的工具☆18Updated 4 years ago
- Qimen表示的是奇门遁甲之术,用于抽取各种实体的工具。☆29Updated 5 years ago
- 百度汉语字典爬虫,拼音数据,35万海量百度词典数据。☆26Updated 2 years ago
- 兼容 GPT2、Bloom 等 Pytorch 框架下的语言模型、人工智能标记语言 (AIML) 和任务型对话系统 (Task) 的深度中文智能对话机器人框架☆27Updated 2 years ago
- The most complete Chinese dictionaries ever. 史上最全的中文分类词库,包含地理信息、电子游戏、工程应用、农林牧渔、人文科学、社会科学、生活百科、医学医药、艺术设计、娱乐休闲、运动休闲、自然科学等12大类的超级字典。☆78Updated 5 years ago
- 中文AI写作(写诗或写对联)☆120Updated last year
- 成语数据 Chinese idiom data☆76Updated 7 years ago
- Self complemented Pinyin2Chinese demo use algorithms including Trie and HMM model , 基于隐马尔科夫模型与Trie树的拼音切分与拼音转中文的简单demo实现。☆86Updated 7 years ago
- 国家药监局药品数据☆45Updated 4 years ago
- 金庸小说人物关系图谱构建☆62Updated 5 years ago
- 搜狗细胞词库到普通文本的转换提取工具。提取词汇表,用于深度学习做数据生成和字典特征☆23Updated 6 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆165Updated 3 years ago
- self complemented WeiboIndexSpyder based on Selenium ,新浪微博指数(微指数)采集,包括综合指数,移动端指数,PC端指数☆31Updated 7 years ago
- A Python toolkit for file processing, text cleaning and data splitting. 文件处理,文本清洗和数据划分的python工具包。☆32Updated 2 years ago
- 百度百科爬虫☆72Updated last year
- 中文成语图谱,一个可以用来每天解谜汉兜 https://handle.antfu.me 的中文成语、汉字、读音图谱构建工具。☆25Updated 3 years ago
- 中文 小说 多轮对话语料库 ,可以用来训练中文聊天模型,更新中,有想加的语料可以提issue☆21Updated last year