junchaoIU / pythonCenter
✨个人的python代码库(部分)。🌈包涵python基础、各类主流自然语言处理工具接口调用,Keras&Tensortflow实战,数据分析、爬虫等
☆9Updated 2 years ago
Related projects ⓘ
Alternatives and complementary repositories for pythonCenter
- 该项目是基于Scrapy框架的Python新闻爬虫,能够爬取网易,搜狐,凤凰和澎湃网站上的新闻,将标题,内容,评论,时间等内容整理并保存到本地☆36Updated 5 years ago
- 互联网舆情企业风险事件的识别和预警,将公司名称进行实体提取,对新闻进行舆情分类,比赛地址为:http://ailab.aiwin.org.cn/competitions/48#learn_the_details☆16Updated 3 years ago
- lightsmile个人的用于爬取网络公开语料数据的mini通用爬虫框架。☆12Updated 4 years ago
- 中文新词发现算法PNW算法,可以识别任意长度的新词。☆15Updated last year
- 仓库主要记录 NLP 算法工程师相关的顶会论文研读笔记【文本匹配篇】☆11Updated 2 years ago
- Sentence-Transformers Information Retrieval example on Chinese☆29Updated 9 months ago
- 基于pytorch的不平衡数据的文本分类☆9Updated 2 years ago
- CCKS 2022 通用信息抽取☆12Updated 2 years ago
- Seq2seqAttGeneration, an basic implementation of text generation that using seq2seq attention model to generate poem series. this project…☆17Updated 3 years ago
- 基于中文TaCL-BERT的中文命名实体识别及中文分词☆29Updated 3 years ago
- 别名发现系统☆11Updated 2 years ago
- 领域自适应文本挖掘工具(新词发现、情感分析、实体链接等),基于少量种子词和背景知识☆13Updated 5 years ago
- AI Paper阅读记录与收藏:机器学习/深度学习/自然语言处理/计算机视觉/智能语音/推荐系统/知识图谱☆33Updated last month
- 面向数据安全治理的数据内容智能发现与分级分类——一种通用的应对中文无监督文本分类的解题思路分享☆49Updated 3 years ago
- 企业事件抽取☆14Updated 3 years ago
- GoGPT中文指令数据集构造☆10Updated 9 months ago
- 美丽东自然语言处理百宝箱~命名实体识别,文本分类,语言模型,文本摘要。☆9Updated last year
- 本项目由三个模块构成。意图识别:判断用户的意图是业务型还是闲聊型;模型检索:该部分构建一个语料库,当用户 发起新的query(通过意图识别判断为业务型对话)时,为用户匹配query检索的最佳response,使用HSWN进行召回(粗排), 然后构建句子的相似度,并利用Lig…☆10Updated 3 years ago
- CNN对中文商品名称进行分类,基于Tensorflow☆11Updated 5 years ago
- 中文关键词提取☆12Updated last year
- ☆10Updated 2 years ago
- 去除weiboNER_2nd_conll数据集的分词信息,只保留实体信息,制作成conll格式☆8Updated 2 years ago
- ☆11Updated 3 years ago
- Chinese Grammatical Error Diagnosis☆11Updated 3 years ago
- 基于Pytorch实现的中文文本分类脚手架,以及常用模型对比。☆18Updated 3 years ago
- 基于简单表格的问答系统☆10Updated 4 years ago
- 有一个通用实体关系事件抽取的任务,需要使用到UIE模框架,而且需要将起部署到昇腾310服务器上,因为UIE模型底层使用的是ernie3.0,但是目前paddle官方还不支持ernie3.0模型在昇腾310上部署,所以才有了以下的操作,主要过程是,先试用paddle训练处模型…☆17Updated 2 years ago
- Implementations of BiLSTM-CRF and IDCNN-CRF NER models on Weibo, MSRA and Twitter copora.☆10Updated 4 years ago
- 用Paddle复现论文ChineseBERT: Chinese Pretraining Enhanced by Glyph and Pinyin Information(ACL2021)☆9Updated 3 years ago
- 这个是一个《电商标题数据相似度匹配系统》,使用方法有:tfidf+词袋模型,余弦相似度,word2vec☆25Updated 4 years ago