markyangcc / Analysis-Gov-Work-ReportLinks
利用Python爬取网站近年的政府工作报告,并进行简单的词频分析+词云
☆17Updated last year
Alternatives and similar repositories for Analysis-Gov-Work-Report
Users that are interested in Analysis-Gov-Work-Report are comparing it to the libraries listed below
Sorting:
- 中文文本情感分类数据集分享 chinese sentiment datasets☆82Updated 4 years ago
- TTS前,文本标准化,将数字字母处理转化为汉字☆12Updated last year
- Chinese Subjective Dectection based on subjective knowlegebase, 中文主观性计算。基于中文主观性知识库的句子主观性评定方法。☆57Updated last year
- 毕业设计-汉语多音字注音研究☆85Updated 6 years ago
- 中文文本分析工具、语料、预训练模型相关资源汇总。☆142Updated 2 months ago
- 利用文本挖掘技术进行新闻热点关注问题分析☆164Updated 6 years ago
- 这是我2014级本科毕业论文项目,在深交所实习期间完成!☆20Updated 7 years ago
- 文本转拼音、提取英文字段、提取数字、提取中文字符、英文转中文、字符型的数字转中文的数字表示、拼音转文本、文本纠错、基于bert转词向量、基于bert转句向量、繁体字转简体、中文数字转阿拉伯数字☆21Updated 5 years ago
- Self complemented sentiment words expansion using seed sentiment words and so-pmi , this method is tested to be effective, 基于情感种子词与so-pmi…☆87Updated 7 years ago
- Chinese Sentiment Classification Tool. 情感极性分类,基于知网、清华、BosonNLP情感词典,易扩展,基准方法,开箱即用。☆97Updated last year
- Cantonese segmentation tool 粵語分詞工具☆30Updated 4 years ago
- 澎湃新闻,新浪新闻,腾讯新闻,搜狐新闻,新闻联播,泰晤士报,纽约时报,BBCNews,旨在爬取所有新闻门户网站的新闻,禁止将所得数据商用!☆399Updated 2 years ago
- 在Python中利用情感词典做情感分析☆43Updated 7 years ago
- 获取滚动新闻☆56Updated 6 years ago
- 中英文语料数据清洗及分布式分句分词预处理工作☆12Updated 5 years ago
- 使用pytorch深度学习框架,基于BiLSTM-CRF的中文分词系统☆8Updated 6 years ago
- 使用SO_PMI互信息算法、词向量法快速构建不同领域(手机、汽车等)的专业情感词典☆94Updated 3 years ago
- 中文歌词生成, Pytorch, Seq2Seq, Luong注意力, 按不同歌手风格生成歌词☆86Updated 5 years ago
- 音乐类语料的意图识别填槽以及槽值纠错模型☆16Updated 2 years ago
- 基于Pytorch 1.0 实现的中文断句与标点符号恢复。☆58Updated 6 years ago
- 基于Scrapy的QQ音乐爬虫(QQ Music Spider),爬取歌曲信息、歌词、精彩评论等,并且分享了QQ音乐中排名前6400名的内地和港台歌手的49万+的音乐语料☆348Updated last year
- An open-access corpus of conversational bilingual speech in Cantonese and English☆40Updated 3 years ago
- 第十届大学生服务外包大赛--A01商品短文本分类。基于CNN、Bi-LSTM、Attention、Adversarial等方法实现商品短文本分类任务,并基于Flask开发Web版本的交互演示界面。☆28Updated 3 years ago
- 该仓库收集了常用的中文情感词典,仅供学习☆130Updated last year
- TIP-LAS: An open source toolkit for Tibetan word segmentation and part-of-speech tagging☆81Updated 2 years ago
- 本项目旨在对《红楼梦》这部中国古典小说进行人物关系的可视化分析。通过对小说文本的数据采集、清洗和转换,以及分词处理和词频统计等步骤,最终生成人物关系图,并进行可视化展示。另外,项目还尝试通过数据分析的方法并且可视化来验证《红楼梦》后四十回的作者是否为曹雪芹。☆15Updated last year
- 大连理工大学情感词汇本体库及其他相关操作☆138Updated 8 years ago
- 基于bert的中文自然语言处理工具,包括情感分析、中文分词、词性标注、以及命名实体识别功能,并提供文本分类任务、序列标注任务、句对关系判断任务的训练与预测接口☆132Updated 6 years ago
- 收集的各类字典,欢迎大家提交。(专业、中草药、中药、交通、停用词、动物、健康、国家、地名、学校、植物、汽车品牌)☆71Updated 5 years ago
- 用Python获取猫眼30万短评,解读《中国机长》全国热度并利用Pyechart、jieba分词生成热力图,玫瑰图,词云等.☆14Updated 5 years ago