xhlgogo / Chinese-NLP-NewcomerLinks
本项目爬取各省市政府工作报告,试图通过聚类、主题分类等将它们识别区分开来。
☆13Updated 6 years ago
Alternatives and similar repositories for Chinese-NLP-Newcomer
Users that are interested in Chinese-NLP-Newcomer are comparing it to the libraries listed below
Sorting:
- 文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据中国知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照词频排序提取…☆107Updated 7 years ago
- 该库是一个项目集,包括文本分类、多标签分类、细粒度情感分析、命名实体识别,以及部分数据集等☆202Updated 6 years ago
- multi-label-classification-4-event-type☆136Updated 2 years ago
- 金融知识图谱构建☆139Updated 6 years ago
- 基于TF-IDF和余弦定理计算文本相似度☆36Updated 6 years ago
- 从模型训练到部署,实战知识图谱(Knowledge Graph)&自然语言处理(NLP)。涉及 Tensorflow, Bert+Bi-LSTM+CRF,Neo4j等 涵盖 Named Entity Recognition,Text Classify,Informatio…☆90Updated 5 years ago
- 基于word2vec使用wiki中文语料库实现词向量训练模型☆59Updated 6 years ago
- 经济责任审计知识图谱:网络爬虫、关系抽取、领域词汇判定☆125Updated 5 years ago
- Syntax and Ruler-Based Doc sentiment analysis 基于依存句法规则的篇章级情感分析demo☆107Updated 5 years ago
- 毕业设计,基于事理图谱的事件推理系统☆70Updated 5 years ago
- 将bert模型应用到问答系统中来,一者学习知识图谱的基本操作,二简单搭建问答系统的基本框架,三将词向量、bert模型实践应用☆59Updated 5 years ago
- 个人实现的基于django,d3js与echarts的领域知识图谱检索与计量平台.面向语言政策领,包括语言政策领域的知识检索,关系检索与钻取,计量分析,知识可视化.☆26Updated 7 years ago
- 系统的介绍如何搭建一个完整的文本分类系统,包括数据预处理、主要方法的原理介绍和实现细节、实验结果与分析、网页Demo的构建以及项目文件的组织方式。项目的原理和处理细节可以查看我的博客专栏:https://blog.csdn.net/sdu_hao/category_9286…☆29Updated 5 years ago
- 根据自己搭的 LTP 服务器,实现:分词、词性标注、命名实体识别、依存句法分析、语义角色标、命名实体的抽取:人名,地名,机构名、三元组的抽取:主谓宾,动宾关系,介宾关系,(实体1,关系,实体2)☆144Updated 7 years ago
- 事件知识图谱构建相关的论文, 包含事件抽取、事件关系识别等任务☆81Updated last year
- 知识图谱初探,关系抽取,实体抽取,基于kb的问答,基于es的问答,知识图谱可视化☆60Updated 5 years ago
- 使用Python进行自然语言处理相关实践,如新词发现,主题模型,隐马尔模型词性标注,Word2Vec,情感分析☆52Updated 5 years ago
- Self complemented Key infomation extraction including keywords, abstract from text using algorithm like textrank ,tfidf 基于Textrank算法的文本摘要…☆54Updated 7 years ago
- 【自然语言处理】微博开放域事件抽取系统,又名“微博日历系统”。可以自动抓取新浪微博,提取命名实体和事件元素,对事件排序☆10Updated 2 years ago
- 医疗 保险领域知识图谱☆131Updated 7 years ago
- gensim-word2vec+svm文本情感分析☆104Updated 7 years ago
- 基于字符级卷积神经网络的细粒度的中文情感分析以及具体的应用,将顾客打分和评论情感进行两极映射,使用数据自动标注和基于弱监督预训练的数据增强方式自动扩充和优化数据集,实验证实了在情感分类中,使用本文的字符级卷积神经网络(C-CNN-SA)可以在不依赖分词的情况下,达到的精度和…☆45Updated 5 years ago
- Python创建Neo4J知识 图谱数据库☆155Updated 6 years ago
- 慕课网公开课:数据预处理☆74Updated 6 years ago
- 文本特征提取,适用于小说,论文,议论文等文本,提取词语、句子、依存关系等特征。python开发。☆41Updated 6 years ago
- Bert预训练模型fine-tune计算文本相似度☆104Updated 2 years ago
- 今日头条中文新闻(文本)分类数据集☆66Updated 7 years ago
- Sequential Event Experiment based on Travel note crawled from XieCheng,基于50W携程出行游记的采集与顺承事件图谱构建.☆183Updated 6 years ago
- 近年来,随着微信、微博、市长信箱、阳光热线等网络问政平台逐步成为政府了解民意、汇聚民智、凝聚民气的重要渠道,各类社情民意相关的文本数据量不断攀升,给以往主要依靠人工来进行留言划分和热点整理的相关部门的工作带来了极大挑战。同时,随着大数据技术的发展,建立基于自然语言处理技术的…☆33Updated 4 years ago
- 对舆情事件进行词云展示,对评论进行情感分析和观点抽取。情感分析基于lstm 的三分类,观点抽取基于AP 算法的聚类和MMR的抽取☆182Updated 6 years ago