junchaoIU / pythonCenter
✨个人的python代码库(部分)。🌈包涵python基础、各类主流自然语言处理工具接口调用,Keras&Tensortflow实战,数据分析、爬虫等
☆11Updated 3 years ago
Alternatives and similar repositories for pythonCenter:
Users that are interested in pythonCenter are comparing it to the libraries listed below
- 税收政策服务--政策爬虫,从国税总局,及其他税务相关机构的网站,爬取税收政策、解读、条约等信息,以备后续处理☆25Updated 5 years ago
- 专业领域词库构建/中文新词发现/专业词库发现☆29Updated 5 years ago
- ☆23Updated last year
- Ziya-LLaMA-13B是IDEA基于LLaMa的130亿参数的大规模预训练模型,具备翻译,编程,文本分类, 信息抽取,摘要,文案生成,常识问答和数学计算等能力。目前姜子牙通用大模型已完成大规模预训练、多任务有监督微调和人类反馈学习三阶段的训练过程。本文主要用于Ziya-…☆45Updated last year
- 系统从互联网爬取资讯,对热点公共事件进行检测、聚合和追踪,多维度分析事件内容,监测时间传播路径,分析用户的观点和和情绪,形成摘要、报告、图表等分析结果,实现公共事件的舆情分析可视化系统,提供专业的舆情监测、分析和预警服务☆91Updated 6 years ago
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆49Updated last month
- Legal-Eagle-InternLM 是一个基于商汤科技和上海人工智能实验室推出的书生浦语大模型InternLM的法律问答机器人。旨在为用户提供符合3H(即Helpful、Honest、Harmless)原则的专业、智能、全面的法律服务的法律领域大模型。☆55Updated last year
- 文本自动摘要☆94Updated last year
- 中文心理问答数据集☆75Updated 4 years ago
- 法律智能 ,NLP技术赋能法律判案☆20Updated 6 years ago
- 使用Simhash对海量文本进行去重☆12Updated 6 years ago
- 基于qlora对baichuan-7B大模型进行指令微调。☆21Updated last year
- 新闻文本自动摘要, 以Textrank 为基础,融入 标题特征,单句位置特征,重要实体特征,线索词特征,做句子的综合权重计算,并使用MMR算法,兼顾自动摘要的主题相关性和摘要多样性。☆26Updated 2 years ago
- 百度百科 500 万数据集☆34Updated last year
- 该项目通过新闻数据集演示文本分类全流程:数据清洗,模型训练,模型部署和前端展示。使用的模型和工具:pytorch,bert,streamlit☆18Updated 2 years ago
- selenium裁判文书网爬虫,文书网登录☆38Updated 2 years ago
- 中文语料库:包括情感词典 情感分析 文本分类 单轮对话 中文词典 知乎☆117Updated 7 years ago
- 法律案件知识图谱☆28Updated 4 years ago
- 面向数据安全治理的数据内容智能发现与分级分类——一种通用的应对中文无监督文本分类的解题思路分享☆50Updated 3 years ago
- CCKS 2022 通用信息抽取☆12Updated 2 years ago
- “法阿”中文分词:做最好的 Python 法律中文分词组件☆27Updated 4 years ago
- 基于webMagic爬取知乎数据,并按天定时归档☆43Updated this week
- A Python toolkit for file processing, text cleaning and data splitting. 文件处理,文本清洗和数据划分的python工具包。☆32Updated 2 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆159Updated 3 years ago
- 法律知识图谱网站。A legal knowledge graph web project.☆17Updated 6 years ago
- 百度百科爬虫☆71Updated 9 months ago
- 微调预训练语言模型(BERT、Roberta、XLBert等),用于计算两个文本之间的相似度(通过句子对分类任务转换),适用于中文文本☆89Updated 4 years ago
- 该项目是基于Scrapy框架的Python新闻爬虫,能够爬取网易,搜狐,凤凰和澎湃网站上的新闻,将标题,内容,评论,时间等内容整理并保存到本地☆37Updated 5 years ago
- 文本聚类☆35Updated 3 years ago
- 裁判文书数据☆11Updated 4 years ago