likeweilikewei / financial-NLP-intelligent-interaction
项目介绍: 智能交互金融智能聊天。具体实现用户在所有关于股票话题的智能问答。其中难点是问题 分类、数据预处理、参数提取。 ☆个人工作: 实现金融智能聊天,实现所有股票问题的精确回答。通过提取通用特征将5亿+条训练语料缩减为10w条,语料内存占用量从10G减少到2M,并将精确度提高98%以上。设计划分股票问题为问股、选股、诊股、百科四个话题。设计利用TF-IDF,无监督训练得到分类。提供可靠稳定的后台服务,利用Redis,合理设计数据存储方式,提高平均查询速度到1秒之内。实现用户和机器人流畅交流。
☆61Updated 5 years ago
Related projects ⓘ
Alternatives and complementary repositories for financial-NLP-intelligent-interaction
- 基于知识图谱的金融资讯推荐☆48Updated 6 years ago
- scrapy+Fiddler+celery+ redis +mysql实现分布式定时启动并异步快速动态爬取股票数据功能☆56Updated last year
- 金融财经类新闻文本主题事件提取☆50Updated last year
- 金融问答平台文本数据采集/爬取,数据源涉及上交所,深交所,全景网及新浪股吧☆39Updated 7 years ago
- 基于开源保险产品数据构建的保险知识图谱及简易问答系统☆33Updated 4 years ago
- 医疗保险领域知识图谱☆127Updated 6 years ago
- 基于分布式爬虫,采集互联网公开来源的金融类新闻和文档类文本; 基于文本挖掘技 术,进行无监督/半监督学习的数据ETL与特征工程; 基于金融数据挖掘技术,进行宏观经济分析,基本面分析与行业分析☆95Updated 6 years ago
- 爬取新浪财经网http://finance.sina.com.cn/stock/,各股票公司每日公告(爬取股票分析所需语料)☆28Updated 7 years ago
- 儿童机器人AI引擎,包括自然语言理解、对话生成、多轮对话、状态跟踪、智能推荐以及第三方服务的集成。☆75Updated 7 years ago
- 根据股票帐号,自动下载www.cninfo.com.上对应的企业年报(pdf格式),然后将这些pdf格式的文件转换为txt文件,然后从中提取出有用的信息,进行数据分析和图标展示☆52Updated 7 years ago
- 基于20W金融资讯训练得到的词向量☆24Updated 6 years ago
- 爬取东方财富的宏观研究的研报,基于LSTM进行情感分析,分类为正向、负向和中性三类☆108Updated 2 years ago
- 个人实现的基于Django与semantic-ui的语言计算实验平台, 功能包括自然语言综合处理,词语计算,社会热点计算,人物计算,文学画像,职位画像等社会计算功能☆29Updated 6 years ago
- 利用大数据与人工智能分析预测金融市场☆61Updated last year
- 智能客服☆99Updated 5 years ago
- 证券系统的简单知识图谱☆25Updated 6 years ago
- 本项目致力于开发各种金融数据处理小工具,以实现基本面分析并提供投资建议☆41Updated 5 years ago
- 文本标注工具,给文本打标签☆21Updated 4 years ago
- 基于知识图谱的林业法律法规问答☆16Updated last year
- 极简爬虫工作流☆41Updated last year
- 摘要、关键字、关键词组、文本相似度、分词分句(自然语言处理工具包)☆11Updated 5 years ago
- 对于一个板块内的股票使用Kmeans聚类剔除垃圾股,利用遗传算法分析上市公司的财务指标,从基本面的角度得出合理的股票选择模型,帮助投资者在某个板块内确定出选择高收益股票的标准,策略样本外回测计效见backtest.png文件。☆65Updated 3 years ago
- 使用爬虫获取财经网站的评论、文章;通过tushare库获取股票价格数据;通过jieba库对文本进行词频分析☆87Updated 6 years ago
- 基于火力发电厂知识问答库的检索式问答系统/问答系统/对话系统☆49Updated 4 years ago
- 儿童机器人相关的后台框架、AI引擎、自然语言处理、儿童教育知识图谱、APP框架☆46Updated 7 years ago
- 深度学习基础学习以及工作项目☆21Updated 6 years ago
- GuGu是适用于量化工程及金融/投资领域数据分析的开源项目,通过对互联网上的公开数据进行采集、清洗和存储,完成了对股票/债券/基金等金融数据的统一调用和分析。其优点是速度快、可定制及高度的可复用性。您不仅可以将其作为单独的数据接口使用,还可以将其集成在您的项目中作为数据获取…☆48Updated 5 years ago
- 行业知识图谱,关系抽取,数据清洗,ncov,疫情数据,百科,医疗,保险,汽车,垃圾分类,产业链,投资,高考,行业专家圈子,CXO圈子☆96Updated 3 months ago
- 根据东财股吧爬虫数据进行自然语言分析,展示股市热度☆101Updated 5 years ago
- 利用Scikit Learn对秒级股票数据进行建模预测☆55Updated 6 years ago