AshDyh1999 / keyframe-OCR-video_info_extract
这里是多媒体作业,通过关键帧以及ocr技术实现视频关键信息的提取
☆9Updated 4 years ago
Alternatives and similar repositories for keyframe-OCR-video_info_extract:
Users that are interested in keyframe-OCR-video_info_extract are comparing it to the libraries listed below
- 采用三种方式 (1)利用keras库搭建seq2seq (2)利用keras_transformer库 (3)利用fastnlp框架 实现问答机器人、机器翻译、文本摘要等功能☆14Updated 4 years ago
- Detect the face in each key frame which extracts from the movie☆25Updated 3 years ago
- 基于语音的语种识别☆30Updated last year
- 用CASIA database数据集做的,做的语音情感识别和语音识人的练习☆63Updated 2 years ago
- 对音频文件的处理:音频信息,读取内容,获取时长,切割音频,pcm与wav互转☆38Updated 6 years ago
- 基于Flask Web的中文自动语音识别演示系统,包含语音识别、语音合成、声纹识别之说话人识别。☆159Updated 10 months ago
- pytorch-based, RNN,中文古诗词、歌词、散文自动生成☆57Updated 5 years ago
- 说话人识别(声纹识别)算法的Python实现。包括GMM(已完成)、GMM-UBM、ivector、基于深度学习的声纹识别(self-attention已完成)。☆88Updated last year
- 多模态融合情感分析☆119Updated 4 years ago
- 【信息检索课程设计】sdu新闻网站全站爬取+索引构建+搜索引擎☆57Updated 8 months ago
- 这是一个基于Pytorch平台、Transformer框架实现的视频描述生成 (Video Captioning) 深度学习模型。 视频描述生成任务指的是:输入一个视频,输出一句描述整个视频内容的文字(前提是视频较短且可以用一句话来描述)。本repo主要目的是帮助视力障碍…☆82Updated 2 years ago
- 2018年7⽉30⽇-8⽉13⽇持续2周的AI训练营中语⾳情感识别营的项目报告。☆96Updated 6 years ago
- 毕业设计-汉语多音字注音研究☆82Updated 5 years ago
- 数据可视化实践:爬取新浪微博用户数据并对微博内容、转赞评数据进行分析与可视化(折线图、标签云)☆12Updated 4 years ago
- 2018秋哈工大视听觉实验☆144Updated 5 years ago
- 集美大学人工智能期末作业,实现通过声纹识别人物☆26Updated 5 years ago
- 基于多模态特征融合的即时社交软件违规图片检测系统。通过结合图像和文本信息,系统支持对OCR后的文本进行高效的敏感词检测,并允许用户自定义敏感词词库。此外,系统能够自动识别图片中的二维码并提取域名进行安全检测,实现对图片的三分类,包括正常、涉黄和敏感信息,并支持建立图片黑白名…☆48Updated last year
- 500,000 multimodal short video data and baseline models. 50万条多模态短视频数据集和基线模型(TensorFlow2.0)。☆128Updated 5 years ago
- 基于MatLab实现LSB(最低有效位)算法完成图片数字水印隐写功能☆11Updated 2 years ago
- 一个简单的语音助手框架实现,唤醒词为:“嘿 小二”。(rasa以及自训练的部分遗失了,在框架上适配了对开放平台接口的调用,可根据本地训练的模型对robot中对应功能进行扩展、替换)☆23Updated 5 years ago
- 基于Pytorch实现的语音情感识别☆158Updated 3 weeks ago
- Speech to text (PocketSphinx, Iflytex API, Baidu API) and text to speech (pyttsx3) | 语音转文字(PocketSphinx、百度 API、科大讯飞 API)和文字转语音(pyttsx3)☆312Updated 5 years ago
- 一个基于关键词爬虫生成词云的网络内容可视化工具,可爬取百度、谷歌、必应、知乎、微博、微信公众平台☆35Updated 5 years ago
- 爬取新浪微博数据并可视化分析☆36Updated 3 years ago
- 银杏黄项:语音情感识别☆13Updated 8 years ago
- 语音情绪分析☆13Updated 10 years ago
- 分别使用TextRank、BiLSTM和UniLM实现中文文章标题自动生成☆27Updated 4 years ago
- 中文文本相似度计算,采用text2vec词向量工具进行计算对比。☆16Updated 4 years ago
- 这个项目将 RAVDESS 数据集切割成 1s 短语音,利用 openSMILE+CNN 进行训练,目标是将短语音分类到四种情感中,分别是:开心(happy)、悲伤(sad)、生气(angry)和中性(neutral)。最后准确率达到 76% 左右。☆55Updated 3 years ago
- Extract Subtitles From Video 视频字幕提取 帧间差分法识别关键帧 OCR识别☆80Updated 6 years ago