AshDyh1999 / keyframe-OCR-video_info_extract
这里是多媒体作业,通过关键帧以及ocr技术实现视频关键信息的提取
☆9Updated 5 years ago
Alternatives and similar repositories for keyframe-OCR-video_info_extract:
Users that are interested in keyframe-OCR-video_info_extract are comparing it to the libraries listed below
- 集美大学人工智能期末作业,实现通过声纹识别人物☆26Updated 5 years ago
- 毕业设计-汉语多音字注音研究☆84Updated 6 years ago
- Detect the face in each key frame which extracts from the movie☆26Updated 4 years ago
- 对音频文件的处理:音频信息,读取内容,获取时长,切割音频,pcm与wav互转☆38Updated 6 years ago
- 【仅作为交流学习使用】机器智能--相关书目及经典论文包括AutoML、情感分类、语音识别、声纹识别、语音合成实验代码等☆90Updated 5 years ago
- 2019年“创青春·交子杯”新网银行高校金融科技挑战赛-AI算法赛道唇语识别baseline☆37Updated 4 years ago
- 基于Flask Web的中文自动语音识别演示系统,包含语音识别、语音合成、声纹识别之说话人识别。☆163Updated last year
- 2018秋哈工大视听觉实验☆145Updated 5 years ago
- 爬取新浪微博数据并可视化分析☆37Updated 4 years ago
- 情绪识别api http://114.116.230.62/index/☆26Updated 2 years ago
- 【信息检索课程设计】sdu新闻网站全站爬取+索引构建+搜索引擎☆59Updated 11 months ago
- 基于深度学习的普通话语音识别☆18Updated 6 years ago
- 基于语音的语种识别☆30Updated last year
- 基于卷积神经网络的语音识别声学模型的研究☆173Updated 5 years ago
- 一个简单的语音助手框架实现,唤醒词为:“嘿 小二”。(rasa以及自训练的部分遗失了,在框架上适配了对开放平台接口的调用,可根据本地训练的模型对robot中对应功能进行扩展、替换)☆23Updated 5 years ago
- 说话人特征(声纹)提取工具,基于VGG-SR预训练模型。☆33Updated 5 years ago
- 采用三种方式 (1)利用keras库搭建seq2seq (2)利用keras_transformer库 (3)利用fastnlp框架 实现问答机器人、机器翻译、文本摘要等功能☆14Updated 4 years ago
- 语音识别 MFCCs特征处理 cnn神经网络☆99Updated 6 years ago
- 说话人识别(声纹识别)算法的Python实现。包括GMM(已完成)、GMM-UBM、ivector、基于深度学习的声纹识别(self-attention已完成)。☆95Updated 2 years ago
- 利用Python+TensorFlow实现语音识别☆48Updated 6 years ago
- 豆瓣Top250影评爬虫(用于情感分析语料)☆22Updated 2 years ago
- 基于 Scrapy 的新闻智能分类微信小程序,是一个文本分类相关的应用,目的是打造出一个可以对新闻进行智能分类的微信小程序。技术栈:Python + Scrapy + MongoDB + scikit-learn + Flask + 微信小程序,涉及爬虫、文本分类、Web …☆62Updated 5 years ago
- 毕业设计-语音识别系统-GUI-python☆29Updated 6 years ago
- pytorch-based, RNN,中文古诗词、歌词、散文自动生成☆57Updated 5 years ago
- 2018年7⽉30⽇-8⽉13⽇持续2周的AI训练营中语⾳情感识别营的项目报告。☆95Updated 6 years ago
- 本项目使用了EcapaTdnn、ResNetSE、ERes2Net、CAM++等多种先进的声纹识别模型,同时本项目也支持了MelSpectrogram、Spectrogram、MFCC、Fbank等多种数据预处理方法☆265Updated this week
- 这个项目将 RAVDESS 数据集切割成 1s 短语音,利用 openSMILE+CNN 进行训练,目标是将短语音分类到四种情感中,分别是:开心(happy)、悲伤(sad)、生气(angry)和中性(neutral)。最后准确率达到 76% 左右。☆57Updated 3 years ago
- 《Python自然语言处理实战:核心技术与算法(涂铭)》笔记☆27Updated 5 years ago
- 这是一个基于全卷积神经网络的语音识别系统☆77Updated 5 years ago
- 使用Tensorflow实现声纹识别☆310Updated 10 months ago