apsdehal / flava-tutorialsLinks

Tutorials for FLAVA model https://arxiv.org/abs/2112.04482

☆12

Alternatives and similar repositories for flava-tutorials

Users that are interested in flava-tutorials are comparing it to the libraries listed below

Sorting:

lucidrains / tableformer-pytorch
Implementation of TableFormer, Robust Transformer Modeling for Table-Text Encoding, in Pytorch
☆39Updated 3 years ago
dsaidgovsg / multimodal-learning-hands-on-tutorial
☆98Updated 2 years ago
tezansahu / VQA-With-Multimodal-Transformers
Exploring multimodal fusion-type transformer models for visual question answering (on DAQUAR dataset)
☆36Updated 3 years ago
gchhablani / multilingual-vqa
Repository for Multilingual-VQA task created during HuggingFace JAX/Flax community week.
☆34Updated 4 years ago
marslanm / Multimodality-Representation-Learning
This repository provides a comprehensive collection of research papers focused on multimodal representation learning, all of which have b…
☆77Updated last month
rasbt / cvpr2023
☆133Updated last year
lucidrains / AMIE-pytorch
Implementation of the general framework for AMIE, from the paper "Towards Conversational Diagnostic AI", out of Google Deepmind
☆66Updated 10 months ago
PrithivirajDamodaran / vision-language-modelling-series
Companion Repo for the Vision Language Modelling YouTube series - https://bit.ly/3PsbsC2 - by Prithivi Da. Open to PRs and collaborations
☆14Updated 2 years ago
tascj / kaggle-feedback-prize-2021
Solution of Kaggle competition: Feedback Prize - Evaluating Student Writing
☆16Updated 3 years ago
fkodom / soft-mixture-of-experts
PyTorch implementation of Soft MoE by Google Brain in "From Sparse to Soft Mixtures of Experts" (https://arxiv.org/pdf/2308.00951.pdf)
☆75Updated last year
CMU-MultiComp-Lab / adv-mmml-course
☆36Updated last year
cogilab / Face
Implementation of "Face detection in untrained deep neural networks" (Baek et al., Nature Communications, 2021)
☆10Updated 3 years ago
Vedant-S / MLOps-Project
Projects completed under LinuxWorld Informatics Ltd. - MLOps Training.
☆12Updated 4 years ago
The-AI-Summer / simclr
An education step by step implementation of SimCLR that accompanies the blogpost
☆31Updated 3 years ago
lucidrains / zorro-pytorch
Implementation of Zorro, Masked Multimodal Transformer, in Pytorch
☆97Updated last year
The-AI-Summer / pytorch-ddp
code for the ddp tutorial
☆32Updated 3 years ago
slds-lmu / seminar_multimodal_dl
https://slds-lmu.github.io/seminar_multimodal_dl/
☆170Updated 2 years ago
azadyasar / NeuralMachineTranslation
PyTorch implementation of NMT models along with custom tokenizers, models, and datasets
☆20Updated 3 years ago
ekinakyurek / google-research
Google Research
☆46Updated 2 years ago
sayakpaul / count-tokens-hf-datasets
This project shows how to derive the total number of training tokens from a large text dataset from 🤗 datasets with Apache Beam and Data…
☆27Updated 2 years ago
elsevierlabs-os / clip-image-search
Fine-tuning OpenAI CLIP Model for Image Search on medical images
☆76Updated 3 years ago
philschmid / deep-learning-habana-huggingface
☆31Updated 2 years ago
tum-ai / number-token-loss
A regression-alike loss to improve numerical reasoning in language models
☆24Updated 3 weeks ago
fcakyon / video-transformers
Easiest way of fine-tuning HuggingFace video classification models
☆142Updated 2 years ago
jaketae / fnet
PyTorch implementation of FNet: Mixing Tokens with Fourier transforms
☆27Updated 4 years ago
archinetai / difformer-pytorch
Diffusion based transformer, in PyTorch (Experimental).
☆24Updated 2 years ago
jmisilo / clip-gpt-captioning
CLIPxGPT Captioner is Image Captioning Model based on OpenAI's CLIP and GPT-2.
☆117Updated 5 months ago
CMU-MultiComp-Lab / mmml-course
☆91Updated last year
Zefty / rag-end2end-retriever
☆20Updated 4 years ago
gchhablani / multilingual-image-captioning
☆44Updated 4 years ago