Vision CAIR Group, KAUST, supported by Mohamed Elhoseiny
39
Dépôts publics
28 095
Total des étoiles
598
Abonnés
Le groupe Vision CAIR, basé à KAUST, a une présence active sur GitHub avec un large éventail de dépôts publics. Leurs projets se concentrent principalement sur des domaines tels que l'intelligence artificielle et la vision par ordinateur, utilisant des langages tels que Python et Jupyter Notebook. Parmi leurs dépôts notables figurent MiniGPT-4 et ChatCaptioner.
Open-sourced codes for MiniGPT-4 and MiniGPT-v2 (https://minigpt-4.github.io, https://minigpt-v2.github.io/)
Official code for Goldfish model for long video understanding and MiniGPT4-video for short video understanding
Official Repository of ChatCaptioner
[ICML 2025] Official PyTorch implementation of LongVU
VisualGPT, CVPR 2022 Proceeding, GPT as a decoder for vision-language models
Open-sourced code of MiniGPT-Med
3DCoMPaT++: An improved large-scale 3D vision dataset for compositional recognition
Aucune description fournie pour ce dépôt.
Aucune description fournie pour ce dépôt.
Code for the paper: It is Okay to Not Be Okay: Overcoming Emotional Bias in Affective Image Captioning by Contrastive Data Collection
Aucune description fournie pour ce dépôt.
Document Haystacks: Vision-Language Reasoning Over Piles of 1000+ Documents, CVPR 2025
Official InfiniBench: A Benchmark for Large Multi-Modal Models in Long-Form Movies and TV Shows
Official repository for the 3DCoMPaT dataset (ECCV2022 Oral)
Aucune description fournie pour ce dépôt.
Aucune description fournie pour ce dépôt.
Creative AI for Visual Art and Music slides and demos.
Official repository of Action-Free Guide
Creative Walk Adversarial Networks: Novel Art Generation with Probabilistic Random Walk Deviation from Style Norms
Aucune description fournie pour ce dépôt.
Aucune description fournie pour ce dépôt.
CIZSL++: Creativity Inspired Generative Zero-Shot Learning. T-PAMI under review.
Code for Wölfflin Affective Generative Analysis paper published in ICCC 2021
CS326 Practical assignment #2: few-shot classification
Imaginative Walks: Generative Random Walk Deviation Loss for Improved Unseen Learning Representation. CVPR 2022 Workshop, ICCC 2022.
Aucune description fournie pour ce dépôt.
Aucune description fournie pour ce dépôt.
Aucune description fournie pour ce dépôt.
An Efficient and User-Friendly Scaling Library for Reinforcement Learning with Large Language Models
Aucune description fournie pour ce dépôt.
Aucune description fournie pour ce dépôt.
Aucune description fournie pour ce dépôt.
Aucune description fournie pour ce dépôt.
VisionCAIR Zero-Shot Learning Research
VisionCAIR Affective and Creative AI Research
Aucune description fournie pour ce dépôt.
Aucune description fournie pour ce dépôt.
Creativity Inspired Zero-Shot Learning
Generator loss to reduce mode-collapse and to improve the generated samples quality.
Vision-CAIR développe plusieurs projets open source sur GitHub, notamment MiniGPT-4, MiniGPT4-video et ChatCaptioner, qui sont orientés vers l'intelligence artificielle et la compréhension vidéo.
Vision-CAIR utilise principalement Python et Jupyter Notebook pour le développement de ses projets, ainsi que HTML et JavaScript pour certains de ses dépôts, reflétant une diversité dans les applications technologiques.
Oui, tous les dépôts de Vision-CAIR sur GitHub sont publics, permettant à la communauté d'accéder à leur code source et de contribuer à leurs projets open source.
Surveillez Vision CAIR Research Group, KAUST avec RepoGuard et soyez alerté dès qu'un nouveau dépôt public apparaît.
Surveiller ce compte