Vision CAIR Group, KAUST, supported by Mohamed Elhoseiny
39
Publiczne repozytoria
28 095
Łączna liczba gwiazdek
598
Obserwujący
Organizacja Vision CAIR Research Group z KAUST aktywnie rozwija swoją obecność na GitHubie, publikując różnorodne repozytoria w takich językach jak Python, Jupyter Notebook, HTML i JavaScript. Wśród jej projektów znajdują się znane repozytoria, takie jak MiniGPT-4 oraz ChatCaptioner, które mają na celu wspieranie badań w obszarze przetwarzania obrazów i rozumienia języka naturalnego.
Open-sourced codes for MiniGPT-4 and MiniGPT-v2 (https://minigpt-4.github.io, https://minigpt-v2.github.io/)
Official code for Goldfish model for long video understanding and MiniGPT4-video for short video understanding
Official Repository of ChatCaptioner
[ICML 2025] Official PyTorch implementation of LongVU
VisualGPT, CVPR 2022 Proceeding, GPT as a decoder for vision-language models
Open-sourced code of MiniGPT-Med
3DCoMPaT++: An improved large-scale 3D vision dataset for compositional recognition
Brak opisu dla tego repozytorium.
Brak opisu dla tego repozytorium.
Code for the paper: It is Okay to Not Be Okay: Overcoming Emotional Bias in Affective Image Captioning by Contrastive Data Collection
Brak opisu dla tego repozytorium.
Document Haystacks: Vision-Language Reasoning Over Piles of 1000+ Documents, CVPR 2025
Official InfiniBench: A Benchmark for Large Multi-Modal Models in Long-Form Movies and TV Shows
Official repository for the 3DCoMPaT dataset (ECCV2022 Oral)
Brak opisu dla tego repozytorium.
Brak opisu dla tego repozytorium.
Creative AI for Visual Art and Music slides and demos.
Official repository of Action-Free Guide
Creative Walk Adversarial Networks: Novel Art Generation with Probabilistic Random Walk Deviation from Style Norms
Brak opisu dla tego repozytorium.
Brak opisu dla tego repozytorium.
CIZSL++: Creativity Inspired Generative Zero-Shot Learning. T-PAMI under review.
Code for Wölfflin Affective Generative Analysis paper published in ICCC 2021
CS326 Practical assignment #2: few-shot classification
Imaginative Walks: Generative Random Walk Deviation Loss for Improved Unseen Learning Representation. CVPR 2022 Workshop, ICCC 2022.
Brak opisu dla tego repozytorium.
Brak opisu dla tego repozytorium.
Brak opisu dla tego repozytorium.
An Efficient and User-Friendly Scaling Library for Reinforcement Learning with Large Language Models
Brak opisu dla tego repozytorium.
Brak opisu dla tego repozytorium.
Brak opisu dla tego repozytorium.
Brak opisu dla tego repozytorium.
VisionCAIR Zero-Shot Learning Research
VisionCAIR Affective and Creative AI Research
Brak opisu dla tego repozytorium.
Brak opisu dla tego repozytorium.
Creativity Inspired Zero-Shot Learning
Generator loss to reduce mode-collapse and to improve the generated samples quality.
Vision-CAIR koncentruje się na badaniach związanych z przetwarzaniem obrazów i sztuczną inteligencją. Na GitHubie publikują wiele projektów, w tym MiniGPT-4 oraz ChatCaptioner, które przyczyniają się do rozwoju technologii związanych z wizją komputerową.
Główne języki programowania używane przez Vision-CAIR to Python i Jupyter Notebook, a także HTML i JavaScript. Te języki są kluczowe dla ich projektów badawczych i rozwojowych.
Tak, wszystkie repozytoria Vision-CAIR są publiczne. Dzięki temu, każdy może uzyskać dostęp do ich kodu i zasobów, co sprzyja współpracy oraz wymianie wiedzy w społeczności badawczej.
Monitoruj Vision CAIR Research Group, KAUST z RepoGuard i otrzymuj powiadomienia w momencie, gdy pojawi się nowe publiczne repozytorium.
Monitoruj to konto