Vision CAIR Group, KAUST, supported by Mohamed Elhoseiny
39
Repositórios públicos
28.095
Total de estrelas
598
Seguidores
O Vision CAIR Research Group, da KAUST, possui uma presença pública significativa no GitHub, com uma ampla gama de repositórios focados em inteligência artificial e visão computacional. As principais linguagens utilizadas incluem Python e Jupyter Notebook, com projetos notáveis como MiniGPT-4 e ChatCaptioner, que são amplamente reconhecidos na comunidade de pesquisa.
Open-sourced codes for MiniGPT-4 and MiniGPT-v2 (https://minigpt-4.github.io, https://minigpt-v2.github.io/)
Official code for Goldfish model for long video understanding and MiniGPT4-video for short video understanding
Official Repository of ChatCaptioner
[ICML 2025] Official PyTorch implementation of LongVU
VisualGPT, CVPR 2022 Proceeding, GPT as a decoder for vision-language models
Open-sourced code of MiniGPT-Med
3DCoMPaT++: An improved large-scale 3D vision dataset for compositional recognition
Nenhuma descrição fornecida para este repositório.
Nenhuma descrição fornecida para este repositório.
Code for the paper: It is Okay to Not Be Okay: Overcoming Emotional Bias in Affective Image Captioning by Contrastive Data Collection
Nenhuma descrição fornecida para este repositório.
Document Haystacks: Vision-Language Reasoning Over Piles of 1000+ Documents, CVPR 2025
Official InfiniBench: A Benchmark for Large Multi-Modal Models in Long-Form Movies and TV Shows
Official repository for the 3DCoMPaT dataset (ECCV2022 Oral)
Nenhuma descrição fornecida para este repositório.
Nenhuma descrição fornecida para este repositório.
Creative AI for Visual Art and Music slides and demos.
Official repository of Action-Free Guide
Creative Walk Adversarial Networks: Novel Art Generation with Probabilistic Random Walk Deviation from Style Norms
Nenhuma descrição fornecida para este repositório.
Nenhuma descrição fornecida para este repositório.
CIZSL++: Creativity Inspired Generative Zero-Shot Learning. T-PAMI under review.
Code for Wölfflin Affective Generative Analysis paper published in ICCC 2021
CS326 Practical assignment #2: few-shot classification
Imaginative Walks: Generative Random Walk Deviation Loss for Improved Unseen Learning Representation. CVPR 2022 Workshop, ICCC 2022.
Nenhuma descrição fornecida para este repositório.
Nenhuma descrição fornecida para este repositório.
Nenhuma descrição fornecida para este repositório.
An Efficient and User-Friendly Scaling Library for Reinforcement Learning with Large Language Models
Nenhuma descrição fornecida para este repositório.
Nenhuma descrição fornecida para este repositório.
Nenhuma descrição fornecida para este repositório.
Nenhuma descrição fornecida para este repositório.
VisionCAIR Zero-Shot Learning Research
VisionCAIR Affective and Creative AI Research
Nenhuma descrição fornecida para este repositório.
Nenhuma descrição fornecida para este repositório.
Creativity Inspired Zero-Shot Learning
Generator loss to reduce mode-collapse and to improve the generated samples quality.
O Vision-CAIR desenvolve uma variedade de projetos relacionados à inteligência artificial, incluindo repositórios como MiniGPT-4 e ChatCaptioner. Esses projetos incluem códigos abertos para modelos avançados de compreensão de vídeo e legendagem de imagens.
O Vision-CAIR utiliza principalmente Python e Jupyter Notebook em seus projetos, além de HTML e JavaScript. Essas linguagens são adequadas para o desenvolvimento de algoritmos e ferramentas em inteligência artificial e aprendizado de máquina.
Sim, todos os repositórios do Vision-CAIR são públicos no GitHub. Isso permite que a comunidade acesse e colabore em projetos de pesquisa, promovendo transparência e inovação na área de inteligência artificial.
Monitore Vision CAIR Research Group, KAUST com o RepoGuard e receba alertas no momento em que um novo repositório público aparecer.
Monitore esta conta