Vision CAIR Group, KAUST, supported by Mohamed Elhoseiny
39
Repositorios públicos
28.095
Total de estrellas
598
Seguidores
El grupo de investigación Vision CAIR, asociado a KAUST, mantiene una presencia activa en GitHub con una amplia gama de repositorios públicos. Utilizando principalmente Python y Jupyter Notebook, sus proyectos notables incluyen MiniGPT-4 y ChatCaptioner, que son utilizados en la investigación y el desarrollo en el campo de la inteligencia artificial y el procesamiento de video.
Open-sourced codes for MiniGPT-4 and MiniGPT-v2 (https://minigpt-4.github.io, https://minigpt-v2.github.io/)
Official code for Goldfish model for long video understanding and MiniGPT4-video for short video understanding
Official Repository of ChatCaptioner
[ICML 2025] Official PyTorch implementation of LongVU
VisualGPT, CVPR 2022 Proceeding, GPT as a decoder for vision-language models
Open-sourced code of MiniGPT-Med
3DCoMPaT++: An improved large-scale 3D vision dataset for compositional recognition
No se proporcionó descripción para este repositorio.
No se proporcionó descripción para este repositorio.
Code for the paper: It is Okay to Not Be Okay: Overcoming Emotional Bias in Affective Image Captioning by Contrastive Data Collection
No se proporcionó descripción para este repositorio.
Document Haystacks: Vision-Language Reasoning Over Piles of 1000+ Documents, CVPR 2025
Official InfiniBench: A Benchmark for Large Multi-Modal Models in Long-Form Movies and TV Shows
Official repository for the 3DCoMPaT dataset (ECCV2022 Oral)
No se proporcionó descripción para este repositorio.
No se proporcionó descripción para este repositorio.
Creative AI for Visual Art and Music slides and demos.
Official repository of Action-Free Guide
Creative Walk Adversarial Networks: Novel Art Generation with Probabilistic Random Walk Deviation from Style Norms
No se proporcionó descripción para este repositorio.
No se proporcionó descripción para este repositorio.
CIZSL++: Creativity Inspired Generative Zero-Shot Learning. T-PAMI under review.
Code for Wölfflin Affective Generative Analysis paper published in ICCC 2021
CS326 Practical assignment #2: few-shot classification
Imaginative Walks: Generative Random Walk Deviation Loss for Improved Unseen Learning Representation. CVPR 2022 Workshop, ICCC 2022.
No se proporcionó descripción para este repositorio.
No se proporcionó descripción para este repositorio.
No se proporcionó descripción para este repositorio.
An Efficient and User-Friendly Scaling Library for Reinforcement Learning with Large Language Models
No se proporcionó descripción para este repositorio.
No se proporcionó descripción para este repositorio.
No se proporcionó descripción para este repositorio.
No se proporcionó descripción para este repositorio.
VisionCAIR Zero-Shot Learning Research
VisionCAIR Affective and Creative AI Research
No se proporcionó descripción para este repositorio.
No se proporcionó descripción para este repositorio.
Creativity Inspired Zero-Shot Learning
Generator loss to reduce mode-collapse and to improve the generated samples quality.
Vision-CAIR desarrolla herramientas y modelos relacionados con la inteligencia artificial y la comprensión de video. Sus repositorios incluyen proyectos como MiniGPT-4 y LongVU, que son relevantes para la investigación en visión por computadora.
La organización Vision-CAIR utiliza principalmente Python y Jupyter Notebook para sus proyectos en GitHub. También emplean HTML y JavaScript en algunos de sus repositorios, lo que refleja su enfoque en la investigación y el desarrollo de software.
Sí, todos los repositorios de Vision-CAIR son públicos en GitHub. Esto permite a otros investigadores y desarrolladores acceder a sus códigos y contribuciones en el ámbito de la inteligencia artificial y el análisis de video.
Monitorea a Vision CAIR Research Group, KAUST con RepoGuard y recibe alertas en el momento en que aparece un nuevo repositorio público.
Monitorea esta cuenta