Vision CAIR Group, KAUST, supported by Mohamed Elhoseiny
39
Öffentliche Repositories
28.095
Sterne gesamt
598
Follower
Die Vision CAIR Research Group, KAUST, hat eine bedeutende Präsenz auf GitHub mit einer Vielzahl an öffentlichen Repositories. Die Hauptprogrammiersprachen sind Python, Jupyter Notebook, HTML und JavaScript. Zu den bemerkenswerten Projekten gehören MiniGPT-4, ChatCaptioner und LongVU, die zur Förderung von Forschung und Entwicklung im Bereich der KI beitragen.
Open-sourced codes for MiniGPT-4 and MiniGPT-v2 (https://minigpt-4.github.io, https://minigpt-v2.github.io/)
Official code for Goldfish model for long video understanding and MiniGPT4-video for short video understanding
Official Repository of ChatCaptioner
[ICML 2025] Official PyTorch implementation of LongVU
VisualGPT, CVPR 2022 Proceeding, GPT as a decoder for vision-language models
Open-sourced code of MiniGPT-Med
3DCoMPaT++: An improved large-scale 3D vision dataset for compositional recognition
Keine Beschreibung für dieses Repository vorhanden.
Keine Beschreibung für dieses Repository vorhanden.
Code for the paper: It is Okay to Not Be Okay: Overcoming Emotional Bias in Affective Image Captioning by Contrastive Data Collection
Keine Beschreibung für dieses Repository vorhanden.
Document Haystacks: Vision-Language Reasoning Over Piles of 1000+ Documents, CVPR 2025
Official InfiniBench: A Benchmark for Large Multi-Modal Models in Long-Form Movies and TV Shows
Official repository for the 3DCoMPaT dataset (ECCV2022 Oral)
Keine Beschreibung für dieses Repository vorhanden.
Keine Beschreibung für dieses Repository vorhanden.
Creative AI for Visual Art and Music slides and demos.
Official repository of Action-Free Guide
Creative Walk Adversarial Networks: Novel Art Generation with Probabilistic Random Walk Deviation from Style Norms
Keine Beschreibung für dieses Repository vorhanden.
Keine Beschreibung für dieses Repository vorhanden.
CIZSL++: Creativity Inspired Generative Zero-Shot Learning. T-PAMI under review.
Code for Wölfflin Affective Generative Analysis paper published in ICCC 2021
CS326 Practical assignment #2: few-shot classification
Imaginative Walks: Generative Random Walk Deviation Loss for Improved Unseen Learning Representation. CVPR 2022 Workshop, ICCC 2022.
Keine Beschreibung für dieses Repository vorhanden.
Keine Beschreibung für dieses Repository vorhanden.
Keine Beschreibung für dieses Repository vorhanden.
An Efficient and User-Friendly Scaling Library for Reinforcement Learning with Large Language Models
Keine Beschreibung für dieses Repository vorhanden.
Keine Beschreibung für dieses Repository vorhanden.
Keine Beschreibung für dieses Repository vorhanden.
Keine Beschreibung für dieses Repository vorhanden.
VisionCAIR Zero-Shot Learning Research
VisionCAIR Affective and Creative AI Research
Keine Beschreibung für dieses Repository vorhanden.
Keine Beschreibung für dieses Repository vorhanden.
Creativity Inspired Zero-Shot Learning
Generator loss to reduce mode-collapse and to improve the generated samples quality.
Vision-CAIR entwickelt eine Reihe von Projekten, die sich auf künstliche Intelligenz und maschinelles Lernen konzentrieren. Zu den Hauptprojekten gehören MiniGPT-4 für generative Modelle und ChatCaptioner für die Verarbeitung von Bildbeschriftungen.
Die Vision CAIR Research Group nutzt hauptsächlich Python und Jupyter Notebook für ihre Projekte. Auch HTML und JavaScript finden Anwendung, insbesondere in Web-basierten Anwendungen und Visualisierungen.
Ja, alle Repositories von Vision-CAIR sind öffentlich zugänglich. Dies ermöglicht es der Gemeinschaft, auf die entwickelten Codes zuzugreifen und diese für eigene Forschungs- und Entwicklungsprojekte zu nutzen.
Überwache Vision CAIR Research Group, KAUST mit RepoGuard und werde benachrichtigt, sobald ein neues öffentliches Repository auftaucht.
Diesen Account überwachen