Vision CAIR Group, KAUST, supported by Mohamed Elhoseiny
39
公開リポジトリ
28,095
合計スター
598
フォロワー
Vision-CAIRは、KAUSTにおける研究グループであり、GitHub上には多様なリポジトリがあります。主にPythonやJupyter Notebookを使用しており、MiniGPT-4やChatCaptionerなどの注目されるプロジェクトを公開しています。これにより、研究成果を広く共有し、コミュニティへの貢献を行っています。
Open-sourced codes for MiniGPT-4 and MiniGPT-v2 (https://minigpt-4.github.io, https://minigpt-v2.github.io/)
Official code for Goldfish model for long video understanding and MiniGPT4-video for short video understanding
Official Repository of ChatCaptioner
[ICML 2025] Official PyTorch implementation of LongVU
VisualGPT, CVPR 2022 Proceeding, GPT as a decoder for vision-language models
Open-sourced code of MiniGPT-Med
3DCoMPaT++: An improved large-scale 3D vision dataset for compositional recognition
このリポジトリに関する説明は提供されていません。
このリポジトリに関する説明は提供されていません。
Code for the paper: It is Okay to Not Be Okay: Overcoming Emotional Bias in Affective Image Captioning by Contrastive Data Collection
このリポジトリに関する説明は提供されていません。
Document Haystacks: Vision-Language Reasoning Over Piles of 1000+ Documents, CVPR 2025
Official InfiniBench: A Benchmark for Large Multi-Modal Models in Long-Form Movies and TV Shows
Official repository for the 3DCoMPaT dataset (ECCV2022 Oral)
このリポジトリに関する説明は提供されていません。
このリポジトリに関する説明は提供されていません。
Creative AI for Visual Art and Music slides and demos.
Official repository of Action-Free Guide
Creative Walk Adversarial Networks: Novel Art Generation with Probabilistic Random Walk Deviation from Style Norms
このリポジトリに関する説明は提供されていません。
このリポジトリに関する説明は提供されていません。
CIZSL++: Creativity Inspired Generative Zero-Shot Learning. T-PAMI under review.
Code for Wölfflin Affective Generative Analysis paper published in ICCC 2021
CS326 Practical assignment #2: few-shot classification
Imaginative Walks: Generative Random Walk Deviation Loss for Improved Unseen Learning Representation. CVPR 2022 Workshop, ICCC 2022.
このリポジトリに関する説明は提供されていません。
このリポジトリに関する説明は提供されていません。
このリポジトリに関する説明は提供されていません。
An Efficient and User-Friendly Scaling Library for Reinforcement Learning with Large Language Models
このリポジトリに関する説明は提供されていません。
このリポジトリに関する説明は提供されていません。
このリポジトリに関する説明は提供されていません。
このリポジトリに関する説明は提供されていません。
VisionCAIR Zero-Shot Learning Research
VisionCAIR Affective and Creative AI Research
このリポジトリに関する説明は提供されていません。
このリポジトリに関する説明は提供されていません。
Creativity Inspired Zero-Shot Learning
Generator loss to reduce mode-collapse and to improve the generated samples quality.
Vision-CAIRは、主に機械学習やコンピュータビジョンに関連するリポジトリを作成しています。特にMiniGPT-4やChatCaptionerなどのプロジェクトがあり、これらは広く利用されています。
Vision-CAIRは主にPythonやJupyter Notebook、HTML、JavaScriptを使用しています。これらの言語は、彼らの研究と開発の基盤を支えています。
はい、Vision-CAIRのリポジトリは全て公開されています。これにより、他の研究者や開発者が彼らの成果を利用し、コラボレーションすることが可能です。