Vision CAIR Group, KAUST, supported by Mohamed Elhoseiny
39
Kho lưu trữ công khai
28.095
Tổng số sao
598
Người theo dõi
Vision-CAIR là một tổ chức nghiên cứu nổi bật trên GitHub, với nhiều kho mã nguồn công khai. Tổ chức này chủ yếu sử dụng Python, Jupyter Notebook, HTML và JavaScript, và có một loạt các dự án đáng chú ý như MiniGPT-4, LongVU và ChatCaptioner, phục vụ cho các nghiên cứu trong lĩnh vực trí tuệ nhân tạo và xử lý ngôn ngữ tự nhiên.
Open-sourced codes for MiniGPT-4 and MiniGPT-v2 (https://minigpt-4.github.io, https://minigpt-v2.github.io/)
Official code for Goldfish model for long video understanding and MiniGPT4-video for short video understanding
Official Repository of ChatCaptioner
[ICML 2025] Official PyTorch implementation of LongVU
VisualGPT, CVPR 2022 Proceeding, GPT as a decoder for vision-language models
Open-sourced code of MiniGPT-Med
3DCoMPaT++: An improved large-scale 3D vision dataset for compositional recognition
Không có mô tả nào được cung cấp cho kho lưu trữ này.
Không có mô tả nào được cung cấp cho kho lưu trữ này.
Code for the paper: It is Okay to Not Be Okay: Overcoming Emotional Bias in Affective Image Captioning by Contrastive Data Collection
Không có mô tả nào được cung cấp cho kho lưu trữ này.
Document Haystacks: Vision-Language Reasoning Over Piles of 1000+ Documents, CVPR 2025
Official InfiniBench: A Benchmark for Large Multi-Modal Models in Long-Form Movies and TV Shows
Official repository for the 3DCoMPaT dataset (ECCV2022 Oral)
Không có mô tả nào được cung cấp cho kho lưu trữ này.
Không có mô tả nào được cung cấp cho kho lưu trữ này.
Creative AI for Visual Art and Music slides and demos.
Official repository of Action-Free Guide
Creative Walk Adversarial Networks: Novel Art Generation with Probabilistic Random Walk Deviation from Style Norms
Không có mô tả nào được cung cấp cho kho lưu trữ này.
Không có mô tả nào được cung cấp cho kho lưu trữ này.
CIZSL++: Creativity Inspired Generative Zero-Shot Learning. T-PAMI under review.
Code for Wölfflin Affective Generative Analysis paper published in ICCC 2021
CS326 Practical assignment #2: few-shot classification
Imaginative Walks: Generative Random Walk Deviation Loss for Improved Unseen Learning Representation. CVPR 2022 Workshop, ICCC 2022.
Không có mô tả nào được cung cấp cho kho lưu trữ này.
Không có mô tả nào được cung cấp cho kho lưu trữ này.
Không có mô tả nào được cung cấp cho kho lưu trữ này.
An Efficient and User-Friendly Scaling Library for Reinforcement Learning with Large Language Models
Không có mô tả nào được cung cấp cho kho lưu trữ này.
Không có mô tả nào được cung cấp cho kho lưu trữ này.
Không có mô tả nào được cung cấp cho kho lưu trữ này.
Không có mô tả nào được cung cấp cho kho lưu trữ này.
VisionCAIR Zero-Shot Learning Research
VisionCAIR Affective and Creative AI Research
Không có mô tả nào được cung cấp cho kho lưu trữ này.
Không có mô tả nào được cung cấp cho kho lưu trữ này.
Creativity Inspired Zero-Shot Learning
Generator loss to reduce mode-collapse and to improve the generated samples quality.
Vision-CAIR phát triển một loạt các dự án mã nguồn mở trên GitHub, bao gồm MiniGPT-4, LongVU và ChatCaptioner, tập trung vào trí tuệ nhân tạo và xử lý ngôn ngữ tự nhiên.
Vision-CAIR chủ yếu sử dụng Python, Jupyter Notebook, HTML và JavaScript để phát triển các kho mã nguồn của mình, phù hợp với nhu cầu nghiên cứu và phát triển trong lĩnh vực công nghệ.
Có, tất cả các kho mã của Vision-CAIR đều được công khai trên GitHub, cho phép cộng đồng nghiên cứu và phát triển truy cập và đóng góp vào các dự án của họ.
Theo dõi Vision CAIR Research Group, KAUST với RepoGuard và nhận cảnh báo ngay khi có kho lưu trữ công khai mới xuất hiện.
Theo dõi tài khoản này