Computer Vision and Learning research group at Ludwig Maximilian University of Munich (formerly Computer Vision Group at Heidelberg University)
62
Kho lưu trữ công khai
100.472
Tổng số sao
4.404
Người theo dõi
CompVis là một tổ chức nghiên cứu tại Đại học Ludwig Maximilian Munich, chuyên về thị giác máy tính và học máy. Tại GitHub, tổ chức này có nhiều kho lưu trữ công khai sử dụng các ngôn ngữ như Python, Jupyter Notebook và JavaScript, với các dự án nổi bật như stable-diffusion và latent-diffusion.
A latent text-to-image diffusion model
High-Resolution Image Synthesis with Latent Diffusion Models
Taming Transformers for High-Resolution Image Synthesis
[AAAI 2025, Oral] DepthFM: Fast Monocular Depth Estimation with Flow Matching
source code for the ECCV18 paper A Style-Aware Content Loss for Real-time HD Style Transfer
[CVPR 2026] A PyTorch implementation of the paper "EDGS: Eliminating Densification for Efficient Convergence of 3DGS"
A generative model conditioned on shape and appearance.
Is a geometric model required to synthesize novel views from a single image?
A PyTorch implementation of the paper "ZigMa: A DiT-Style Mamba-based Diffusion Model" (ECCV 2024)
Source code for the paper "Divide and Conquer the Embedding Space for Metric Learning", CVPR 2019
[ECCV 2024, Oral] FMBoost: Boosting Latent Diffusion with Flow Matching
Network-to-Network Translation with Conditional Invertible Neural Networks
Implementation of Stochastic Image-to-Video Synthesis using cINNs.
Không có mô tả nào được cung cấp cho kho lưu trữ này.
TensorFlow implementation of our CVPR 2021 Paper "Rethinking Style Transfer: From Pixels to Parameterized Brushstrokes".
Official codebase for the Paper “Retrieval-Augmented Diffusion Models”
Fine-Grained Subject-Specific Attribute Expression Control in T2I Models
Không có mô tả nào được cung cấp cho kho lưu trữ này.
Không có mô tả nào được cung cấp cho kho lưu trữ này.
ImageBART: Bidirectional Context with Multinomial Diffusion for Autoregressive Image Synthesis
The official implementation of "[MASK] is All You Need"
A Disentangling Invertible Interpretation Network
[CVPR 2025] Diff2Flow: Training Flow Matching Models via Diffusion Model Alignment
Content and Style Disentanglement for Artistic Style Transfer [ICCV19]
[CVPR 2026] Denoising, Fast and Slow: Difficulty-Aware Adaptive Sampling for Image Generation
Không có mô tả nào được cung cấp cho kho lưu trữ này.
[ICLR 2026] Adapting Self-Supervised Representations as a Latent Space for Efficient Generation
Making Sense of CNNs: Interpreting Deep Representations & Their Invariances with Invertible Neural Networks
Không có mô tả nào được cung cấp cho kho lưu trữ này.
Không có mô tả nào được cung cấp cho kho lưu trữ này.
iPOKE: Poking a Still Image for Controlled Stochastic Video Synthesis
[ICCV 2025] SCFlow: Implicitly Learning Style and Content Disentanglement with Flow Models
Không có mô tả nào được cung cấp cho kho lưu trữ này.
Không có mô tả nào được cung cấp cho kho lưu trữ này.
[WACV 2025] DistillDIFT: Distillation of Diffusion Features for Semantic Correspondence
Code for GCPR 2020 Oral : "Unsupervised Part Discovery by Unsupervised Disentanglement"
Không có mô tả nào được cung cấp cho kho lưu trữ này.
[NeurIPS 2025] DisMo: DIsentangled Motion Representations for Open-World Motion Transfer
MaskFlow: Discrete Flows For Flexible and Efficient Long Video Generation
Không có mô tả nào được cung cấp cho kho lưu trữ này.
[AAAI 2025] Does VLM Classification Benefit from LLM Description Semantics?
Unsupervised Robust Disentangling of Latent Characteristics for Image Synthesis
Content Transformation Block For Image Style Transfer [CVPR19]
Source code for the paper "Improving Deep Metric Learning byDivide and Conquer"
Dataset provided with the article "Deep learning for cuneiform sign detection with weak supervision using transliteration alignment". It comprises image references, transliterations and sign annotations of clay tablets from the Neo-Assyrian epoch.
Visual search interface
Code for the article "Deep learning of cuneiform sign detection with weak supervision using transliteration alignment"
Towards Learning a Realistic Rendering of Human Behavior
Unsupervised Magnification of Posture Deviations Across Subjects
[CVPR 2026] Probabilistic Precipitation Nowcasting with Rectified Flow Transformers
[ICCV 2025] Stochastic Interpolants for Revealing Stylistic Flows across the History of Art
Landing point for "Envisioning the Future, One Step at a Time"
Không có mô tả nào được cung cấp cho kho lưu trữ này.
Official project page for the paper "WaSt-3D: Wasserstein-2 Distance for Scene-to-Scene Stylization on 3D Gaussians"
Không có mô tả nào được cung cấp cho kho lưu trữ này.
Source Code + Documentation of our Automatic Behavior Analysis Software
Code for demo web application of the article "Deep learning for cuneiform sign detection with weak supervision using transliteration alignment".
Không có mô tả nào được cung cấp cho kho lưu trữ này.
Không có mô tả nào được cung cấp cho kho lưu trữ này.
Code for our paper "CliqueCNN: Deep Unsupervised Exemplar Learning" https://arxiv.org/abs/1608.08792
Deep Unsupervised Similarity Learning using Partially Ordered Sets (CVPR17)
The official implementation of "[MASK] is All You Need"
CompVis phát triển nhiều kho lưu trữ liên quan đến thị giác máy tính và học máy, bao gồm các dự án nổi bật như stable-diffusion và latent-diffusion, giúp tạo ra hình ảnh từ văn bản và tổng hợp hình ảnh độ phân giải cao.
CompVis sử dụng một loạt các ngôn ngữ lập trình như Python, Jupyter Notebook, JavaScript, HTML, Matlab và CSS trong các dự án của mình để phát triển các giải pháp và mô hình cho thị giác máy tính.
Có, tất cả các kho lưu trữ của CompVis đều là công khai trên GitHub, cho phép cộng đồng truy cập và sử dụng các mã nguồn và tài liệu nghiên cứu trong lĩnh vực thị giác máy tính.
Theo dõi CompVis - Computer Vision and Learning LMU Munich với RepoGuard và nhận cảnh báo ngay khi có kho lưu trữ công khai mới xuất hiện.
Theo dõi tài khoản này