Computer Vision and Learning research group at Ludwig Maximilian University of Munich (formerly Computer Vision Group at Heidelberg University)
62
Publiczne repozytoria
100 472
Łączna liczba gwiazdek
4404
Obserwujący
CompVis to grupa badawcza zajmująca się wizją komputerową i uczeniem maszynowym, z siedzibą na Uniwersytecie Ludwika Maksymiliana w Monachium. Ich publiczna obecność na GitHubie obejmuje różnorodne repozytoria, w tym znane projekty takie jak stable-diffusion i latent-diffusion, wykorzystujące głównie języki Python oraz Jupyter Notebook.
A latent text-to-image diffusion model
High-Resolution Image Synthesis with Latent Diffusion Models
Taming Transformers for High-Resolution Image Synthesis
[AAAI 2025, Oral] DepthFM: Fast Monocular Depth Estimation with Flow Matching
source code for the ECCV18 paper A Style-Aware Content Loss for Real-time HD Style Transfer
[CVPR 2026] A PyTorch implementation of the paper "EDGS: Eliminating Densification for Efficient Convergence of 3DGS"
A generative model conditioned on shape and appearance.
Is a geometric model required to synthesize novel views from a single image?
A PyTorch implementation of the paper "ZigMa: A DiT-Style Mamba-based Diffusion Model" (ECCV 2024)
Source code for the paper "Divide and Conquer the Embedding Space for Metric Learning", CVPR 2019
[ECCV 2024, Oral] FMBoost: Boosting Latent Diffusion with Flow Matching
Network-to-Network Translation with Conditional Invertible Neural Networks
Implementation of Stochastic Image-to-Video Synthesis using cINNs.
Brak opisu dla tego repozytorium.
TensorFlow implementation of our CVPR 2021 Paper "Rethinking Style Transfer: From Pixels to Parameterized Brushstrokes".
Official codebase for the Paper “Retrieval-Augmented Diffusion Models”
Fine-Grained Subject-Specific Attribute Expression Control in T2I Models
Brak opisu dla tego repozytorium.
Brak opisu dla tego repozytorium.
ImageBART: Bidirectional Context with Multinomial Diffusion for Autoregressive Image Synthesis
The official implementation of "[MASK] is All You Need"
A Disentangling Invertible Interpretation Network
[CVPR 2025] Diff2Flow: Training Flow Matching Models via Diffusion Model Alignment
Content and Style Disentanglement for Artistic Style Transfer [ICCV19]
[CVPR 2026] Denoising, Fast and Slow: Difficulty-Aware Adaptive Sampling for Image Generation
Brak opisu dla tego repozytorium.
[ICLR 2026] Adapting Self-Supervised Representations as a Latent Space for Efficient Generation
Making Sense of CNNs: Interpreting Deep Representations & Their Invariances with Invertible Neural Networks
Brak opisu dla tego repozytorium.
Brak opisu dla tego repozytorium.
iPOKE: Poking a Still Image for Controlled Stochastic Video Synthesis
[ICCV 2025] SCFlow: Implicitly Learning Style and Content Disentanglement with Flow Models
Brak opisu dla tego repozytorium.
Brak opisu dla tego repozytorium.
[WACV 2025] DistillDIFT: Distillation of Diffusion Features for Semantic Correspondence
Code for GCPR 2020 Oral : "Unsupervised Part Discovery by Unsupervised Disentanglement"
Brak opisu dla tego repozytorium.
[NeurIPS 2025] DisMo: DIsentangled Motion Representations for Open-World Motion Transfer
MaskFlow: Discrete Flows For Flexible and Efficient Long Video Generation
Brak opisu dla tego repozytorium.
[AAAI 2025] Does VLM Classification Benefit from LLM Description Semantics?
Unsupervised Robust Disentangling of Latent Characteristics for Image Synthesis
Content Transformation Block For Image Style Transfer [CVPR19]
Source code for the paper "Improving Deep Metric Learning byDivide and Conquer"
Dataset provided with the article "Deep learning for cuneiform sign detection with weak supervision using transliteration alignment". It comprises image references, transliterations and sign annotations of clay tablets from the Neo-Assyrian epoch.
Visual search interface
Code for the article "Deep learning of cuneiform sign detection with weak supervision using transliteration alignment"
Towards Learning a Realistic Rendering of Human Behavior
Unsupervised Magnification of Posture Deviations Across Subjects
[CVPR 2026] Probabilistic Precipitation Nowcasting with Rectified Flow Transformers
[ICCV 2025] Stochastic Interpolants for Revealing Stylistic Flows across the History of Art
Landing point for "Envisioning the Future, One Step at a Time"
Brak opisu dla tego repozytorium.
Official project page for the paper "WaSt-3D: Wasserstein-2 Distance for Scene-to-Scene Stylization on 3D Gaussians"
Brak opisu dla tego repozytorium.
Source Code + Documentation of our Automatic Behavior Analysis Software
Code for demo web application of the article "Deep learning for cuneiform sign detection with weak supervision using transliteration alignment".
Brak opisu dla tego repozytorium.
Brak opisu dla tego repozytorium.
Code for our paper "CliqueCNN: Deep Unsupervised Exemplar Learning" https://arxiv.org/abs/1608.08792
Deep Unsupervised Similarity Learning using Partially Ordered Sets (CVPR17)
The official implementation of "[MASK] is All You Need"
CompVis tworzy różnorodne projekty związane z wizją komputerową i uczeniem maszynowym. Wśród ich repozytoriów znajdują się takie projekty jak stable-diffusion oraz taming-transformers, które są szeroko wykorzystywane w badaniach i aplikacjach.
CompVis najczęściej używa języków Python i Jupyter Notebook. Inne języki, które pojawiają się w ich repozytoriach, to JavaScript, HTML, Matlab oraz CSS, co wskazuje na ich wszechstronność w obszarze programowania.
Tak, wszystkie repozytoria CompVis są publiczne. Umożliwia to innym badaczom i programistom dostęp do ich kodu źródłowego oraz narzędzi, co sprzyja współpracy i rozwojowi w dziedzinie wizji komputerowej.
Monitoruj CompVis - Computer Vision and Learning LMU Munich z RepoGuard i otrzymuj powiadomienia w momencie, gdy pojawi się nowe publiczne repozytorium.
Monitoruj to konto