KI-Modelle wie ChatGPT oder Stable Diffusion müssen längst nicht mehr zwingend in der Cloud laufen. Im Jahr 2026 ist es problemlos möglich, leistungsfähige Sprach- und Bildmodelle direkt auf dem heimischen Windows-PC zu betreiben – und das nicht nur mit NVIDIA-, sondern dank des aktuellen Adrenalin-Treibers (Version 26.1.1) auch komfortabel mit AMD-Grafikkarten.
Im Video erklären wir zunächst die wichtigsten Grundlagen: Was bedeuten Parameter, wie viel Speicher braucht ein Modell wirklich und warum ist Quantisierung der Schlüssel, um auch mit 16 GB VRAM ordentliche Ergebnisse zu erzielen? Anschließend zeigen wir drei Tools, mit denen lokale KI im Alltag wirklich Spaß macht: Ollama als minimalistischer Chat-Client, der stark an die großen Cloud-LLMs erinnert, LM Studio mit umfangreicher Modellverwaltung, Tool-Unterstützung und praktischer Visualisierung, ob ein Modell vollständig in den Grafikspeicher passt, sowie Amuse für KI-generierte Bilder und kurze Videoclips – wahlweise im Easy- oder Expert-Mode. Wir gehen Schritt für Schritt durch Installation, Modellauswahl und Konfiguration und geben Tipps, welche Modelle in der Praxis die besten Ergebnisse liefern. Das Beste daran: Eure Daten bleiben lokal auf dem Rechner – keine Cloud, keine Abo-Kosten, keine Datenkraken.









