Ganz kostenlos ist es dann auch nicht. Es braucht zumindest eine kleine Serverinfrastruktur und einiges an Know-how. Dafür ist es spannend. Ich befasse mich intensiv mit der Materie und diskutiere immer gerne aktuelle Anwendungsfälle. Dann sind da noch die Profis von Kaformatik und PopNet die gerne interessante Projekte umsetzen und nun auch private KI-Server anbieten können.
Video
Links aus dem Video
Sprachmodelle (LLMs) & Lokale AusfĂĽhrung
DeepSeek: https://www.deepseek.com/
Qwen (Alibaba): https://qwen.ai/home
Ollama: https://ollama.com/
Open WebUI: https://openwebui.com/
Bild- & Videogenerierung
FLUX.2 (Black Forest Labs): https://blackforestlabs.ai/
Stable Diffusion: https://stability.ai/
ComfyUI: https://comfy.org/
Wan 2.2 (Alibaba): https://github.com/Wan-Video/Wan2.2
HunyuanVideo (Tencent): https://github.com/Tencent/HunyuanVideo
LTX-Video (Lightricks): https://github.com/Lightricks/LTX-Video
KI-Agenten & Automatisierung
LangGraph: https://langchain-ai.github.io/langgraph/
n8n: https://n8n.io/
OpenClaw: https://github.com/openclaw/openclaw (⚠️ Achtung: Wie im Video erwähnt, experimentell und aktuell ein erhebliches Sicherheitsrisiko. Bitte nur auf isolierten Testgeräten ausführen!)
Coding-Assistenten
Aider: https://aider.chat/
Cline: https://github.com/cline/cline
Audio/Sprache
Whisper (OpenAI): https://github.com/openai/whisper
faster-whisper: https://github.com/SYSTRAN/faster-whisper
Chatterbox (Resemble AI): https://github.com/resemble-ai/chatterbox
Die Zusammenfassung wurde mithilfe von KI‑Tools erstellt. Web Clipper → Obsidian → Copilot, unter lokaler Verwendung von gpt‑oss:120b auf einem Mac Studio.
YouTube hat kürzlich die Codierung geändert, der bisherige Code für das Transkript funktioniert nicht mehr. Diesen habe ich nun angepasst. Siehe hier:
Transkript
Die besten Open‑Source KI‑Tools für 2026 nach Kategorien
- Open‑Source‑KI hat in den letzten Monaten stark aufgeholt, ermöglicht komplexe Anwendungen ohne große Cloud‑Anbieter.
- Fokus auf groĂźe Sprachmodelle (DeepSeek, Quen), lokale AusfĂĽhrung (Olama), UI (Open Web UI) und weitere Kategorien.
Die grossen Sprachmodelle (LLMs) – Das Fundament generativer KI
- DeepSeek V3.2 mit 671 Mrd Parametern, Mixture‑of‑Experts, erreicht GPT‑5‑Level, nutzt nur 37 Mrd pro Anfrage.
- Stärken: Mathe, Coding, Reasoning, Werkzeugintegration, kostengünstiges Training.
- Qwen‑Familie (3, 3.5) liefert vergleichbare Ergebnisse, kleine Varianten laufen auf günstiger Hardware, unterstützt 119 Sprachen, Apache 2.0 Lizenz.
Olama – Lokale Ausführung von Sprachmodellen
- Ein-Klick‑Terminalbefehl lädt und startet Modelle, komprimiert auf 4‑Bit, geringe Qualitätsverluste.
- Desktop‑App mit Chat‑Interface, Drag‑and‑Drop, Web‑Search‑API, Cloud‑Option, über 100 Modelle unterstützt.
- Nvidia‑Partnerschaft erhöht Token‑Geschwindigkeit um bis zu 35 %.
Open Web UI – ChatGPT‑ähnliche Oberfläche lokal
- Über 127 k Sterne, 290 M Downloads, integriert Wissensbasis, Spracherkennung, Bildgenerierung, Code‑Interpreter.
- Docker‑Einrichtung in 60 Sekunden, komplett offline und DSGVO‑konform.
Kostenloser Guide von HubSpot mit KI‑Tool‑Vergleich
- Vergleich kostenlos vs. kostenpflichtig für Produktivität, Marketing, Sales, Creative Tools, KI‑Assistenten.
- Decision‑Making‑Framework mit fünf Schritten zur Auswahl und Kombination von Tools.
Bilder und Videos mit Open‑Source‑Tools
- Flux 2 (Black Forest Labs) erzeugt bis zu 4 MP Fotorealismus, Apache 2.0 Lizenz, Consumer‑Hardware kompatibel.
- Stable Diffusion bleibt Kern des Ă–kosystems, erweitert durch tausende Plugins, ControlNet.
- ComfyUI ermöglicht visuelle Pipelines für Bild‑ und Videogenerierung.
Video‑Generation Open‑Source
- Wan 2.2 (Alibaba) erzeugt 480p/720p Videos, realistische Kamerabewegungen, Apache 2.0 Lizenz, Varianten mit 5 B bzw. 14 B Parametern.
- HunyuanVideo (Tcent) 13 B Parameter, gute Qualität bei komplexen Szenen, Multi‑GPU‑Support.
- LTX Video (Lightrix) schnelle Generierung ab 12 GB VRAM, geeignet für kurze Social‑Media Clips.
Das Trend‑Thema KI‑Agenten im Open‑Source‑Bereich
- Erwartung: 40 % Unternehmensanwendungen integrieren Agenten bis Ende 2026 (Gartner).
- Langraph bietet Framework für Multi‑Agent‑Systeme, MIT Lizenz, erfordert Programmierkenntnisse.
- N8N liefert visuelle Workflow‑Automatisierung mit über 1 100 Integrationen, Fair‑Code Lizenz.
- OpenCloud ermöglicht lokalen KI‑Agenten für Messaging‑Plattformen, jedoch erhebliche Sicherheitsrisiken.
Programmieren und Coden mit Open‑Source‑KI
- Aider: Terminalbasierter Coding‑Assistent, integriert in Git, unterstützt lokale/Cloud‑Modelle, Apache 2.0 Lizenz.
- Klein: VS Code (und JetBrains) Plugin, Coding‑Agent mit expliziter Zustimmung, Apache 2.0 Lizenz.
Audio‑KIs im Open‑Source‑Bereich: TTS und STT
- Whisper (OpenAI) bleibt Standard für Spracherkennung, Faster Whisper beschleunigt.
- Chatterbox (Resemble AI): Text‑to‑Speech mit Emotion‑Control, 23 Sprachen, Turbo‑Variante, MIT Lizenz, neuronales Wasserzeichen.