Patrick Steinert

Published 16.09.25

Nachlese: Froscon 20 Vortrag “AI-First Softwareentwicklung – aber Open Source”

Es ist schon wieder ein Monat her: die Froscon 20 – Neben meiner Rolle als Orga beim FrOSCon e.V. habe ich auch einen Vortrag mit dem Titel “AI-First Softwareentwicklung – aber Open Source” dort gehalten.

Der Abstract:

Entwickler*innen können von KI-Tools profitieren – aber wie klappt das jenseits von Big Tech? Der Vortrag gibt eine Übersicht zu den spannendsten freien KI-Lösungen und deren Einsatz in der Softwareentwicklung.

KI hat die Entwicklungspraxis bereits verändert. KI kann Code generieren und wird auch produktiv in der Entwicklung eingesetzt. Doch meist sind es proprietäre Lösungen, die zum Einsatz kommen, z.B. Cursor oder Windsurf. Dabei gibt es mittlerweile eine Fülle an Open-Source-Angeboten, die es ermöglichen, auch ohne Datenabfluss in die Cloud produktiv zu sein.

Im Talk wurden folgende Themen angesprochen:

Die spannendsten Open-Source-KI-Modelle und ihre Communitys
Integration in den Workflow: Editor-Plugins, Terminals, Chat-Assistenten
Erfahrungen aus der Praxis: Vorteile, Herausforderungen, Tipps zur Einrichtung und Anwendung von KI-Code Assistenten
Q&A: Wo steht die Community, was fehlt noch? Perfekt für alle, die neugierig sind und ihre Unabhängigkeit als Entwickler*in bewahren wollen.

Wie immer werden die Talks auf der Froscon aufgezeichnet und der Allgemeinheit zur Verfügung gestellt. Daher kannst du den Talk hier ansehen.

Licensed to the public under http://creativecommons.org/licenses/by/4.0

Leave a Comment

Published 09.09.25

Published: Uses of Metaverse Recordings in Multimedia Information Retrieval

Visual for the publication Uses of Metaverse Recordings in Multimedia Information Retrieval

Published – Yet another First: scored the first article in the first issue of the new @multimedia journal by MDPI. It has been a month online, but yikes, it was a busy month :)

Metaverse Recordings (XR) can be made in the technical space of a computer. As part of our research, we explored the opportunities that recordable data can bring to Multimedia Information Retrieval.

Thanks again to my co-authors for your support Prof. Dr.-Ing. Stefan Wagenpfeil, Ingo Frommholz, and Matthias Hemmje.

Metaverse Recordings (MVRs), screen recordings of user experiences in virtual environments, represent a mostly underexplored field. This article addresses the integration of MVR and Multimedia Information Retrieval (MMIR). Unlike conventional media, MVRs can include additional streams of structured data, such as Scene Raw Data (SRD) and Peripheral Data (PD), which capture graphical rendering states and user interactions. We explore the technical facets of recordings in the Metaverse, detailing diverse methodologies and their implications for MVR-specific Multimedia Information Retrieval. Our discussion not only highlights the unique opportunities of MVR content analysis, but also examines the challenges they pose to conventional MMIR paradigms. It addresses the key challenges around the semantic gap in existing content analysis tools when applied to MVRs and the high computational cost and limited recall of video-based feature extraction. We present a model for MVR structure, a prototype recording system, and an evaluation framework to assess retrieval performance. We collected a set of 111 MVRs to study and evaluate the intricacies. Our findings show that SRD and PD provide significant, low-cost contributions to retrieval accuracy and scalability, and support the case for integrating structured interaction data into future MMIR architectures.

DOI: 10.3390/multimedia1010002

Leave a Comment

KI in der Softwareentwicklung: Zwischen Hype und echter Relevanz

KI hat die Softwareentwicklung bereits verändert

Published 29.05.25

KI in der Softwareentwicklung: Zwischen Hype und echter Relevanz

Künstliche Intelligenz hat die Softwareentwicklung bereits in ihren Grundzügen verändert – und viele beobachten diesen Trend mit Skepsis. Ist das wirklich relevant? Oder nur der nächste Hype, der bald wieder verpufft? Tatsächlich ist KI mehr als ein nettes Gimmick: Erste Werkzeuge zeigen schon heute, wie sich einfache Anforderungen schnell, effizient und größtenteils zuverlässig umsetzen lassen. Klar müssen die Prompts von Entwicklern erstellt werden um die richtigen Ergebnisse zu erzielen. Aber oft braucht es nur noch rund 20 Prozent Ihrer Fähigkeiten. Was heißt das? Prozesse lassen sich beschleunigen, repetitive Aufgaben abgeben – und das Potenzial ist noch lange nicht ausgeschöpft.

Der bekannte Denker Günther Dück sprach einst von der „Hybris-vs.-Hype“-Kurve: Zuerst wird eine neue Technologie überhyped, dann folgt das Tal der Ernüchterung. Genau dort, wo echte Produktivität entsteht, treten oft die Skeptiker auf den Plan: „Ich hab’s doch gesagt, das bringt alles nichts.“ Doch gerade an diesem Punkt zeigt sich, wer den nächsten Schritt geht – und wer zurückbleibt.

Denn auch wenn KI nicht perfekt ist, ist sie bereits hoch relevant. Perfektion ist keine Voraussetzung für Nutzen. Wer sie heute einsetzt, automatisiert Prozesse, beschleunigt Workflows und schafft Raum für Kreativität. Wer sie ignoriert, bleibt zurück.

Es geht nicht darum, KI zu verklären. Sie wird nicht jeden Menschen ersetzen und auch nicht jede Software automatisch besser machen. Aber sie ist ein mächtiges Werkzeug – und in der Softwareentwicklung in den richtigen Händen ein echter Produktivitäts-Booster. Der Unterschied liegt in der Herangehensweise: Wer technische Kompetenz mit strategischem Denken kombiniert, wer seine Rolle im Entwicklungsprozess anpasst und erkennt, welche Aufgaben sich sinnvoll an die Werkzeuge delegieren lassen, kann mit KI gezielt Softwareprojekte beschleunigen, sogar die Qualität erhöhen und neue Potenziale heben.

Ich erinnere mich gut an die We Are Developers Konferenz 2023 in Berlin. Damals präsentierte Thomas Dohmke, CEO von GitHub, GitHub Copilot. Mein erster Gedanke: “Ganz nett, für kleinere Funktionen sicher hilfreich.” Revolutionär? Wohl kaum. Doch mit der Zeit wurde klar: Das ist kein besserer Code-Vervollständiger, das ist eine neue Art zu arbeiten. Heute sehe ich, wie Tools selbstständig API-Debugging durchführen, Datenbankabfragen erzeugen oder Migrationsskripte vorbereiten – ohne menschliche Hilfe. Das ist mehr als Automatisierung. Das ist ein Paradigmenwechsel.

Unsere Rolle als Entwickler verändert sich. Wir geben der Maschine Aufgaben, denken in Zielen, nicht mehr in jedem einzelnen Befehl. KI wird zum verlässlichen Partner, der rund um die Uhr unterstützt. Wer das versteht, nutzt KI nicht als Gimmick, sondern als strategisches Werkzeug.

Wie also anfangen? Ganz einfach: Tools ausprobieren. Frei verfügbare Versionen testen oder auch mal 10, 20 Euro in einen Test-Monat investieren. Mit privaten Projekten starten, nicht selbst überlegen, sondern dem KI-Werkzeug die Aufgabe geben, Erfahrungen sammeln. Es muss nicht perfekt sein – entscheidend ist, zu lernen. Ebenso, wie ich ein neues Framework oder eine Sprache lerne.

Wie bleibt man auf dem laufenden? Es gibt eine Flut an Informationen. Aber niemand muss alles mitbekommen. Es reicht, ein paar gezielte Quellen zu verfolgen – sei es ein YouTube-Kanal, ein LinkedIn-Newsletter oder ein Blog. Schritt für Schritt entsteht so eine Routine, wie beim Lernen eines neuen Frameworks. Kleine Projekte, Tests, Erkenntnisse. Und plötzlich wird klar, wie viel möglich ist.

Das Neue ist da. Noch nicht perfekt, aber mächtig. Es wächst. Und es wird bleiben.

Jetzt ist der Moment, sich damit auseinanderzusetzen. Jetzt ist die Zeit, zu lernen.

Denn wer heute beginnt, profitiert morgen. Wer aber weiter auf der Schreibmaschine tippt, während andere schon Word und KI nutzen, wird den Anschluss verlieren.

Leave a Comment

Published 25.04.25

Published: Artificial-Intelligence-Based Image Generation from Scene Graphs for Metaverse Recording Retrieval

It all started with using AI Image Generation capabilities to (re)generate from minimal data. The recording of metaverse experiences supports various use cases in collaboration, VR training, and more. Such Metaverse Recordings can be created as multimedia and time series data during the 3D rendering process of the audio–video stream for the user. To search in a collection of recordings, Multimedia Information Retrieval methods can be used. Also, querying and accessing Metaverse Recordings based on the recorded time series data is possible. The presentation of human-perceivable results of time-series-based Metaverse Recordings is a challenge. This paper demonstrates an approach to generating human-perceivable media from time-series-based Metaverse Recordings with the help of generative artificial intelligence. Our findings show the general feasibility of the approach and outline the current limitations and remaining challenges. Read the full paper

Leave a Comment

Published 05.01.25

Steinert Insights 25-01

Happy New Year Edition!

Ich wünsche allen Lesern ein frohes Neues!

What’s Up

Das Jahr ist noch jung, aber wie nach vielen meiner Auszeiten sprudeln die Ideen und Pläne werden gemacht.

Trick-Labs Projekte

Urlaub ist Urlaub ;-)

Brainwaves von Patrick

Dieses Jahr soll ja ein krasser Wahlkampf starten. Aktuell scheinen mir die wählbaren Parteien unfähig zu sein, die Wünsche des breiten Volks in die Wahlprogramme zu schreiben. “Veränderung” scheint ein zu heißes Eisen zu sein. Veränderung ist bitter nötig: Bürokratieabbau und Digitalisierung der öffentliche Verwaltung, Reduktion des Föderalismus, Mut und Zukunft für die Arbeitswelt, die nicht von einem zunehmend unfinanzierbaren Sozialsystem getragen werden.

Jetzt will ich nicht nur anprangern, sondern durchaus aktiv sein. Leider habe ich noch keine Antwort gefunden, wie das mit Wirkung erzielen kann. Anderen geht es ebenso. Falls jemand einen guten Ansatz hat, her damit.

What’s On

Die Regular Season der NFL geht heute zu Ende und es stehen noch spannende Spiele auf dem Programm. Count me in!

Leave a Comment

Prognosen für 2025: Trends, Herausforderungen und Chancen

Published 30.12.24

Prognosen für 2025: Trends, Herausforderungen und Chancen

Das Jahr 2025 verspricht, ein wegweisendes Jahr für Technologie, Gesellschaft und Politik zu werden. Hier sind einige der zentralen Themen und Entwicklungen, die uns aus meiner Technologie-Sicht beschäftigen werden:

Künstliche Intelligenz: Mehr Automatisierung und neue Werkzeuge

Das Thema wird uns weiter stark beschäftigen. Neben vielen hunderten kleineren Entwicklungen sehe ich diese Themen als besonders ausschlaggebend.

KI-Agenten auf dem Vormarsch
KI-Agenten, eine relativ neue Technologie, halten zunehmend Einzug in verschiedenste Bereiche und entwickeln sich zu einem entscheidenden Einflussfaktor für die Automatisierung. Sie übernehmen immer komplexere Aufgaben und Arbeitsabläufe, automatisieren nicht nur repetitive Tätigkeiten, sondern auch ganze Prozesse – und revolutionieren so Effizienz und Produktivität.

Agentic-IDEs in der Softwareentwicklung
Die nächsten Entwicklungsumgebungen (IDEs) sind zunehmend KI-gestützt. Dadurch können Programmierer ihre Arbeit schneller und präziser erledigen. Bestehende Code-Generatoren und Assistenzsysteme werden weiter verfeinert, was die Softwareentwicklung revolutionieren dürfte. Werden wir Autonomous Coding Level 3 oder sogar 4 erreichen? Wer weiß :)

Stabilität statt Revolution
Entgegen mancher Erwartungen ist nicht mit grundlegend neuen KI-Modellen zu rechnen. Stattdessen liegt der Fokus auf der gezielten Optimierung und breiteren Anwendung bewährter Technologien.

Bonusprognose: Allgemeine Künstliche Intelligenz nicht in 2025.

2. Rechtliche Vorgaben: Neue Regulierungen, neue Herausforderungen

Barrierefreiheitsstärkungsgesetz (BFSG)
Im Jahr 2025 rückt das BFSG für viele Betreiber von Webshops und Apps in den Mittelpunkt. Die höheren Anforderungen an barrierefreie digitale Angebote erfordern umfassende Anpassungen, um alle Nutzergruppen einzubinden. Hier gibt es ein Webinar zur Thematik

NIS-2-Richtlinie
Die neue EU-Richtlinie zur Netzwerk- und Informationssicherheit (NIS-2) verschärft die Sicherheitsanforderungen für Unternehmen. Viele Firmen müssen in IT-Security und Compliance investieren, um den Vorgaben gerecht zu werden.

3. SEO wird zu AEO: Optimierung für KI-Suchmaschinen

Von Mensch zu Maschine
Mit dem Aufkommen KI-basierter Suchlösungen (z. B. GPT Search und Perplexity Search) wird sich die SEO-Arbeit verändern. Webseiten sind nicht mehr nur für Menschen, sondern zunehmend auch für „maschinelle Leser“ relevant. Um von KI-Systemen verstanden und optimal ausgewertet zu werden, müssen Inhalte anders aufbereitet werden. Unternehmen und Content-Ersteller benötigen Konzepte, die Endnutzer und KI-Systeme gleichermaßen überzeugen.

4. Politik: Wahljahr und digitale Debatten

Es ist Wahljahr und dringender Handlungsbedarf. Also wird uns die Politik auch im digitalen Beschäftigen.

Social Media im Wahlkampf
2025 ist Wahljahr, und Social-Media-Plattformen wie Twitter und Facebook werden erneut zu wichtigen Schauplätzen der politischen Kommunikation. Gleichzeitig benötigt es großen Druck, um die Debattenkultur zu verbessern und Polarisierungen abzubauen. Social Media funktioniert über Polarisierung. Wie erreichen wir eine bessere Debattenkultur ohne permanent auf Spaltung zu gehen? Für die kommende Wahl wird das nicht mehr relevant, aber es geht um mehr. Wie bleiben wir eine Demokratie.

Digitalisierung der Verwaltung
Prognose oder Hoffnung: Die deutsche Gesellschaft fordert mehr Tempo bei der Digitalisierung von Behörden. Es besteht akuter Handlungsbedarf, um international den Anschluss wiederzufinden. Hier könnten politische Beschlüsse nach der Wahl zukunftsweisend sein. Letztlich wird der bevorstehende Personalmangel ein Motivator sein – so hoffe ich.

Fazit: 2025 als richtungsweisendes Jahr

Ob Künstliche Intelligenz, neue rechtliche Anforderungen, SEO für KI oder die politische Landschaft – das Jahr 2025 bringt bedeutende Herausforderungen und Chancen. Unternehmen, Politik und Gesellschaft stehen vor der Aufgabe, diese Veränderungen aktiv zu gestalten. Die in diesem Jahr getroffenen Entscheidungen und Weichenstellungen werden weit über 2025 hinaus wirken.

1 Comment

Published 22.12.24

Steinert Insights 24-51

What’s Up

Einen schönen vierten Advent. Das Jahr ist fast rum und der übliche Trubel ebbt langsam ab. Daher habe ich die Zeit ein paar Dinge abzuschließen und ein paar Gedanken aufzuschreiben. So etwa meine jüngste Einschätzung zu Generativer KI in der Softwareentwicklung.

Trick-Labs Projekte

AI-Lab

Überraschend bin ich die Woche auf die IDE Windsurf gestoßen, eine Agenten-basierte Software. Die Agenten können umfangreiche Code Anforderungen umsetzen, was sehr krass ist. So konnte ich ein noch unbekanntes Projet deutlich nach vorne bringen.

Daneben habe ich wieder etwas mit lokalen LLMs getestet. Phi-4 von Microsoft funktioniert mit ollama auf meinem lokalen System mit RTX 3090Ti. Sogar recht performant. Die Ergebnisse sind für eine lokales Model sogar recht brauchbar, der Test dauert aber noch an.

Velo Wear

Neben ein paar Kleinigkeiten geht es hauptsächlich um die Siri-Integration. Dabei musste ich erstmal verstehen, wie das sich Apple das so gedacht hat. Die Siri-Sprachsteuerung und die Shortcuts für die Workflow App sind dabei verknüpft. Das wird von Flutter noch nicht ganz so gut unterstützt. Aber der Durchstich ist gelungen, jetzt geht es um die Liebe zum Detail.

Dissertation

Keep on writing. Auch hier ist liebe zum Detail gefragt, aber in den Formulierungen. Meine Erkenntnis: Lesen und korrigieren geht besser am iPad als am Desktop.

Brainwaves von Patrick

LEBEM (Lernern, Ernährung, Bewegung, Erholung, Motivation) ist ein Prinzip, dass ich ganz gerne nutze eine Balance zu erreichen. Die kommende Woche gehts um Erholung.

What’s On

Es ist auffällig, dass in letzter Zeit einige der großen kreativ YouTuber in meiner Bubble wieder aktiv werden. Nach Peter McKinnon und Peter Lindgren meldet sich nun auch Matt D’Avella wieder zurück. Zufall?

Leave a Comment

Published 22.12.24

Generative KI in der Softwareentwicklung: Fortschritte und Grenzen

Ende 2024 stellt sich die Frage wie die Generative KI in der Softwareentwicklung vorangeschritten ist. Die Softwareentwicklung erlebt derzeit einen tiefgreifenden Wandel, der durch den Einsatz generativer KI (GenAI)-Tools vorangetrieben wird. Von automatisierten Code-Vervollständigungen bis hin zur vollständigen Erstellung von Prototypen bieten diese Tools neuartige Möglichkeiten, die Effizienz, Produktivität und sogar die Kreativität von Entwicklern zu steigern. Doch wie weit sind wir wirklich gekommen, und welche Bereiche der Softwareentwicklung werden bereits heute durch GenAI beeinflusst? In diesem Artikel werfen wir einen umfassenden Blick auf den aktuellen Stand der Dinge, betrachten praxisnahe Anwendungsfälle, beleuchten bestehende Herausforderungen und wagen einen Ausblick auf die Zukunft.

2 Comments

Published 15.12.24

Steinert Insights 24-50

What’s Up

Nach dem ganzen Australien Adventure zum Besuch der ACM Multimedia 2024 musste ich erstmal im tiefsten Herbst und üblichen Job-Streß ankommen.

Trick-Labs Projekte

Cycling

Velo Wear Release 1.1.0: Kleines Update, große Wirkung: durch die Geolokalisierung und Wettervorhersage wird die passende Wettersituation nun automatisch eingestellt.
Stop starting and start finishing – so ein App Release zählt doch als Finish, oder? Ich habe zwei neue Projekte gestartet

AI-Themen

Thema Code-Assistenten. Durch die Entwicklung der Velo Wear App mache ich weiter Erfahrungen mit Plugins oder IDEs für KI Code Assistenten. Bisher bekannt ist Github Copilot. In der letzten Zeit habe ich Cursor verwendet und doch begeistert. Zunächst weil das verwendete Anthropic Claude 3.5 Sonnet Model deutlich (15%) besser ist als die Copilot Modelle, aber eben auch die Integration in die IDE viel mehr Automatisierung ermöglicht. Funktional kann ich Cursor nur wärmstens empfehlen. Der Haken sind die 20 USD Subscription. Doppelter Preis zu Copilot. Nun denn, erstmal zurück zu Copilot und immerhin ist dort nun auch Claude 3.5 Sonnet verfügbar. Aber die Anwendung des Codes in der IDE hängt noch hinter Cursor zurück. Mittelfristig werd ich dann wechseln, sofern Copilot nicht nachzieht. Ansonsten steht noch Blot.diy auf dem Testzettel.

Dann habe ich mit mir AI-basierte Crawler angesehen. Dabei bin ich auf mehrere kommerzielle Anbieter gestoßen. Da ich für Experimente aber keine Subscription abschließen möchte habe ich weitergesucht und scrapegraphai gefunden. Das benötigt einen OpenAI API Key und kann dann beeindruckent gut gewünschte Daten ziemlich konsistent im JSON Format liefern. Stark, ich werde berichten.

Dissertation

Publikationen (nachgereicht)

Mal wieder Co-Autor: ich habe am Avatar Detection Paper gearbeitet, was bei MDPI Virtual Worlds publiziert.

Daneben habe ich an meinen eigenen Papern gearbeitet, als Pre-Print ist nun eine Feld Studie zu Information Needs in Metaverse Aufnahmen auf arXiv veröffentlicht. Mit der Veröffentlichung dieser Feldstudie konnte ich einen wichtigen Beitrag zur Diskussion über neue Anforderungen an Multimedia-Retrieval-Systeme leisten, speziell im Kontext des Metaverse. Besonders spannend fand ich die Vielfalt der Anwendungsfelder, die sich durch MVRs ergeben – von immersiven Trainingsumgebungen bis hin zur Dokumentation von virtuellen Meetings. Gleichzeitig ist klar geworden, dass bestehende Technologien oft an den komplexen Datenstrukturen scheitern, die im Metaverse allgegenwärtig sind. Hier liegt eine spannende Herausforderung, die ich in zukünftigen Projekten weiterverfolgen möchte.

Brainwaves von Patrick

Noch mal zurück zum KI Programmieren. Ich hatte bereits die Kategorisierung der 5 Level des Autonomen Programmierens vorgestellt. Level 5 ist noch ziemlich weit weg. Aber mit den aktuellen Möglichkeiten wie Cursor kann schon beobachtet werden, dass nicht mehr nur Codeschnipsel in bestehenden Code reinkopiert werden (wie früher von Stackoverflow), sondern sinnvoll Funktionen im Kontext erstellen oder funktionale Teile an mehreren Stellen in mehreren Dateien einfügen. Das ist schon Autonomous Coding Level 2 (Coders primarily use the IDE to specify features, and the AI then modifies the code accordingly). Das verändert auch die Art, wie ich einen Programmier-Task angehe. Dazu muss ich mir mal mehr Gedanken machen.

What’s On

Lohnenswert: die aktuelle Folge Software Architektur im Stream von den IT-Tagen. Das Thema der Podiumsdiskussion: Wie sieht unsere IT-Arbeitswelt 2034 aus? Interessante Gedanken.

Leave a Comment

Published 15.12.24

Velo Wear 1.1.0 Release – Jetzt mit Lokalisierung und Wetterdaten

Egal welches Wetter, Velo War hilft dir die Bekleidung & Ausrüstung für deine nächste Ausfahrt auf dem Rennrad auszuwählen. Dazu kann die Version 1.1.0 nun auch deine Position verwenden und automatisch die Wetterdaten einstellen. Die letzten Wochen habe ich an der Integration der Daten gearbeitet. Daneben gibt es auch ein kleines Redesign. Insgesamt macht die App für den aktuellen Stand ein gutes Bild.

Beispielbild der App das die Einstellung der Wetterbedingungen erlaubt und dazu passende Kleidungsempfehlungen.

Ich habe noch weitere Ideen die ich nun umsetzen möchte. Mich hat der Wunsch nach Produktempfehlungen zu den erwähnten Produkten erreicht. Das ist zum Beispiel eine Idee. Aber auch ein Android Release wurde gewünscht. Dazu fehlt mir noch ein passendes Testgerät.

Da die kalte Jahreszeit da ist, ist die Frage nach der richtigen Kleidung umso relevanter. Probier Velo Wear doch einfach mal aus. Kost auch nichts.

1 Comment

Patrick Steinert Posts

What’s Up

Trick-Labs Projekte

Brainwaves von Patrick

What’s On

Künstliche Intelligenz: Mehr Automatisierung und neue Werkzeuge

2. Rechtliche Vorgaben: Neue Regulierungen, neue Herausforderungen

3. SEO wird zu AEO: Optimierung für KI-Suchmaschinen

4. Politik: Wahljahr und digitale Debatten

Fazit: 2025 als richtungsweisendes Jahr

What’s Up

Trick-Labs Projekte

Dissertation

Brainwaves von Patrick

What’s On

What’s Up

Trick-Labs Projekte

Dissertation

Brainwaves von Patrick

What’s On