tarent heißt jetzt Qvest Digital AG | mehr erfahren
KI gestützte Bildersuche: Embedded
KI gestützte Bildersuche
Der KI-Boom hat meine (IT-)Welt ganz schön auf den Kopf gestellt. Gerade die KI-Bildgenerierung flasht mich noch heute! Stunden um Stunden habe ich damit verbracht, generierte KI-Bilder zu bestaunen! Heute - zwei Jahre später - habe ich eine große Sammlung an generierten Bildern angehäuft. Wenn ich mir ein Bild pro Sekunde anschauen würde, schaffe ich es nichteinmal an einem Tag die Hälfte zu sichten! Eine Lösung musste also her...! Ich habe eine WebApp implementiert, die genau dieses Problem löst. In dieser Blog-Serie möchte ich euch die Kernideen und -konzepte, die in dieser App stecken, vorstellen.
Im ersten Teil der Blog-Serie "KI gestützte Bildersuche" gehen wir auf die Grundlagen der Bildersuche ein. Was kann man denn durchsuchen? Text! Aber woher nehmen?
Prompt
Um ein Bild via KI zu generieren, benötigt man eine Textbeschreibung (Prompt). Dieser Prompt wird - normalerweise - von einem Menschen geschrieben. Er beinhaltet (meistens) die Idee, die der Mensch im Kopf hatte. Ob die KI diese auch in das gewünschte Bild umsetzt, ist eine andere Frage... Der Prompt scheint also ein guter Ansatz zu sein, um Bilder zu durchsuchen.
Allerdings kann man auch schon mit einem recht kurzen Prompt ein schönes Bild generieren:
Eine süße Katze
Was der Prompt aussagt:
- - Wie die Katze aussieht
- - Was die Katze macht
- - Was sonst noch auf dem Bild zu sehen ist