Mathematik | Informatik
Nico Waser, 2004 | Solothurn, SO
Das Ziel der vorliegenden Arbeit ist es herauszufinden, ob mittels der GAN-Architektur Golfloch-Layouts generiert werden können, die von Golfspielern nicht von realen Layouts unterschieden werden können Um diese Frage zu beantworten, wurden eine Trainingsdatenstruktur definiert, Golfloch-Layout-Daten erfasst, ein DCGAN trainiert und eine Umfrage durchgeführt. In der Umfrage sollten die Befragten bei fünf Vergleichen zwischen KI-generierten und realen Golfloch-Layouts das KI-generierte Layout identifizieren sowie bei 11 einzelnen Golfloch-Layouts entscheiden, ob es sich um ein KI-generiertes oder ein reales Layout handelt. Die Ergebnisse der Umfrage haben gezeigt, dass die Golfspieler einen Unterschied zwischen den realen und den KI-generierten Golfloch-Layouts feststellen konnten. Nach der Auswertung der Umfrage wurde zur Evaluierung des Optimierungspotenzials ein ProGAN auf dem Datensatz trainiert, was auf ein grosses Optimierungspotenzial hindeutet. Diese Arbeit konnte die Leitfrage aufgrund zu vieler Einschränkungen im GAN-Training jedoch nicht abschliessend beantworten. Die Teilerfolge in den Ergebnissen legen jedoch nahe, dass die Leitfrage nach weiterer Forschung positiv beantwortet werden könnte. Daher wird empfohlen, die Forschung in diesem Bereich fortzusetzen und die identifizierten Einschränkungen zu beseitigen.
Fragestellung
Können mittels der GAN-Architektur Golfloch-Layouts generiert werden, die Golfspieler nicht von realen Layouts unterscheiden können?
Methodik
Um den Trainingsdatensatz zu erstellen, wurden bei Satellitenbildern von Par-4-Golflöchern die Untergrundbeschaffenheiten eingezeichnet. Zur Datenerweiterung wurden Data-Augmentation-Methoden angewendet und der Datensatz mit prozedural generierten Golfloch-Layouts ergänzt. Das DCGAN wurde mit diesem Datensatz trainiert und zur Generierung der KI-generierten Golfloch-Layouts für die Umfrage verwendet. Nach der Auswertung der Umfrage wurde ein ProGAN trainiert, um das Optimierungspotenzial zu prüfen.
Ergebnisse
In der Umfrage mit 60 Golfspielern wurde in den fünf Vergleichen das KI-generierte Golfloch-Layout in 56,33% der Fälle korrekt identifiziert. Der Binomialtest (p = 0,0216 < 0,05) zeigt, dass die Teilnehmer die KI-generierten Layouts mit einer statistisch signifikant höheren Rate als bei zufälligem Raten erkannten. Bei den 11 Bewertungen von einzelnen Golfloch-Layouts wurden KI-generierte Designs in 58,89% der Fälle richtig erkannt. Der Binomialtest (p = 0,0004 < 0,05) zeigt, dass die Teilnehmer KI-generierte Layouts mit einer statistisch signifikant höheren Rate als bei zufälligem Raten identifizierten. Echte Layouts hingegen wurden nur in 52% der Fälle korrekt als real eingestuft. Das Ergebnis des Binomialtests (p = 0,2627 > 0,05) liegt über dem Signifikanzniveau von 0,05. Dies deutet darauf hin, dass die Erkennung echter Layouts nicht signifikant vom Zufallsniveau abweicht und die Teilnehmer bei der Identifizierung realer Layouts geraten haben.
Das trainierte ProGAN erreichte gegenüber dem DCGAN einen niedrigeren FID-Wert (ProGAN: 55,33; DCGAN: 90,64), wobei der IS-Wert bei beiden Modellen ungefähr gleich ist (ProGAN: 2,33; DCGAN: 2,35).
Diskussion
Die Umfrage ergab, dass die Teilnehmenden KI-generierte von realen Golfloch-Layouts unterscheiden konnten, insbesondere im direkten Vergleich oder bei Bewertungen einzelner KI-Layouts. Dies lässt sich folgendermassen erklären: KI-generierte Layouts sind oft simpler, was sie für Spieler unrealistisch wirken lässt. Dennoch trauten die Teilnehmer der KI zu, auch komplexe Layouts zu erstellen, was sich in ihren Bewertungen realer Löcher widerspiegelte. Des Weiteren wurden einige Faktoren, welche die Leistung des DCGAN einschränken, identifiziert: ein begrenzter Datensatz, unzureichende Rechenleistung und zu wenig Zeit.
Der niedrigere FID-Wert des trainierten ProGAN zeigt, dass eine höhere Bildqualität erreicht wurde und erhebliches Verbesserungspotenzial für die GAN-Leistung besteht, da lediglich die Architektur und die Trainingszeit angepasst wurden.
Schlussfolgerungen
Abschliessend lässt sich sagen, dass die Leitfrage aufgrund zu vieler Einschränkungen nicht definitiv beantwortet werden kann. Der Umstand, dass die Golfspieler nicht ausschlossen, dass komplexe reale Golfloch-Layouts KI-generiert sein könnten, sowie das durch das ProGAN gezeigte Optimierungspotenzial deuten jedoch darauf hin, dass die Leitfrage nach Aufhebung der Einschränkungen positiv beantwortet werden könnte.
Würdigung durch die Expertin
Dr. Elena Gavagnin
Diese Arbeit von Nico Waser behandelt eine interessante Anwendung generativer KI zur Erstellung von Golfplatz-Layouts. Die Datenerhebung und -generierung erfolgte mit einem kreativen und zugleich rigorosen Ansatz. Besonders hervorzuheben ist die statistische Analyse der Ergebnisse, die interessante Schlussfolgerungen ermöglicht. Die Diskussion der Resultate ist kritisch, gut strukturiert und überzeugend.
Prädikat:
sehr gut
Kantonsschule Solothurn
Lehrer: Marco Aebischer