Im Supermarkt darauf warten, dass der/die Kassierer/in den Code für das zu wiegende Obst oder Gemüse raussucht? Kommt Dir bekannt vor? In einer digitalisierten und hoch-performanten Welt sollte das doch eigentlich nicht nötig sein, oder? Dachte ich mir auch. Also mal schnell was überlegt: Ich wollte doch schon immer mal was mit dem NVIDIA Jetson Nano (Amazon*) machen: ein Edge Device, 120 €, 128 GPU Cores, 472 GFLOPS Rechenleistung, 5 Watt Stromverbrauch. Überzeugt. Für eine Kassenwaage sollte es ja auch kein GPU System für 2.000 € oder mehr sein. Also, taugt es etwas?
Die meisten fertigen Algorithmen zur Objekterkennung sind ja eher auf allgemeine Datensätze trainiert, die zwar Obst und Gemüse beinhalten, aber nur einige wenige Arten. Das Coco-Dataset beinhaltet zum Beispiel Karotten, Bananen, Äpfel, Orangen und Broccoli. Diese Klassiker schafft meist auch das Personal an der Kasse von alleine. Die Algorithmen, bzw, die neuronalen Netze sind also vorhanden, aber sie sind nicht spezifisch trainiert. Ein Training mit spezifischeren Daten wäre möglich: Stichwort Transfer Learning. Dafür brauche ich Bilder von Obst und Gemüse. Obst, das habe ich auf dem Wege gelernt, ist gar kein definierter Begriff. Es wird von Früchten gesprochen. Man lernt nicht aus. Durch eine schnelle Recherche sind ein paar Datensätze gefunden, die Bilder zum Training bieten:
Ich habe schon ein paar Versuche für das Transfer-Training gemacht (dazu dann vielleicht mal mehr in einem anderen Beitrag). Bisher sind die Ergebnisse aber bescheiden. Es gibt zum Glück bessere Ansätze. Ich habe dazu ein Projekt veröffentlicht. Der Code ist auf github zu finden. Vielleicht wird es ja tatsächlich funktionieren, wer weiß das schon. Ist halt ein Side-Project.
[…] I bought an NVidia Jetson Nano board and a fan for a side project. It is about machine learning with training and inference. Therefore, the CPU and GPU will work a […]