Finalisation du projet "self-operating-computer", l'embryon d'une AGI
Bonjour,
J'ai beaucoup apprécié votre cours sur : https://www.youtube.com/watch?v=islgNsL85sE
Je profite de ce forum pour demander l'aide de la communauté sur le projet Open Source "self-operating-computer".
Le point faible de cette application est la localisation du curseur, qui ne fonctionne pas très bien à cause de GPT4-Vision, qui a du mal à localiser correctement l'emplacement des objets. Pour corriger cela, une solution possible est d'utiliser un autre modèle qui semble meilleur en termes de localisation : https://github.com/apple/ml-ferret
Le problème est que ce type de modèle est très gourmand en GPU. Si quelqu'un serait intéressé pour nous donner un coup de main sur l'installation et la configuration d'un lien API, ça serait top!
Ci-dessous, la vidéo du projet : https://www.youtube.com/watch?v=Taz2QPuVoK0
Problème signalé sur GitHub : https://github.com/OthersideAI/self-operating-computer/issues/102
Merci pour tout.
cordialement, Khalid essoulami