Projects with this topic
-
API FastAPI permettant d’identifier des espèces de pingouins à partir de données tabulaires optionnelles et/ou d’une image.
L’API renvoie une liste d’espèces probables avec leurs probabilités et inclut :
Classification Machine Learning (RF, KNN, LR) Fusion multimodale (tabulaire + image) Journalisation des requêtes/réponses (SQLite) Interface web pour consulter les logs Interface web pour tester les prédictions Notebooks pour exploration et entraînementProjet réalisé dans le cadre de la formation Développeur en Intelligence Artificielle (Simplon).
Updated -
PDF + Image + Table → LLaVA / Qwen2-VL
Updated -
Terminal Chat Completion client for Google's Gemini AI models written in Go
Updated -
MF-3DPnP is a non-learning-based pipeline for robust geometric pose estimation using monocular vision, sparse or dense depth, and optional inertial measurements (IMU). It is designed as a strong baseline for comparing pure geometric approaches to modern learning-based methods, with a particular focus on aerial and robotics datasets (such as EuRoC and TUM-VI).
Updated -
Aplicação de chat multimodal que utiliza I.A
Updated -
Updated
-
A multimodal knowledge graph about monuments in The Netherlands
Updated