- Tárgyfelismerés: Az ODaaS szíve az objektumfelismerési fázisban rejlik. Az objektumfelismerés egy olyan számítógépes látás technológia, amely egy előre betanított modellel elemzi a kinyert jellemzőket, és pontosan azonosítja a különböző objektumok jelenlétét a bemeneti adatokban. A szolgáltatás gyakran egyszerre több, különböző osztályba tartozó objektumot is képes felismerni a képen.
- Kép vagy videó input: A felhasználók képeket vagy videókat tölthetnek be, amelyek az érdeklődésükre számot tartó objektumokat tartalmazzák. Ezek lehetnek hétköznapi tárgyak, vagy konkrét entitások, például arcok, járművek, állatok, vagy akár egyedi tárgyak is, az alkalmazástól függően.
- Előfeldolgozás: A bemeneti adatok előfeldolgozáson mennek keresztül az elemzéshez való szabványosítás és optimalizálás érdekében. Az előfeldolgozás magában foglalhatja a modell teljesítményének növelése érdekében történő átméretezést, normalizálást és adatbővítést.
- Jellemzők kigyűjtése: Az előfeldolgozás után a mélytanulási modell kivonja a releváns jellemzőket a bemeneti adatokból. Ezek a jellemzők olyan kritikus jellemzőket rögzítenek, amelyek megkülönböztetik a különböző objektumokat, így a későbbi észlelési folyamat pontosabbá válik.
- Bounding Box lokalizáció: Az objektumérés a határoló dobozokat használja az észlelt objektumok pontos helyének meghatározásához. Az ODaaS olyan objektumérési módszereket alkalmaz, amelyek lehetővé teszik, hogy ezek a dobozok minden egyes azonosított objektumot körülöleljenek, és olyan információkat szolgáltassanak, mint például az azonosítás pontossága.
- Objektumosztályozás (opcionális): Egyes objektumfelismerő megoldások további lépésként objektumosztályozást is tartalmaznak. Ebben az esetben a szolgáltatás nemcsak felismeri az objektumokat, hanem vizuális jellemzőik alapján meghatározott osztályokba vagy kategóriákba is sorolja őket.