Szolgáltatások: szintetikus adat generálás

Fotórealisztikus adatokat generálunk virtuális valóságban

Szolgáltatások közé tartozik, hogy az Unreal Engine segítségével fotorealisztikus mintákat készítünk a legkülönfélébb jelenetekben, különböző szögekből, különböző megvilágítási körülmények között.

Egy jó deep learning modell betanításához több ezer minta szükséges. Gyakran előfordul, hogy nem lehet kiegyensúlyozott tanító minta halmazt gyűjteni, mert egyes osztályokban csak alig néhány minta van. Például az ipari minőségellenőrzésben egyes meghibásodási módok csak millióból egyszer fordulnak elő, így szinte lehetetlen ezer valós mintát gyűjteni ebből a hibamódból. Más esetekben az adatgyűjtés költségei megfizethetetlenek. Egy példa erre a megerősítéses tanulás a robotikában: a rossz kimenetelű minták összegyűjtése (vagyis azok az esetek, amikor a robot eltörheti önmagát vagy valami mást) nagyon költséges lehet.

szolgaltat

A valós adatok hiányának ellensúlyozására egy hatékony módszer az adatok szintetizálása egy virtuális valóságbeli szimulációban. 2D vagy 3D képeket vagy videókat generálunk felületi mélységi térképekkel és pontosan kiszámított kitakarásokkal együtt. Mivel a képpontonkénti alapadatok könnyen elérhetők a szimulációban, nem kell időt és pénzt költeni az annotációra sem.

Hogyan működik? Ön elküldi nekünk a vizsgálandó objektumok CAD-tervét, néhány valós fényképpel a felületről és a hátterről, és mi annotált adatot állítunk elő Önnek. Az alábbi videóban különféle színű dobozokat állítunk elő véletlenszerűen, hogy betanítsunk egy depalletizáló modellt, melyet raklapok automatikus lepakolásához használnak.

camera

Annotáció

Felgyorsítjuk az annotációt.

Egy mesterséges intelligencia megoldás sem működhet kiváló minőségű annotáció nélkül, azaz a tanító adatok pontos címkékkel, maszkokkal és numerikus metaadatokkal való kiegészítése nélkül. Az annotáció gyakran a legszűkebb keresztmetszet egy automatizálási projektben, tekintve hogy a teljes ráfordított emberi munka 80–90%-át is kiteheti ez a lépés.

Mi másképp csináljuk.

Miután az adatok egy kis részét emberi erővel annotáltuk, a MIND Annotator termékünk megtanulja automatikusan felcímkézni az adatokat. Az így betanított modell a maradék adathalmazra automatikusan javasol annotációt, melyet a humán annotátorok elfogadhatnak vagy módosíthatnak, és így az egész folyamat iteratívan javítható. Az eredmény egy olyan annotációs folyamat, amely 10–100-szor gyorsabb, mintha manuálisan emberi erővel végeznénk.

Konzultáció

Mérnöki és üzleti szinten

person

Mérnöki szint

Vállalkozásunkat a deep learning gyakorlati alkalmazásával kapcsolatos tapasztalatainkra építettük. A mérnöki konzultációs projektjeink során a következőképpen működünk együtt az Ön fejlesztő csapatával:

  • Megtervezzük az automatizálási folyamatot.
  • Segítünk az adatgyűjtés megszervezésében.

  • Vagy mi annotáljuk az adatokat, vagy kiképezzük a belső munkatársakat az adatok annotálására.

  • Megtanítjuk a mérnök munkatársakat arra, hogy önállóan AI megoldásokat szállítsanak és üzemeltessék azokat.

  • Specifikáljuk a hardverigényeket, és hardver beszállító partnert ajánlunk, akik telepítik és karbantartják az eszközöket.

Üzleti szint

Tágabb üzleti perspektívából vizsgáljuk át a vállalkozását. Segítünk az üzleti vezetőknek átgondolni, hogy hogyan alkalmazhatják a mesterséges intelligenciát a vállalat bővítéséhez és hatékonyabbá tételéhez. A következő módon segítünk:

  • Azonosítjuk az automatizálható feladatokat és munkaköröket.
  • Újratervezzük az üzleti folyamatokat a költségek csökkentése vagy a szolgáltatások felgyorsítása érdekében.

MI-Crowd

Real time crowd counting on security cameras

MI-Crowd is an out-of-the box software product for real-time crowd counting. It is recommended for counting crowds up to 200 people, i.e. it is an ideal solution for public transport, conference halls or other public spaces.

Advantages

It has numerous advantages over classic people counting systems placed above the entrances:

  • It can count the crowd based on a single image, thus the estimation error can be diversified away by evaluating multiple images. E.g. taking multiple images between two bus stops can increase the 94% single-image accuracy up to 98%.
  • It counts only the heads, so other objects (e.g. luggage, umbrella) that can mislead the classic counters are ignored.
  • It is ready to be used on any camera using arbitrary image resolution.

Technical information

The inference speed of the model using 640×480 image resolution were tested on two hardver configurations:

  • GPU (GTX3070): 60 ms, i.e. about 17 images per second
  • CPU (i9): 400 ms, i.e. 2.5 images per second