PGEgaHJlZj0iaHR0cHM6Ly9oeXVuZGFpLmh1L21vZGVsbGVrL3VqLWtvbmEtZWxlY3RyaWMvIiBvbmNsaWNrPSJqYXZhc2NyaXB0OndpbmRvdy5vcGVuKCdodHRwczovL2h5dW5kYWkuaHUvbW9kZWxsZWsvdWota29uYS1lbGVjdHJpYy8nLCAnX2JsYW5rJywgJ25vb3BlbmVyJyk7IHJldHVybiBmYWxzZTsiPjxwaWN0dXJlPjxzb3VyY2Ugc3Jjc2V0PSJodHRwczovL3ZpbGxhbnlhdXRvc29rLmh1L3dwLWNvbnRlbnQvdXBsb2Fkcy8yMDI0LzA0L2h5dS1lZ3llYi1vbmxpbmUtZXZ6b2xkYXV0b2phYmFubmVyLTYwMHg1MDBweC5qcGciIG1lZGlhPSIobWF4LXdpZHRoOiA3MDBweCkiPjxzb3VyY2Ugc3Jjc2V0PSJodHRwczovL3ZpbGxhbnlhdXRvc29rLmh1L3dwLWNvbnRlbnQvdXBsb2Fkcy8yMDI0LzA0L2h5dS1lZ3llYi1vbmxpbmUtZXZ6b2xkYXV0b2phYmFubmVyLTE5NDB4NTAwcHguanBnIiBtZWRpYT0iKG1pbi13aWR0aDogNzAwcHgpIj48aW1nIHNyYz0iaHR0cHM6Ly92aWxsYW55YXV0b3Nvay5odS93cC1jb250ZW50L3VwbG9hZHMvMjAyNC8wNC9oeXUtZWd5ZWItb25saW5lLWV2em9sZGF1dG9qYWJhbm5lci0xOTQweDUwMHB4LmpwZyIgYWx0PSIiPjwvcGljdHVyZT48L2E+
auto
2024. 04. 27. szombat

AI Day 2 – a szemünk előtt nő fel a Tesla önvezetése

elektromos autó

A Tesla AI (mesterséges intelligencia) csapata immár másodszor mutatta meg a világnak, hogy min dolgoznak jelenleg, és merre halad a technológia.

Hogy miről fognak beszélni, azt nagyjából tudtuk, az igazi kérdés az volt, hogy mekkora az előrelépés tavaly augusztus, az első AI nap óta.

Dojo

A dojo (magyar átiratban dódzsó) a japán harcművészetekben a edzőterem elnevezése, ahol a mesterek a diákokat tanítják, azok pedig gyakorolhatnak. A kifejezést azóta már átvették az informatikai munkavégzés szervezésére használt agilis metodikában is, és az eredeti jelentéséhez hasonlóan itt is egy olyan termet jelöl, ahol az adott csapat tagjai egy külső trénerrel közösen tudnak dolgozni, aki segít nekik hatékonyabbá válni.

Talán nem véletlen, hogy a Tesla is ezt a nevet adta a saját fejlesztésű szuperszámítógépének, amelynek egyik fő eleme a D1 nevű chip, illetve az azt kiszolgáló erősen integrált hardvermegoldások. Korábban az autógyártó, ahogyan mások is, a számítógépes grafikus kártyák motorját, a GPU-t használta az önvezető rendszer tréningjére, a neurális hálók tanítására, de a Dojo egy kifejezetten erre a feladatra, saját maguk által fejlesztett célhardver, amelynek egyébként már készül a következő, tízszer gyorsabb változata.

Tavaly a színes-szagos animációkon és grafikákon kívül még csak az első prototípust tudták bemutatni, de most már sorozatban készül az eszköz, és naponta egy ilyen, 25 darab D1 chipet és megannyi saját fejlesztésű elektronikát egyesítő számítógépet – ahogy nevezik, tréning-csempét – tudnak összerakni.

A rack szekrényben két szintre hat-hat ilyen csempe kerül, csempénként saját nagy sávszélességű memóriával, illetve szintenként saját dedikált host, kiszolgáló szerverrel – ezek gyakorlatilag x86-os Linux PC-k. Egy ilyen hatos egység 54 petaFLOP számítási teljesítményre képes, tehát szekrényenként 108 petaFLOP-ról beszélünk, ami 108 × 1015, 16 bites lebegőpontos műveletet jelent másodpercenként.

Az első prototípusoknál azt tapasztalták, hogy a rendkívül nagy teljesítményű hardver kihasználtsága csak 4% volt, a számítási feladatok pedig nem haladtak. Mint kiderült, a korábbi, iparági standard eszközök, amelyek a hostokból vitték az adatokat a chipekhez, nem tudták elég gyorsan feladattal ellátni a Tesla csempéit. Ezért új, saját fejlesztésű hálózati kártyát és protokollt fejlesztettek, amely mindent összekapcsol mindennel, a feladatok pedig eljutnak nem csak rack szekrényen belül, de azok között is az épp szabad ciklusú hardverhez, 97%-os kihasználtságot elérve.

Tíz ilyen szekrény alkot egy egységet, egy ún. exaPOD-ot, amelynek számítási teljesítménye 1,1 exaFLOP. Exa, nem peta, ugyanis a tízes csomagban ismét nagyságrendet ugrottunk és összesen 1,1 × 1018 számítási teljesítmény áll rendelkezésre.

Hogy ez mennyi is valójában, azt nem egyszerű megfogalmazni, de a Tesla megpróbálta ezt érzékeltetni azzal, hogy megmutatta mennyit gyorsultnak a neurális hálókon végrehajtott műveleteik az új hardveren.

Nézzük.

FSD

Merthogy ez a hardverfejlesztés nem teljesen öncélú természetesen.

A teljes önvezetés kapcsán a Tesla úgy érzi, hogy a szoftver már feature ready – ez volt a tavaly év végi cél. Ez nagyjából azt jelenti, hogy megvan a képessége rá, hogy minden főbb közlekedési paramétert és szcenáriót (feature) megoldjon, de a megoldásai még nem mindig elég gyorsak vagy elég pontosak. Tehát már nem arról van szó, hogy a rendszer elméletben nem tudja, hogyan kell egy kereszteződésben balra kanyarodni, csak éppen a való világ megannyi kiszámíthatatlan változója, tökéletlensége miatt nem mindig hoz jó döntést. Ennek csiszolásához rengeteg tanítás kell még, ezen dolgoznak jelenleg.

Leegyszerűsítve most az történik, hogy az amerikai FSD tesztelő autóiból kigyűjtik azokat az eseteket, amikor az embernek be kellett avatkoznia, vagy máshogy oldott meg valamit, mint, ahogy azt a gép tette volna. A felmerülő probléma megoldását azonban nem úgy kell elképzelni, hogy az okos mérnök ír egy programsort, egy konkrét utasítást a konkrét esetre (pl. a zebrán átkelő gyalogos után még várd meg a következő autót ha az x száz méterre van csak, és utána kanyarodj ki). A Software 2.0 világában a neurális háló a probléma megoldásának vázát adja, az input pedig egy csomó példa az elvárt végeredményre, majd a rendszer maga keresi meg a legjobb utat, kvázi írja meg a saját programját.

Az elmúlt egy év során közel ötmillió videoklipet használtak fel a flottából és 35-ször frissítették az autók FSD szoftverét.

Tavaly ilyenkor még csak 2000 autón futott az FSD Beta, most a napokban viszont 160 ezerre bővült a felhasználók köre, így az elvégzendő munka is a többszörösére nő. Ehhez kell a Dojo számítási teljesítménye.

A Tesla egyébként hét ilyen exaPOD-ot épít a Palo Alto-i informatikai központjában (~ 7,7 exaFLOP), és állításuk szerint a saját fejlesztésű hardverük még így is olcsóbb, nagyjából a hatodába kerül, mintha ezt a teljesítményt a hagyományosan használt NVIDIA A100 chipekkel akarnák elérni. Az autógyártó szerint mindössze négy Dojo szekrény akkora teljesítményre képes, mint a korábbi Nvidia rendszerük 72 szekrényében lakozó 4000 GPU-val.

A neurális hálók további fejlesztésben két fő területet emeltek ki.

Egyik a címkézés, ami azt a folyamatot írja le, amikor a szoftver felismeri és értelmezi a maga körül látott világot. Ezt korábban kézzel végezték és négy éve még 533 munkaórába telt egy videoklip felcímkézése. Az évek során egyre jobban gépesítették a folyamatot, mostanra pedig már szinte teljesen automata a rendszer (autolabeling), és kevesebb mint hat perc alatt végez egy videóval. Ezen a területen az új hardver és a hozzá tartozó szoftver már most is 1,3-szor gyorsabb, mint a Tesla eddig használt rendszere de jövő év elejére háromszoros lesz a teljesítménye.

A másik ilyen terület a foglaltsági háló, ami végtelenül leegyszerűsítve arról szól, hogy az autónak fel kell ismernie, hogy a körülötte lévő térben merre szabad a haladás iránya. Itt már most is másfélszeres teljesítményt mértek, de jövő év elejére több, mint négyszeres lesz ez az érték.

A fentiek azt jelentik, hogy míg korábban egy hálózatot egy hónap volt megtanítani valamire, mielőtt kiküldhették a flottára a frissítést, most ez az idő egy hétre szűkül.

A fejlesztéséhez egyébként egy rendkívül valósághű szimulált környezetet is használnak. Korábban két hétbe telt, mire számítógépes grafikusok replikáltak egy utcát, vagy kereszteződést San Francisco egyik kerületéből, de most már a videójátékok világából ismert Unreal Engine segítségével ez csak öt perc. Így a város nagy részét egyetlen ember két hét alatt felépítette digitálisan.

Ebben a környezetben tetszés szerint bonyolíthatják az adott, a való életből, az autók videóiból kinyert problémát. Pár gombnyomással megváltoztathatják az évszakot, a fény vagy időjárási viszonyokat, véletlenszerű forgalmat és akadályokat generálhatnak, vagy olyan triviális nehézségeket gördíthetnek a gép elé, mint, hogy falevelek takarják el a felfestés egy részét.

Ez az a folyamatos fejlesztői munka, amely a valós adatokból, millió FSD kilométerből táplálkozva, a megoldásokat szimulációkon tesztelve elérheti azt, hogy hétről hétre, hónapról hónapra legyen okosabb, precízebb, tapasztaltabb a rendszer.

Biró Balázs

A fenntartható közlekedés elkötelezett híve, akit elsősorban a Tesla céltudatos és piacot felforgató tevékenysége rántott magával ebbe a világba, így publikációi elsősorban erre a területre koncentrálnak.