Amikor a hálózatba kapcsolt autó összeütközik a valósággal

A Villanyóra vendége volt Kiss Dániel, aki a TomTom Data Unit nevű szervezeti egységében a szoftvermérnök-csapat vezetője, és a beszélgetés mellett írásban is megosztotta velünk gondolatait a hálózatba kapcsolt autókról. Az alábbi írás az ő tollából származik.

És Isten megteremté a hálózatba kapcsolt autót

Szóval kezdetben vala a nagy semmi. Mármint adatügyileg. Hagyományosan az autók nem igazán gyűjtöttek adatot az elmúlt évtizedekben. Amikor már lett valami fedélzeti számítógép, és szenzorok, akkor a kocsi már készített logokat (eseménynaplókat), amikhez a szervizben a kantáros emberek fértek hozzá, de nagyjából ennyi. Sok autótípus még ma is itt tart.

Az elmúlt évtizedben kezdett felpörögni kicsit jobban az ún. connected car koncepciója, amiről biztos sokan tudják micsoda: egy autó, valamilyen internet vagy akármilyen hálózati kapcsolattal. És ekkor merült fel először, hogy adatok mehetnének oda-vissza az autó és a felhő között, de ez még ma is rettentő képlékeny terület: maguk az autógyártók óriási mamutok, akik még tanulják az informatikát, iszonyú lassan mozognak, és elképesztően érzékenyek arra, hogy a vevőik anonimak maradjanak, adatai pedig biztonságban legyenek. Emellett ott van ezernyi startup világszerte (magyar is van, lásd: commsignia), akik az egész létüket alapozzák arra, hogy az autók beszélgetni tudjanak a nagyvilággal kismillió okból (forgalmi helyzet jelentése, szenzor adatok megosztása a környező autókkal, stb.). Sokan esküsznek rá, hogy egymással lokálisan beszélgető autók nélkül a teljes önvezetés sem megvalósítható, és igazság szerint nem hiszem, hogy cáfolni tudnám ezt az állítást.

Mik a hálózatba kapcsolt autók fejlesztésének főbb irányai?

A teljesség igénye nélkül…

  • Smart city koncepció: ahol a közlekedési lámpák és útjelző táblák beszélgetnek az autókkal, villamosokkal, zsebekben lévő mobiltelefonokkal, hogy mindenki életben maradjon, odaérjen a munkahelyére időben, vagy tartsa a menetrendet. Ilyesmikkel foglalkozik (többek között) pl. a fent említett commsignia, és a rengeteg autóipari szereplőt tömörítő COVESA (leánykori nevén GENIVI).
  • Az adatkapcsolat problémája: az autógyáraknak fizetnie kell a mobilszolgálgatóknak minden forgalmazott bitért, és ezt nagyon nem szeretik, ezért minden autóipari projektnél komoly alku tárgya, hogy mikor, mit, mennyit lehet forgalmazni. Ráadásul mobillefedettség nincs mindenhol, tehát a connected car mint olyan, az igazából csak időnként connected car, ezért minden fedélzeti szoftvernek számolni kell ezzel a kényelmetlenséggel, és lehetőleg úgy csinálni, hogy a felhasználó ebből minél kevesebbet vegyen észre
  • Navigáció, ami a TomTom fő profilja. Még ma sem evidens, hogy minden autó a legfrissebb térképeket húzza le a felhőből, és OTA (over-the-air) frissíti a szoftvereket, mint egy mobiltelefon, pedig a felhasználói igények nagyon döngetik az ajtót… lásd a fenti problémát: az autógyárak fizetnek az adatforgalomért.

  • Az egyik legjobb valós forgalmi helyzet szolgáltatás a TomTomé, sok nagy autómárka navijában az ő forgalmi információi vannak. Időnként olyanokban is, amibe a navigációt nem a ez a cég szállítja.
  • Talán nem árulok el titkot, hogy a TomTom egyik legfőbb adatforrása a forgalmi adatokhoz onnan van, hogy a TomTom navik anonim módon közel valós időben jelentik, hogy hol járnak épp. Ezt az adattömeget térképre vetítve egy nagy rakás szerver dolgozik azon, hogy megtalálja a forgalmi dugókat, útfelújításokat, tereléseket és miegyebet, hogy aztán ezt az információt valahogyan visszajuttassa az autókba, hogy a navigációk új útvonalat javasoljanak. Nagyjából ugyanezt csinálja amúgy a Google is, bár nekik van némi helyzeti előnyük bizonyos szempontból.
  • Aztán ott vannak a különböző analitikai és machine learning rendszerek. Elemezzük például, hogy a navigáció ETT (estimated travel time, azaz tippelt utazási idő) jóslatai mennyire sikerültek jól, amikor a felhasználó megtervez egy útvonalat. Vagyis miután vége az utazásnak, ki tudjuk elemezni, hogy az eredeti jóslathoz képest mennyi ideig tartott az út, és mennyi volt az eltérés. És elemezzük, hogy ha túl nagy volt, akkor miért lehetett, és így, ha elég adatunk van, javítani tudunk az utazási időt becslő algoritmuson. Ezt egyébként ma már mesterséges intelligenciákkal (machine learning) végezzük, nem egyszerű analitikával.
  • És persze a mumus: privacy. A GDPR korszakban ez különösen kényes terület, nem lehet csak úgy begyűjteni minden adatot és úszkálni benne, még a TomTomnak sem, pedig mi az adatokat tényleg kizárólag a termékek jobbá tételéhez használjuk, a felhasználó kiléte meg politikai hovatartozása nem érdekel bennünket, nem akarunk reklámfelületeket eladni, nem az adat az, amiből pénzt csinálunk, azt csak azoknak a termékeknek a jobbá tételéhez használjuk, amiből viszont igen. Szóval adat nélkül végső soron mi is meg vagyunk lőve.

Hogy néz ki a személyes adatok védelmének problémája a gyakorlatban?

Csak egy példa: fentebb említettem, hogy a forgalmi információkhoz az autók pillanatnyi helyzetét használjuk fel. Az autógyártók adatvédelmi érzékenysége miatt azonban ezt az adatot már jóval a GDPR előtt sem küldték be a navigációs rendszerek az utazás első és utolsó néhány perce alatt („first and last mile problem”), nehogy valaha rossz kezekbe kerüljenek az adatok, és kiderüljön, hogy XY pontosan hol lakik vagy dolgozik. Viszont ha ez így van, akkor máris lekorlátoztuk magunkat, ha például személyre szabott szolgáltatásokat akarunk fejleszteni. Ilyenkor ugyanis nincs meg hozzá az adat, ergo nem tudunk ilyet fejleszteni, ergo lemaradunk mondjunk a Google mögött, aki meg minden adatot begyűjt, amihez csak hozzáfér.

Szóval a talány: hogy gyűjtsünk több adatot úgy, hogy megfelelünk GDPR szabályainak. Meg még tucatnyi másiknak egyszerre, mert a világ különböző pontjain különféle GDPR-szerű szabályok vannak érvényben (pl.: CCPA – Kalifornia, Kanada – PIPEDA, Brazília – LGDP, Ausztrália – The Privacy Act, stb.). Tehát globális cégként építsünk olyan adatgyűjtő rendszert, ami egyszerre tesz eleget a világ összes ilyen szabályozásának, amik időnként akár egymással is logikai ellentmondásban vannak.

Aztán ugye ott van az Apple új privacy szabályozása, ami miatt összerúgta a port a Google-lel és Facebookkal is, mert kihúzza a lábuk alól az üzleti modelljük alapját képező adatgyűjtési gyakorlathoz szükséges jogi és technikai hátteret.

Különös vetülete a személyiségi jogvédelemnek az, hogy az adatok, amiket gyűjtünk (földrajzi koordináták), természetüknél fogva nagyon érzékenyek, mert mutatják egy eszköz földrajzi helyzetét. És ha kenyérmorzsa szerűen követjük eszközök útját akár teljesen anonim módon, a földrajzi vetület miatt mégsem tekinthetők az adatok teljesen anonimnak. Ugyanis kiderülhetnek belőle az eszköz tulajdonosának rendszeres útvonalai, lakóhelye, kedvenc kávézója, ahová minden nap 10-kor betér. És így a kenyérmorzsákból kellő kitartással és számítási kapacitással el lehet jutni egy adott személyhez. Van rá módszer, hogy ez egy nagyvárosban, ahol rengeteg a kenyérmorzsa közel lehetetlen legyen matematikailag is, de mindig lesz a “magányos farmer Idahóban”, aki egyedüli adatforrásként létezik egy jól behatárolható földrajzi régióban, és az ő kiléte elméletben mindenképp kideríthető, ha van valaki, aki pont rá kíváncsi a nagy adathalmazban. Ilyesminek a matematikai esélye persze csekély, de létező problémáról van szó, amit mindig figyelembe kell venni a rendszerek tervezésekor.

Napestig sorolhatnám, de talán ennyiből is érzékelhető, hogy igen szerteágazó területről van szó, aminek csak egy kisebb szeletébe van nekem is mélyebb betekintésem.

Forrás: TomTom

A megoldás, amin konkrétan dolgozom egy olyan adatgyűjtő rendszer, ami a jelenleginél nagyságrendekkel több és jobb minőségű adat gyűjtését teszi lehetővé oly módon, hogy közben minden ponton tökéletesen eleget teszünk a GDPR, az Apple meg a többi szabályozó legszigorúbb adatvédelmi elvárásainak is. Azt a gordiuszi csomót igyekszünk vele átvágni, miszerint az régi nagy autógyártók azért ódzkodnak az adatgyűjtéstől, mert féltik a vevőiket, miközben azt kockáztatják, hogy ha nem teszik, lemaradnak az informatikai versenyben olyanok mögött, akik kevésbé szívbajosak: Google, Tesla, Amazon, stb.

A rendszerhez tartozik egy folyamatban lévő szabadalmi beadvány is, amiről érthető módon sokat nem beszélhetek, de egy kriptográfiai módszereket használó megoldásról van szó, ami az adatok anonimizálását oldja meg egy csomó érdekes lehetőséggel fűszerezve. Egy kicsit úgy kell elképzelni, hogy egyetlen személy vagy entitás nem képes hozzáférni nem anonim adatokhoz, mert azok olyan módon vannak tárolva, hogy ez egyszerűen nem lehetséges. Gondoljatok az amerikai akciófilmekből a két piros kulcsra, amit egyszerre kell bedugni és elfordítani két különböző személynek, hogy kinyíljon a széf, vagy induljon az atomrakéta.

Nincs időd naponta 8-10 hírt elolvasni? Iratkozz fel a heti hírlevelünkre, és mi minden szombat reggel megküldjük azt a 10-12-t, ami az adott héten a legfontosabb, legérdekesebb volt. Feliratkozás »

Elektromos autót használsz?