Régóta küzd már a Gmail a spamek szűrésével, és bár az utóbbi évek során a levelező biztonsági rendszere jelentősen fejlődött, még mindig akadnak hibák. Egy új megoldás azonban akár 38 százalékkal is javíthatja a levélszemét-észlelési arányt, ezért a keresőcég elmondása alapján a tavalyi belsős teszt után mostanra szinte minden Gmail-fiókban sikerült aktiválni az újítást – írja a hwsw.
A cég az elmúlt évek egyik legnagyobb védelmi frissítéseként említi a RETVec (Resilient & Efficient Text Vectorizer) nevű szövegosztályozási rendszert, ami segít megérteni és felfedezni a manipulált szövegeket. A gépi tanulási TensorFlow modell a vizuális hasonlóságokat próbálja észrevenni a szavak jelentésének azonosítására a tényleges karaktertartalom helyett.
Ilyen megtévesztő technikák például a speciális karakterek, hangulatjelek, a karakterek manipulációjóval kapcsolatos trükkök, homoglifák (kétértelmű karakterek), vagy láthatatlan karakterek alkalmazása.
A RETVec modell több mint 100 nyelven működik, keresőtáblázat vagy rögzített szókincsméret nélkül. Utóbbinak nagy szerepe van a hatékonyságban, mivel az alternatív megközelítések, amelyek fix szókincsméretet vagy keresőtáblát használnak a homoglifák felismeréséhez, sokkal erőforrásigényesebbek.