Napadlo vás niekedy, že by ste mohli odhaliť a klasifikovať malvér jeho vizualizáciou? No, teraz môžete. Výskumníci zo spoločností Microsoft a Intel nedávno deklarovali použitie techniky Deep-Learning na detekciu a identifikáciu existencie škodlivý malvér analýzou obrázkov.
Projekt je známy ako STAMINA: Statická sieťová analýza škodlivého softvéru ako obrázka. Novo nájdená technika funguje na systéme založenom na obrázkoch. Prevádza malvér na obrázky v odtieňoch šedej a potom skenuje a analyzuje jeho štrukturálne a textúrne vzory na malvér.
Proces funguje tak, že vezme binárnu formu vstupného súboru a prevedie ho na prúd nespracovaných pixelových údajov, ktoré sa potom prevedú na obrázok. Trénovaná neurónová sieť ho potom skúma, aby skontrolovala existenciu akéhokoľvek infekčného prvku.
ZDNet uviedol, že AI STAMINA je založená na inštalátoroch programu Windows Defender zhromaždených spoločnosťou Microsoft. Ďalej sa uvádza, že keďže sa veľký malvér dokáže bez námahy premeniť na obrovské obrázky, táto technika nezávisí od prepracovaných reakcií vírusov po pixeloch.
Niekoľko obmedzení STAMINA
Stamina zatiaľ dokázala odhaliť malvér s úspešnosťou 99,07 percenta a falošne pozitívnymi výsledkami pod úrovňou 2,6 percenta.
Táto technika funguje neuveriteľne dobre na menších súboroch, ale jej účinnosť klesá s väčšími súbormi. Veľké súbory obsahujú väčší objem pixelov, čo si vyžaduje vyššie možnosti kompresie, ktoré sú mimo konzistentného rozsahu Stamina.
Aby som to povedal pre vás jednoduchým jazykom „Efektívnosť výsledkov STAMINA klesá pri väčších súboroch“.
Čítaj viac: Android Malware „Unkillable“ poskytuje hackerom úplný vzdialený prístup k vášmu telefónu
Proces konverzie malvéru na obrázok
Podľa výskumníkov spoločnosti Intel celý proces pozostáva z niekoľkých jednoduchých krokov:
- V prvom kroku vezmite vstupný súbor a skonvertujte jeho binárnu formu na nespracované pixelové dáta.
- Binárne súbory vstupného súboru sa potom skonvertujú na tok pixelov. Každému bajtu súboru je potom priradená intenzita pixelov. Hodnota bajtu sa pohybuje medzi 0-255.
- 1-rozmerné pixelové dáta sa potom prevedú na 2D obraz. Veľkosť súboru určuje šírku a výšku každého obrázka.
- Obraz je potom analyzovaný a študovaný obrazovým algoritmom a hlbokou neurónovou sieťou STAMINA.
- Kontrola určuje, či je obraz čistý alebo infikovaný kmeňmi škodlivého softvéru.
Ako základ výskumu spoločnosti Microsoft sa použilo 2,2 milióna infikovaných hash prenosných spustiteľných súborov. Okrem toho Intel a Microsoft trénovali svoj algoritmus DNN pomocou 60 % vzoriek známeho malvéru, 20 % boli nasadené na kontrolu a overenie DNN a zvyšných 20 % vzorových súborov sa použilo na skutočné testovanie.
Nedávne úsilie a investície spoločnosti Microsoft do techník strojového učenia môžu vytvoriť budúcnosť detekcie škodlivého softvéru. Na základe úspechu STAMINA výskumníci v oblasti bezpečnosti očakávajú, že technika hlbokého učenia zníži zmeny v digitálnych hrozbách a udrží vaše zariadenia v bezpečí v budúcnosti.