Анатомия на едно сканиране: какво всъщност прави двигателят
Сканирането не е curl заявка. Преминаваме през всеки етап — от поставяне на URL в опашката до генериране на потвърдена присъда — за да знаете какво захранва вашите известия.
Всяко сканиране започва като задача в приоритетна опашка. Платените планове с кратки интервали получават по-висок приоритет, но всяка задача минава през един и същ конвейер, така че резултатите са сравними между нивата.
Първи етап е придобиването: реална инстанция на Chromium, а не извличане само на заглавки, зарежда страницата с включен JavaScript. Прихващаме регистрацията на service worker, инициаторите на заявки и динамичните import извиквания, така че нищо заредено по време на изпълнение да не избегне записа.
Втори етап е анализът. Сравняваме наблюдаваното дърво от скриптове с вашата базова линия, оценяваме нови или променени ресурси и изпълняваме поведенчески евристики, които маркират модели на изтичане на данни — POST заявки към новорегистрирани домейни, слушатели на натискания на клавиши върху платежни полета или обфускирани полезни товари, декодирани по време на изпълнение.
Трети етап е верификацията. Преди нещо да достигне до пощата ви, подозрителните находки се изпълняват отново в чиста сесия, за да се изключи нестабилност. Само стабилен, възпроизведен резултат става присъда — затова си струва да реагирате на нашите известия.