~ Hoeveelheid spam hangt af van eerste letter mailadres
» Door Joren op dinsdag 02 september 2008 - Reacties(0) - ReageerVolgens een onderzoek die enkele dagen geleden verscheen op o.a. de morgen en slashdot is er een verband tussen de eerste letter van een email-adres en de hoeveelheid spam er op terecht komt. Ik host mijn eigen mail server voor 0110.be en ik krijg heel wat spam. Als er een email verstuurd wordt naar een onbestaand email adres dan komt dit in een logbestand terecht:
550 5.1.1 <abernathy@0110.be>: Recipient address rejected: User unknown in virtual mailbox table
Aangezien er maar enkele @0110.be adressen in gebruik zijn kan met zo’n logbestand gekeken worden welke letters het meeste spam te verduren krijgen:

De resultaten zijn dus nogal verrassend: enkel de adressen die starten met a,b,c en in mindere mate d worden gespammed. De rest nagenoeg niet. Mijn spammers zitten dus met een zeer beperkte namenlijst, of zijn het spammen beu na 3 letters. Misschien kunnen ze beter de namenlijst niet alfabetisch maar willekeurig overlopen. Met beter bedoel ik beter niet. Dit steekproefje, waarbij een week aan log files werden geanalyseerd, maakt duidelijk dat er bij 0110.be wel degelijk een verband is tussen de eerste letter en het aantal spam mails. Dit is het script dat gebruikt werd voor de analyse:
1
2
3
4
5
6
7
8
9
10
11
12
frequencies = Hash.new
('a'..'z').each {|l| frequencies[l]=0}
File.open("syslog", "r") do |infile|
while (line = infile.gets)
if(line =~ /.*<(.*)@0110.be>: Recipient address rejected.*/) then
frequencies[$1[0,1]]=frequencies[$1[0,1]]+1
end
end
end
frequencies.sort.each{ |pair| puts "#{pair[0]};#{pair[1]}" }