~ Hoeveelheid spam hangt af van eerste letter mailadres

Volgens een onderzoek die enkele dagen geleden verscheen op o.a. de morgen en slashdot is er een verband tussen de eerste letter van een email-adres en de hoeveelheid spam er op terecht komt. Ik host mijn eigen mail server voor 0110.be en ik krijg heel wat spam. Als er een email verstuurd wordt naar een onbestaand email adres dan komt dit in een logbestand terecht:

550 5.1.1 <abernathy@0110.be>: Recipient address rejected: User unknown in virtual mailbox table

Aangezien er maar enkele @0110.be adressen in gebruik zijn kan met zo’n logbestand gekeken worden welke letters het meeste spam te verduren krijgen:

spam letter frequentietabel

De resultaten zijn dus nogal verrassend: enkel de adressen die starten met a,b,c en in mindere mate d worden gespammed. De rest nagenoeg niet. Mijn spammers zitten dus met een zeer beperkte namenlijst, of zijn het spammen beu na 3 letters. Misschien kunnen ze beter de namenlijst niet alfabetisch maar willekeurig overlopen. Met beter bedoel ik beter niet. Dit steekproefje, waarbij een week aan log files werden geanalyseerd, maakt duidelijk dat er bij 0110.be wel degelijk een verband is tussen de eerste letter en het aantal spam mails. Dit is het script dat gebruikt werd voor de analyse:

1
2
3
4
5
6
7
8
9
10
11
12
frequencies = Hash.new
('a'..'z').each {|l| frequencies[l]=0}

File.open("syslog", "r") do |infile|
  while (line = infile.gets)
    if(line =~ /.*<(.*)@0110.be>: Recipient address rejected.*/) then
      frequencies[$1[0,1]]=frequencies[$1[0,1]]+1
    end
  end
end

frequencies.sort.each{ |pair| puts "#{pair[0]};#{pair[1]}" }

Reacties

Om te bewijzen dat jij geen script bent moet het allerlaatste karakter van je reactie '6' zijn.

wink ([;)]) alt= happy ([8)]) alt= unhappy ([8(]) alt= lol ([8D]) alt= p ([8P]) alt= cool ([B)]) alt= beer ([B]) alt=
 
© 2012 0110.be