Wer seid „ihr“ überhaupt?
Von: Kunden-ID478848-1514_sjcwjpnzam@hughes.callmecallyou.com
Kenne ich nicht, aber wer solche lustigen Mailadressen mit „ruf mich, ruf dich“ und völlig bedeutungsfreien ID-Nummern hat, ist ganz sicher ein besonders hochqualitativer Qualitätsspammer.
In diesem Fall erreicht mich der Qualitätsspammer mit seiner Mail, in der er mir schreibt, dass er mich nicht erreichen kann. Nicht, dass dieser Qualitätspfosten mich morgen noch anruft – und wenn ich dann „Hallo“ sage, sagt er einfach nur „Schade, dass sie nicht da sind“. Liest der eigentlich seinen Müll selbst? Denkt der überhaupt darüber nach? Kann der das überhaupt?
Aber die Spam ist dafür erfreulich kurz:
Wir konnten Sie nicht erreichen, bitte bestätigen Sie die Informationen
Und da steht gar nichts Neues drin. Einfach nur der offensichtliche Bullshit aus dem Betreff noch einmal wiederholt. Obwohl der schon im Betreff nichts darüber gesagt hat, um was zum hackenden Henker es hier überhaupt geht, damit die Spam auch ja nicht vom Spamfilter aussortiert wird. Aber diesmal ist eine falsche Codierung angegeben worden, und deshalb ist der Umlaut zerschossen. Die meisten Spammer scheitern hier ja eher im Betreff, weil es ein bisschen hirnt, für eine Headerzeile noch ein Encoding anzugeben. Nachdem man einen Header wie…
Content-Type: text/html; charset="ISO-8859-1"
…in seiner Mail hat, kann man in der eigentlichen Nachricht nichts mehr falsch machen. Sie muss nur wirklich in der angegebenen Zeichenkodierung vorliegen, sonst wird alles, was nicht in sieben Bit passt, falsch interpretiert.
Umlaute zum Beispiel.
In ISO-8859-1 ist ein „ü“ mit dem Byte – wer das Wort „Byte“ im Lande des informationstechnischen Analphabetismus noch nie gehört hat, denke sich einfach stattdessen „Zahl“ und merke sich, dass diese Zahl nur von 0 bis 255 gehen darf, um in acht Bit zu passen¹ – 252 kodiert. Ärgerlicherweise hat der Spammer seinen Text aber in UTF-8 reinkopiert, was übrigens in nahezu allen heute benutzten Betrübssystemen die Standardkodierung ist. Und da wird das „ü“ zwar auch (erfreulich abwärtskompatibel) mit dem Byte 252 kodiert, aber da in UTF-8 Unicode vollständig abgedeckt werden soll, muss ein viel größerer Wertebereich ermöglicht werden. Da kommt man mit 256 möglichen Werten nicht aus. Zahlen über 127 werden deshalb in mehreren aufeinanderfolgenden Bytes kodiert, und die führenden Bits in den Bytes werden dabei zu einer Markierung, dass hier eine größere Zahl codiert ist, deren Darstellung in mehrere aufeinanderfolgenden Bytes zerlegt wurde. Aus dem „ü“ mit dem Codepunkt 252 werden in UTF-8 die beiden Bytes 195 und 188. Diese sind in ISO-8859-1 jedoch zwei Zeichen, die dann anstelle des gewünschten Umlautes treten und in einem Text sehr falsch aussehen. 🔍️
Solche Fehler sieht man öfter mal in Spam, und man sieht sie nur in Spam. In Mitteilungen denkender und fühlender Menschen kommen solche Fehler nicht vor. Normal kommunizierende Menschen benutzen nämlich einfach eine gute Mailsoftware, die es richtig macht, ohne dass man darauf auch nur einen Gedanken verschwenden müsste. Der Spammer hingegen benutzt ein Spamskript, und er mag sich auch nicht allzuviel Mühe damit geben (wenn er sich Mühe geben wollte, könnte er ja gleich arbeiten gehen), und deshalb versteht er sein irgendwo im Internet mitgenommenes Spamskript nicht. Hätte er die Ausgabe der Headerzeile mit der Zeichenkodierung angepasst, so dass da…
Content-Type: text/html; charset="UTF-8"
…stünde, wäre der Umlaut korrekt dargestellt worden. Aber wie schon gesagt: Dafür hätte der Spammer sich ja Mühe geben müssen. Und dann könnte er doch gleich arbeiten gehen. 🛠️
Die Spam ist im HTML-Format. Da hätte unser Spammer übrigens auch den Umlaut „ü“ mit der HTML-Entität ü
schreiben können. Das funktioniert völlig unabhängig von der benutzten Zeichenkodierung. Das ist zwar einfach, aber würde noch mehr Mühe machen.
Ich hätte ja lieber etwas Inhaltliches über die Spam geschrieben, aber wo kein Inhalt ist, sondern nur so ein völlig kryptisch formulierter Grund, dass man jetzt in eine Spam klicken soll…
Oh! Ich sehe gerade im Quelltext, dass da noch ein anonym und kostenlos bei Imgur gehostetes Bild nachgeladen werden soll. Das Bild sieht auch aus, und zwar so:
Die Paketspam, die chinesische Wasserfolter des Posteinganges. Ich hoffe mal, dass da niemand mehr drauf reinfällt.
¹Es ist in Wirklichkeit alles noch ein bisschen komplizierter, vor allem, wenn die Zahlen auch ein Vorzeichen haben. Aber ich will hier keine Einführung in die praktische Informatik geben. Vermutlich habe ich mit meinen runtergekürzten Erläuterungen schon mehr als die Hälfte der Leser in die Flucht geschlagen. Wer daran interessiert ist, wie Zahlen und Zeichenketten im Computer dargestellt werden, findet im Internet mit Leichtigkeit hervorragende Vorlesungsreihen sehr guter Didaktiker an unseren Fachhochschulen… ähm, die heißen jetzt ja „Hochschulen für angewandte Wissenschaft“. Ein paar Mathekenntnisse sind dabei hilfreich, aber man kommt eigentlich mit Schulwissen aus, ergänzt um das an der Schule leider nicht so gut vermittelte Wissen, was ein Stellenwertsystem ist.