Verbindungen zwischen Webseiten aufdecken

Eine interessante Aufgabe, ist der Versuch, Verbindungen zwischen Webseiten zu finden. Natürlich sind Indizien, wie: gleiches Design, wiederkehrende Worthülsen, gleiches Impressum u.ä. die man bei der Analyse einer Webseite feststellen kann, schon ein erster Hinweis. Aber auch tiefer in der Technik können sich entsprechende Daten finden.

Google IDs

Zum Beispiel verwenden viele Webseiten die Google Dienste Google Analytics, um ihre Statistiken über Webseitenbesuche zu erstellen, oder Google Adsense um Werbeeinnahmen zu erzielen. Google verlangt dann von den Webseitenbetreibern, dass sie eine gewisse Zeichenfolge in ihre Webseite einbauen. Diese Werte werden dabei auf der Webseite nicht dargestellt, befinden sich aber im Quellcode der Seite. Das Tolle daran ist, dass Du den vollständigen HTML-Quellcode erhältst, wenn Du eine Webseite ansurfst. Du siehst ihn nur nicht direkt. Wenn Du aber auf eine Webseite mit der rechten Maustaste klickst, bekommst Du die Option „Seitenquelltext anzeigen“. Per JavaScript lässt sich dieser Eintrag durch den Webseitenbetreiber abschalten, dann mußt du Strg+u gleichzeitig drücken. Und wenn auch das nicht hilft kannst Du mit F12 die Webentwicklertools öffnen. Auch dort kann man den Quellcode sehen.

Durch das gleichzeitige Drücken von Strg+f bekommt man ein Suchfeld, in das man gewünschte Suchbegriffe in diesem HTML-Quelltext suchen kann.

Google Analytics
IDs von Google Analytics beginnen mit ua-. Seit Google Analytics 4 beginnen sie mit einem G-

Google Adsense
IDs von Google Adsense enhalten die Zeichenfolge -pub-

Diese gefundenen ID-Werte kopiert man sich nun heraus.Sollte der Webseitenbetreiber diese Werte auch auf anderen Webseiten verwendet haben, kann man mit Hilfe unterschiedlicher Dienste weitere Webseiten finden:
DNSlytics (Analytics)
DNSlytics (Adsense)
Spyonweb (Analytics & Adsense)
Natürlich gibt es noch weitere kostenpflichtige Anbieter wie AnalyzeID oder NerdyData. Man hat bei diesen Diensten keine Garantie eine vollständige oder aktuelle Liste zu erhalten. Es kann auch sein, dass in der aktuellen Version der aufgelisteten Webseiten die IDs nicht mehr enthalten sind. Dies sollte man auf jeden Fall im Quellcode überprüfen.

Zertifikate

Um seine Webseite https-verschlüsselt anbieten zu können, benötigt man ein https-Zertifikat. Es gibt kostenlose und kostenpflichtige Anbieter. Man kann ein https-Zertifikat auch für mehrere Domains erstellen. Testen kann man dies gut bei der Webseite sans.org.

Um an das https-Zertifikat zu kommen klickt man im Firefox auf das Schloss Symbol in der URL Leiste. Danach auf „Verbindung sicher“ und „Weitere Informationen“. Danach kann man auf „Zertifikat anzeigen“ klicken. Ich empfehle hier bewusst den Firefox, da die Darstellung im Chrome mir etwas unübersichtlich erscheint.

In dem Zertifikat sucht man nun nach der Überschrift „Alternative Inhaberbezeichnungen“ und findet alle Domains für die dieses Zertifikat gültig ist. Dieses Feld kann aber auch leer sein. Ich habe dazu auch schon mal ein Video gedreht.

Hosting auf selber IP

Man kann natürlich auch nachzusehen, welche anderen Webseiten auf ein und der selben IP-Adresse gehostet werden. Die so gefundenen Webseiten können natürlich von der selben Person/Gruppe betrieben werden, es kann aber auch einfach nur technische Gründe haben, dass die Webseiten auf der selben IP zu finden ist. Auch hier hat man keine Gewähr auf aktuelle oder vollständige Daten. Dienste die so einen Service bieten wären u.a.
Domaintools
MXToolbox
Hacker Target
weitere Dienste wirst Du sicher mit dem Stichwort „Reverse IP Lookup“ in Deiner Lieblingssuchmaschine finden.

Bei Diensten wie Netcraft kann man sich die Hosting History ansehen. Ggf findet man so frühere IP-Adresse oder Dienstleister, bei denen die Webseite gehostet wurde. Ein interessanter Wert kann auch Reverse DNS Domains sein, falls hier eine abweichende Domain steht. Auch sie steht nun im Verdacht mit mit der gesuchten Domain in Verbindung stehen.

Webarchive

Die meisten Menschen machen ihre Fehler am Anfang. Wenn man also sehen will, wie eine Webseite früher aussah, bieten sich Webarchive wie archive.org oder archive.today an. Wenn man Glück hat, findet man in diesen älteren Versionen der Webseite Hinweise oder Verlinkungen, die in der aktuellen Version nicht mehr online sind.

Whois

Früher wurden noch die Adressen des Anmieters im Whois veröffentlicht. Das ist seit vielen Jahren nicht mehr so und um dann bei Diensten wie der DENIC anzufragen, wer die Domain angemietet hat, muß man schon für eine Sicherheitsbehörde arbeiten. Ich bin mir nicht sicher ob es noch mehr Berechtigte gibt. Für die meisten ist das Whois jedenfalls deutlich wertloser geworden. In der Regel lässt sich damit nur noch der Hoster herausfinden. Wer Geld investieren will, kann zumindest bei Domaintools die öffentlichen Whois-Einträge der Vergangenheit einsehen. Aber dies bringt auch nur etwas, wenn die Domain schon sehr lange existiert.