1,2 Millionen Webseiten könnten zukünftig Daten für KI sammeln

Ich habe vor paar Jahren Microsoft Clarity auf meiner Webseite verwendet, um primär zu sehen, welche Seiten am meisten aufgerufen werden und sekundär, als Testzweck die Heatmap-Funktion.
Beispiel einer solchen Heatmap. Es registriert nicht nur den Mauszeigerverlauf, sondern filmte sogar die Seitennutzung vereinzelter Nutzer:

Des Weiteren hatte Microsoft Clarity eine rießen Palette an Funktionen. Ich verwendete nur die grundlegensten. Meine Webseite ist nicht mehr aktiv und solche Tools verwende ich gar nicht mehr. Ich verfolge den Traffic auf meiner Seite mittels der Anzahl der HTTP Anfragen und aus welchem Land diese kommen. Mein “Projekt” (so nennt Clarity die Webseiten mit einem Tracker) hab ich jedoch nie gelöscht, obwohl es die Seite nicht mehr gab.
Heute erhielt ich folgende Email von Microsoft Clarity:

We’ve updated the Microsoft Clarity terms of use to explain that we use data for research and development. These changes will take effect on January 2, 2026 […] Microsoft may use non-personal data for research, development and model training.

Opt-out gibt es nicht. Wenn man das nicht will, dann soll man die Nutzung Clarity unterlassen. Immerhin, Microsoft Clarity ist auch kostenlos.

If you do not agree, you can choose to discontinue using Microsoft Clarity, delete your projects and close your account before these terms become effective.

Wie viele Webseiten nutzen Clarity?
Aktuell nutzen 1,2 Millionen Webseiten Clarity. Die allermeisten werden Clarity auch weiternutzen.

Clarity ist DSGVO Konform aufgrund von Aktives Opt-in, anonymisieren von Personally Identifiable Information.
Mir bleibt eher die Frage, was diese rohen Daten der KI bringen sollen. Eine starke Vermutung ist die Optimierung der Website-Erstellung durch künstlicher Intelligenz, beispielsweise mittels Github Copilot.

Habe ich ein Problem damit, dass Website-Betreiber Analytik von Nutzern sammeln?
Nein, im Gegenteil.
Es hilft den Website-Betreibern sehr ihre Website zu optimieren. Frustrierende Situationen für den Nutzer (z.B. langsame Webseiten) kann man basierend auf dem Mauszeiger-Verhalten ermitteln und verbessern. Beispielsweise mittels “rage-clicks” oder der Mausbewegungen:


Habe ich was dagegen, dass es Dienste gibt, die solche Tools anbieten und sich an den gesammelten Daten bereichern (insbesondere Microsoft Clarity und Google Analytics)?
Ja. Die Anbieter versprechen ein DSGVO-Konformes Produkt, das die Website-Betreiber einbauen können und mit einer einfachen “Consent-API” die Zustimmung von Nutzern holen können. Einige EU-Staaten sind da anderer Meinung: Is Google Analytics illegal? Several European Data Protection Authorities say so | Plausible Analytics

Fazit:
Große Website-Analytik Anbieter sind immer wieder in Kritik für ihre Praktiken. Es gibt aber viele Alternativen. Darunter Matamoto, Plausible, GoAccess oder mein Favorit Umami.

LG

2 Likes

Danke @Noah.runggaldier für deinen interessanten Artikel.

Er hat mich auf meinen naive Annahme hingewiesen, dass nur in den Apps solche Möglichkeiten üblich sind. Tatsächlich können sie überall vorhanden sein. Nur speziell in den mobilen Apps ist die Spionagemöglichkeiten wegen der erweiterten Sensorik viel größer als zuhause am Pc möglicherweise ohne Kamera, Mikro und Satellitenortung.

Jetzt versuche ich herauszufinden, ob meine weitere Annahme naiv ist, dass uMatrix mir anzeigen müsste, wenn Dritt-Anbieter vorhanden sind. Ich weiß, dass der erste Blick täuscht, wenn man aber genauer prüft, findet man die Anbieter … sofern ja nicht Microsoft das selbst erledigt.

Hier sind alle Webseiten aufgeführt, die Microsoft Clarity einsetzen. Eine oberflächliche Untersuchung der Drittanbieter von ein paar bekannten Webseiten zeigte keine Gemeinsamkeit.

Dann habe ich mich auf einen großen konzentriert, sap.com :

fli@udoo:~$ host ``sap.com
sap.com`` has address 130.214.229.163
sap.com`` mail is handled by 0 ``sap-com.mail.protection.outlook.com``.
fli@udoo:~$ host ``www.sap.com
www.sap.com`` is an alias for ``www.sap.com.cn.edgekey.net``.
www.sap.com.cn.edgekey.net`` is an alias for ``e259656.dsca.akamaiedge.net``.
e259656.dsca.akamaiedge.net`` is an alias for ``e259656.dsca.akamaiedge.net.0.1.cn.akamaiedge.net``.
e259656.dsca.akamaiedge.net.0.1.cn.akamaiedge.net`` has address 173.222.106.56
e259656.dsca.akamaiedge.net.0.1.cn.akamaiedge.net`` has address 173.222.106.6

uMatrix zeigt praktisch alle Scripte unter www.sap.com, deshalb ein Blick auf den Webseiten-Code.

mit vielen script-Definitionen und Inline-Scripten.

Das bedeutet, dass clarity in Bibliotheken vorhanden sein kann. uMatrix zeigt nur an, was direkt nach außen verbindet.

Eine Suche nach clarity ergab keine Treffer, wär auch zu schön und zu einfach gewesen.

@Noah.runggaldier , hat man eine Chance zu erkennen, ob clarity aktiv ist?

1 Like

Es gibt verschiedene Wege herauszufinden, ob eine Webseite Microsoft Clarity verwendet.

  1. Der offensichtlichste Weg ist sich die Cookie Policy durchzulesen.
    Beispielsweise gibt es bei sap.com folgende Einträge:
Cookie Name Beschreibung Dauer
ANONCHK Identifies and tracks users across sessions for session recording and heatmap features in Microsoft Clarity. Session
CLID The CLID cookie from Microsoft Clarity is used for user tracking and session management 1 month
SM Used by Microsoft Clarity for user session tracking and behavioral analytics 1 year
  1. Ein anderer Weg ist, sich direkt die Cookie Einträge mit dem Browser-DevTools anzusehen, wobei da oft Abkürzungen sind, die nicht aufschlussreich sind.
  2. Ein weiterer Weg ist, sich die Netzwerkanalyse (Traffic) anzusehen. Ich habe bei opentext.com nachgesehen, ob es eine JavaScript Datei gibt mit einem Namen, der Microsoft Clarity nahe kommt. Beispielsweise wurde bei opentext.com folgende JS-Datei geladen: updateClarityConsent.js
  3. “Build With” hat eine eigene Chrome Extension. Aber ich glaube dass da eher von deren Servern die Information hergeholt wird, statt dass die Website analysiert wird.

Lg

1 Like

Dieses automatische Website-Scrapen schadet letztendlich auch Free-Software-Projekten, deren potentielle Einnahmequellen per Werbeschaltungen massiv beschnitten werden. Lest selber folgenden Artikel: Golem

1 Like