Privacy op het publieke internet!


Mijn privacy op het internet?

Af en toe zoek ik mijn eigen naam op in Google om te kijken wat er over mij bekend is. Vreemd genoeg wordt er over mij nooit iets onverwachts gevonden. Er komt altijd een verhaal naar boven over mijn badminton prestaties, mijn eigen blog, Linked-In, maar eigenlijk nooit wat onverwachts. Nu was mijn vraag, is privacy op het internet nog echt wel een probleem?
Nu ben ik ook eigenaar van een bedrijf (Scrape IT) wat internetdata verzameld en verkoopt. En omdat we deze technologie toch al binnen de deuren hebben en gezien de nieuwe privacy wetgeving in 2018 zijn wij een project gestart omtrent privacy. Hier wilde we kijken wat voor informatie we tegenwoordig nog op het publieke internet over mensen kunnen vinden.
Mijn verwachting is dat we veel informatie kunnen vinden. Een naam, functie, omschrijving, telefoon nummer, adres, kennisen, hobbies en dergelijke zou geen probleem moeten zijn.
De vraag die ik hier wil beantwoorden is de volgende
Wat kunnen we tegenwoordig vinden over een specifiek persoon op het publieke internet?

Nog een kleine kanttekening

Let op dat we hier maar een klein deel van de privacy op het internet belichten, het publieke net. Internet kent sowieso een groot probleem m.b.t. privacy op het gebied van tracking (cookies, ip tracking & fingerprinting). Dit behandelen ik hier niet.

De zoektocht

Een begrip waar je m.b.t. privacy over personen al snel op komt is Doxing. Doxing is het vinden van persoonsgegevens over bepaalde personen op het internet. Deze gegevens worden gebruikt om een persoon te stalken of lastig te vallen. Doxing was bijvoorbeeld rond 2012 vaak in het nieuws in combinatie met hackers groepen die gebruikers lastig vielen met gegevens die ze vonden op het internet. Toen scheen dit heel makkelijk te zijn...

Maar wat is de stand van zaken nu?

Wij zijn begonnen met populaire doxing technieken uit te proberen. Een simpele is zoeken in Google. Het viel ons tegen wat voor informatie er te vinden is via Google. Tegenwoordig zijn veel social media toch een stuk meer gesloten geworden. Je moet eerst inloggen en ook dan is er van personen nog steeds niet veel te zien. Publieke profielen zijn er steeds minden en worden ook steeds meer proactief door de Facebooks van deze wereld afgeschermd. Wel is er via Google nog de nodige informatie te vinden van Linked-In, maar veel verder als een naam, functie, bedrijf, omschrijving en delen van relaties gaat het niet. Google lijkt meer privacy bewust te zijn geworden en geeft niet veel meer aan de buitenkant prijs.
Een andere handige en goede search engine is Duck Duck Go https://duckduckgo.com. Dit is een search engine die andere search engines combineert en daarnaast ook zorgt dat je privacy verborgen blijft. Maar omdat deze veel search engines bij elkaar brengt zorgt dit ook dat op het gebied van privacy als je zoekt op een persoon ook meer gevonden wordt. Je ziet veel meer goede hits op onze test personen. Vaak zijn dit bijvoorbeeld sport resultaten en veel informatie die ze bewust delen met de wereld. Soms onhandig maar niet heel onverwacht voor de meeste mensen. Wel goed om eens goed te bekijken.
Al met al is onze mening dat zoekmachines veel meer privacy bewust zijn geworden. Ook de social media sites geven niet meer zomaar alles weer van hun gebruikers.

Privacy leveranciers

Ook zijn wij gaan zoeken in bestaande databases van privacygegevens van aanbieders. Hieronder een aantal voorbeelden.
Het lijkt er op dat Pipl alleen nog een enorme database van oude data heeft. Van onze proefpersonen zien we alleen data van een aantal jaar geleden en niet veel nieuws meer. Het lijkt er op dat deze site ook problemen heeft met dat social media/zoekmachines steeds minder lekken.
Peekyou gaat direct zoeken en lijkt geen eigen database te gebruiken. Peekyou is erg gefoces op America, van onze Nederlandse test personen vinden we niet veel meer als op https://duckduckgo.com of Google
Deze site zoekt artikelen van personen. SocialMention is ook niet op Nederland gefocused, vind niet veel over onze test personen
Geeft ook niet veel info over onze proef personen, niets nieuws
Zoekt 60+ Sociale media sites, kost ($29,70 voor een half jaar) maar levert niks over onze Nederlandse personen. Deze site is erg gericht op de amerikaanse markt en kan bijvoorbeeld niet overweg met een tussenvoegsel.
Al met al hebben deze sites oude data of vinden hetzelfde als Google of DuckDuckGo.com. Waarschijnlijk gebruiken ze ook gewoon de search engines onderwater om de info te vinden. Je ziet sommige als Pipl dat deze veel historische data heeft uit tijden dat er meer op het publieke internet te vinden is. Maar heel boeiend is die niet meer voor Nederlandse gebruikers.

Social media sites

Als je op Social media sites zoals Facebook/ Linked-In en dergelijke inlogt met een account is er vaak veel meer te vinden. Dit hebben we in dit onderzoek niet onderzocht omdat deze info vaak niet te scrapen is. Een scraper kan prima inloggen op een site en dan de informatie ophalen echter op dat moment zijn ze heel duidelijk traceerbaar. Het valt Linked-In op als je inlogt en daarna automatisch 5000 profielen bekijkt. Je kan dit niet verbergen want bij elk profiel is de gebruiker bekent die deze bekijkt. Telkens een nieuw account aanmaken om in te loggen wordt door deze sites ook moeilijk gemaakt. Daarnaast heeft Linked-In ook al de nodige rechtszaken uitgevoerd tegen scraper partijen die inloggen wat ook ontmoedigd.
De publieke websites van deze sites staan over het algemeen erg weinig toe, na een paar profielen slaan ze al vaak dicht per IP en moet je gaan inloggen. Ook dit is niet meer de moeite om te verzamelen en geeft ook weinig informatie.
Vandaag kregen we een mail binnen van Linked-In dat mogelijk meer informatie de komende tijd van een profiel publiek gemaakt zal worden. Nu is Linked-In al één van de sites die het meeste van de privacy gegevens lekt (persoonsnaam, functie, locatie, omschrijving) dus we zijn benieuwd wat er dan nog meer bij komt. We zullen dit in de gaten houden en aanvullen in dit blog mocht er verandering zijn.

Conclusie

Al met al viel het ons erg mee wat er op de publieke websites te vinden is. Mijn verwachtingen was dat mobiele telefoons/ adressen/ namen/ relaties/ etc goed te vinden zijn op het publieke net maar dat valt anno 2017 best tegen. Dit maakt me blij want privacy is toch iets wat je niet publiek zou moeten delen. Het zou niet zo moeten zijn dan bedrijven/ personen zomaar ongevraagd van alles en nog wat over jouw weten en hier na gaan handelen.
Echter zoals de kanttekening al aangeeft belichten we hier maar een klein deel van het privacy aspect. Op het gebied van tracking bestaat een groot probleem op het huidige internet. Een site zoals Facebook heeft natuurlijk enorm veel profielen die vrijwillig met deze site gedeeld worden. Dit geeft ze op privacy kennis een enorme voorsprong. Daarnaast volgt facebook gebruikers over het internet. Ze registreren op welke sites een gebruiker komt. De dekking graad van Facebook wordt momenteel op 40% van de internet sites geschat, dit komt overeen met het gevoel wat we hebben qua dekking bij Scrape IT. Hierdoor ontstaat een enorme schat van informatie in handen van een commercieel bedrijf. Facebook mag momenteel zelf weten wat ze hier mee doen, of dit aan de achterkant wordt verkocht aan bedrijven lijkt mij dan ook evident en een serieus probleem wat aangepakt moet worden. Dit geld natuurlijk voor meer van zulke sites zoals Google, Twitter, etc.
Nu komt er voor EU burgers in 2018 nieuwe wetgeving met daarin ondermeer "Het recht om vergeten te worden". Dit is volgens mij een goede ontwikkeling. Ben benieuwd hoe dit concreet uitgevoerd zal worden en tot wat voor rechtzaken dit gaat leiden. Over de nieuwe privacy wetgeving of de internet trackers zal ik vast nog wel een keer een blog schrijven. Heb geduld!
Geduld is een schone zaak maar het moet niet te lang duren…

Comments

Popular posts from this blog

System.Net.Http dll version problems

SharePoint Survey Back Button

How to set up AD FS for a development machine