Privacy op het publieke internet!
Mijn privacy op het internet?
Af en toe zoek ik mijn eigen naam op in Google om te kijken
wat er over mij bekend is. Vreemd genoeg wordt er over mij nooit iets
onverwachts gevonden. Er komt altijd een verhaal naar boven over mijn badminton
prestaties, mijn eigen blog, Linked-In, maar eigenlijk nooit wat onverwachts.
Nu was mijn vraag, is privacy op het internet nog echt wel een probleem?
Nu ben ik ook eigenaar van een bedrijf (Scrape IT) wat internetdata verzameld en
verkoopt. En omdat we deze technologie toch al binnen de deuren hebben en
gezien de nieuwe privacy wetgeving in 2018 zijn wij een project gestart omtrent
privacy. Hier wilde we kijken wat voor informatie we tegenwoordig nog op het
publieke internet over mensen kunnen vinden.
Mijn verwachting is dat we veel informatie kunnen vinden. Een naam, functie, omschrijving, telefoon nummer, adres, kennisen, hobbies en dergelijke zou geen probleem moeten zijn.
De vraag die ik hier wil beantwoorden is de volgende
Wat kunnen we tegenwoordig
vinden over een specifiek persoon op het publieke internet?
Nog een kleine kanttekening
Let op dat we hier maar een klein deel van de privacy op het
internet belichten, het publieke net. Internet kent sowieso een groot probleem
m.b.t. privacy op het gebied van tracking (cookies, ip tracking &
fingerprinting). Dit behandelen ik hier niet.
De zoektocht
Een begrip waar je m.b.t. privacy over personen al snel op
komt is Doxing. Doxing is het vinden van persoonsgegevens over bepaalde
personen op het internet. Deze gegevens worden gebruikt om een persoon te
stalken of lastig te vallen. Doxing was bijvoorbeeld rond 2012 vaak in het
nieuws in combinatie met hackers groepen die gebruikers lastig vielen met gegevens die ze vonden op het internet. Toen scheen
dit heel makkelijk te zijn...
Maar wat is de stand van zaken nu?
Wij zijn begonnen met populaire doxing technieken uit te
proberen. Een simpele is zoeken in Google. Het viel ons tegen wat voor
informatie er te vinden is via Google. Tegenwoordig zijn veel social media toch
een stuk meer gesloten geworden. Je moet eerst inloggen en ook dan is er van
personen nog steeds niet veel te zien. Publieke profielen zijn er steeds minden
en worden ook steeds meer proactief door de Facebooks van deze wereld
afgeschermd. Wel is er via Google nog de nodige informatie te vinden van
Linked-In, maar veel verder als een naam, functie, bedrijf, omschrijving en
delen van relaties gaat het niet. Google lijkt meer privacy bewust te zijn
geworden en geeft niet veel meer aan de buitenkant prijs.
Een andere handige en goede search engine is Duck Duck Go https://duckduckgo.com. Dit is een search
engine die andere search engines combineert en daarnaast ook zorgt dat je
privacy verborgen blijft. Maar omdat deze veel search
engines bij elkaar brengt zorgt dit ook dat op het gebied van privacy als je
zoekt op een persoon ook meer gevonden wordt. Je ziet veel meer
goede hits op onze test personen. Vaak zijn dit bijvoorbeeld
sport resultaten en veel informatie die ze bewust delen met de wereld. Soms
onhandig maar niet heel onverwacht voor de meeste mensen. Wel goed om eens goed te bekijken.
Al met al is onze mening dat zoekmachines veel meer privacy
bewust zijn geworden. Ook de social media sites geven niet meer zomaar alles
weer van hun gebruikers.
Privacy leveranciers
Ook zijn wij gaan zoeken in bestaande databases van privacygegevens
van aanbieders. Hieronder een aantal voorbeelden.
Het lijkt er op dat Pipl alleen nog een enorme database van oude data
heeft. Van onze proefpersonen zien we alleen data van een aantal jaar geleden
en niet veel nieuws meer. Het lijkt er op dat deze site ook problemen heeft met
dat social media/zoekmachines steeds minder lekken.
Peekyou gaat direct zoeken en lijkt geen eigen database te gebruiken. Peekyou is erg gefoces op America,
van onze Nederlandse test personen vinden we niet veel meer als op https://duckduckgo.com of Google
Deze site zoekt artikelen van personen. SocialMention is ook niet op Nederland gefocused, vind niet veel over
onze test personen
Geeft ook niet veel info over onze proef personen, niets nieuws
Zoekt 60+ Sociale media sites, kost ($29,70
voor een half jaar) maar levert niks over onze Nederlandse personen. Deze site is erg gericht op de amerikaanse markt en kan bijvoorbeeld niet overweg met een tussenvoegsel.
Al met al hebben deze sites oude data of vinden hetzelfde
als Google of DuckDuckGo.com. Waarschijnlijk gebruiken ze ook gewoon de search
engines onderwater om de info te vinden. Je ziet sommige als Pipl dat deze veel
historische data heeft uit tijden dat er meer op het publieke internet te
vinden is. Maar heel boeiend is die niet meer voor Nederlandse gebruikers.
Social media sites
Als je op Social media sites zoals Facebook/ Linked-In en
dergelijke inlogt met een account is er vaak veel meer te vinden. Dit hebben we
in dit onderzoek niet onderzocht omdat deze info vaak niet te scrapen is. Een
scraper kan prima inloggen op een site en dan de informatie ophalen echter op
dat moment zijn ze heel duidelijk traceerbaar. Het valt Linked-In op als je
inlogt en daarna automatisch 5000 profielen bekijkt. Je kan dit niet verbergen
want bij elk profiel is de gebruiker bekent die deze bekijkt. Telkens een nieuw
account aanmaken om in te loggen wordt door deze sites ook moeilijk gemaakt.
Daarnaast heeft Linked-In ook al de nodige rechtszaken uitgevoerd tegen scraper
partijen die inloggen wat ook ontmoedigd.
De publieke websites van deze sites staan over het algemeen
erg weinig toe, na een paar profielen slaan ze al vaak dicht per IP en moet je
gaan inloggen. Ook dit is niet meer de moeite om te verzamelen en geeft ook
weinig informatie.
Vandaag kregen we een mail binnen van Linked-In dat mogelijk
meer informatie de komende tijd van een profiel publiek gemaakt zal worden. Nu
is Linked-In al één van de sites die het meeste van de privacy gegevens lekt
(persoonsnaam, functie, locatie, omschrijving) dus we zijn benieuwd wat er dan
nog meer bij komt. We zullen dit in de gaten houden en aanvullen in dit blog mocht er verandering zijn.
Conclusie
Al met al viel het ons erg mee wat er op de publieke
websites te vinden is. Mijn verwachtingen was dat mobiele telefoons/ adressen/ namen/ relaties/ etc goed te vinden zijn op het publieke net maar dat
valt anno 2017 best tegen. Dit maakt me blij want privacy is toch iets wat je
niet publiek zou moeten delen. Het zou niet zo moeten zijn
dan bedrijven/ personen zomaar ongevraagd van alles en nog wat over jouw
weten en hier na gaan handelen.
Echter zoals de kanttekening al aangeeft belichten we hier
maar een klein deel van het privacy aspect. Op het gebied van tracking bestaat
een groot probleem op het huidige internet. Een site zoals Facebook heeft natuurlijk enorm veel
profielen die vrijwillig met deze site gedeeld worden. Dit geeft ze op privacy
kennis een enorme voorsprong. Daarnaast volgt facebook gebruikers over het
internet. Ze registreren op welke sites een gebruiker komt. De dekking graad
van Facebook wordt momenteel op 40% van de internet sites geschat, dit komt overeen met het gevoel wat we hebben qua dekking bij Scrape IT. Hierdoor
ontstaat een enorme schat van informatie in handen van een commercieel bedrijf.
Facebook mag momenteel zelf weten wat ze hier mee doen, of dit aan de achterkant
wordt verkocht aan bedrijven lijkt mij dan ook evident en een serieus probleem
wat aangepakt moet worden. Dit geld natuurlijk voor meer van zulke sites zoals
Google, Twitter, etc.
Nu komt er voor EU burgers in 2018 nieuwe wetgeving met daarin ondermeer "Het recht om vergeten te worden". Dit is volgens mij een goede ontwikkeling. Ben benieuwd hoe dit concreet uitgevoerd zal worden en tot wat voor rechtzaken dit gaat leiden. Over de nieuwe privacy wetgeving of de internet trackers zal ik vast nog wel een keer een blog schrijven. Heb geduld!
Geduld is een schone
zaak maar het moet niet te lang duren…
Comments