Tumblelog by Soup.io
Newer posts are loading.
You are at the newest post.
Click here to check if anything new just came in.

August 30 2012

Big Data vs. Privacy: Großbritannien zentralisiert 52 Millionen Krankenakten für Forschung, Anonymisierung fraglich

In Großbritannien sollen die Krankenakten aller Einwohner zentral gesammelt und mit anderen Datenbanken verknüpft werden. Wissenschaftler sollen damit neue Erkenntnisse finden können. Die Regierung verspricht eine Anonymisierung der Daten – die immer schwieriger zu leisten ist.

Der Nationale Gesundheitsdienst und die medizinische Zulassungs- und Aufsichtsbehörde für Arzneimittel in Großbritannien haben das Projekt Clinical Practice Research Datalink (CPRD) gestartet. Der große Datenpool wird als “Revolution der medizinischen Forschung” gefeiert. Ian Sample berichtet im Guardian:

Das CPRD wird Patientenakten in nie zuvor gesehenem Ausmaß verknüpfen und Patienteninformationen von Ärzten und Krankenhäusern mit anderen Datensätzen kombinieren, darunter Register über Krankheiten und psychische Gesundheit oder Gen-Datenbanken. Die kombinierten Datensätze können durchsucht werden, um Fragen der medizinischen Forschung zu beantworten. Die Ergebnisse werden mit Wissenschaftlern geteilt, sobald sie anonymisiert sind, um die Privatsphäre der Patienten zu schützen. Im Laufe der Zeit wird CPRD weitere Aufzeichnungen einbeziehen, darunter Daten über Umweltverschmutzung, Sozialfürsorge und Daten der UK Biobank, die DNA-, Blut- oder Gewebeproben von 500.000 Menschen besitzt. Schließlich werden ähnliche Systeme von kleineren Bevölkerungen wie Schottland und Wales angebunden.


Premierminister David Cameron verspricht: “Lassen Sie es mich deutlich sagen: Dies ist keine Gefährdung der Privatsphäre.” Die Daten werden nämlich anonymisiert.

Eine nicht umkehrbare Anonymisierung wird im Zeitalter von “Big Data” immer schwieriger. Bereits in den Neunziger Jahren gelang es Forschern, aus einem “anonymisierten” Datensatz mit Krankendaten die Krankenakte des Gouverneurs von Massachusetts herauszufinden, der vorher Anonymität versicherte. Vor fünf Jahren haben Forscher der Universität Texas die Anonymisierung eines ganzen Datensatzes von Netflix gebrochen und rückgängig gemacht. Die Studien zum Thema De-Anomisierung häufen sich:

Informatiker haben unseren Glauben in den Schutz des Datenschutzes durch Anonymisierung, also den Schutz der Privatsphäre durch das Entfernen von persönlichen Informationen wie Namen oder Sozialversicherungsnummer in großen Datensätzen, zerstört. Diese Wissenschaftler haben gezeigt, dass sie Einzelpersonen oft mit erstaunlicher Leichtigkeit aus anonymen Datensätzen “re-identifizieren” oder “de-anonymisieren” können.

Auch die Königliche Gesellschaft Großbritanniens kam kürzlich in einem Bericht Science as an open enterprise zum Schluss:

In der Vergangenheit wurde davon ausgegangen, dass die Privatsphäre von Menschen in Datensätzen durch Prozesse der Anonymisierung, wie der Entfernung von Namen oder Anschrift, geschützt werden könnte. Allerdings haben eine beträchtliche Menge an Studien in der Informatik nun gezeigt, dass die Sicherheit von persönlichen Daten in Datenbanken durch Anonymisierung nicht garantiert werden kann, wenn aktiv nach Identitäten gesucht wird.

Die Auseinandersetzung von Big Data und Privacy hat gerade erst begonnen. Mal sehen, wie lange die britischen Krankenakten anonym bleiben.

flattr this!

Don't be the product, buy the product!

Schweinderl