Wir crawlen ihre Tweets!

Okay, ich bin nicht direkt involviert, aber die Aussage trifft den Kern. Worum geht’s?

Gestern ungefähr zur Zeit des Spiels Argentinien gegen Niederlande bauschte die Verwendung einer Suchmaschine mit angeschlossener Datenbank unter den Piraten auf. Mittlerweile wird es unter #Listengate geführt.Ich möchte zum Nachvollziehen einige Stellungnahmen und Quellen hier zusammenfassen, um sich eine eigene Meinung bilden zu können. Am Ende findet ihr meine persönliche Sichtweise.

Anvil Crawler Lightning
Flickr: Anvil Crawler Lightning
von Clint Mikel (CC BY-NC-SA)

Den ersten Tweet fand ich gegen 19:43 Uhr am 09. Juli 2014:

In meiner Timeline schwappte das ganze gegen 21:00 Uhr am selben Tag. Eine halbe Stunde später hab ich mich eingeklinkt:

Die Suchmaschine wird von einer kleinen Gruppe Piraten namens “Zuse-Crew” betrieben. Und das offenbar schon seit gut einem Monat! Angeblich gab es vorher schon andere Crawler von ihnen.

Sichtweisen

Da ich noch relativ neu in der Partei bin, habe ich andere um Erklärung gebeten.

Wolf Weidner (@Nivatius), Jan Lüdtke-Reißmann (@Jan_LR) und Daniel Schwerd (@netnrd) haben mir Fragen beantwortet.

Es liegt also offensichtlich ein Bruch vor. Insbesondere passt es nicht zum Parteiprogramm.

Kompromat ist belastendes Material, dass später zum Nachteil der observierten Person eingesetzt werden kann:

Solches Material wurde meist verwendet, um unliebsame Personen zu diskreditieren oder mit der Drohung, das Material zu veröffentlichen, Personen zur Kooperation zu zwingen.

Inzwischen wird der Begriff allgemein für Material (z. B. Sexvideos) verwendet, deren Veröffentlichung einer Person schaden könnte.

Eine Veröffentlichung hat hier nicht so die Sprengkraft, da Twitter bereits öffentlich ist 😉

Andererseits werden so für manche Piraten unangenehme Erinnerungen wach.

Bleibt also der Vorwurf einer Gesinnungsdatenbank.

Gesinnungsdatenbank

Derzeit befinden sich rund 4.000 Accounts in der Datenbank – samt auszugsweise Tweets. Dies beinhaltet nicht nur Mitteilungen von Piraten, sondern auch von unbescholtenen Dritten. Jetzt kann man sich fragen, nach welchen Kriterien die Benutzer ausgewählt wurden. Und wie der Crawler entscheidet, welche Tweets zu archivieren.

Es ist auch auffallend, dass andere Mitglieder der Crew nicht erfasst wurden. Ich komme später darauf zurück.

Rechtliche Probleme

Wie heute bereits angesprochen, ergeben sich einige rechtliche Möglichkeiten.

Parteiausschlussverfahren (PAV)

Nach Bundessatzung kann ein Schiedsgericht angerufen werden, allerdings nur von der zuständigen Gliederung (hier Berlin). Es gab in der Vergangenheit angeblich mehrere Versuche, diese Gruppe aus der Partei auszuschließen. Ich wohne in einem anderen Bundesland. Von daher wäre ich für Handreichungen dankbar. Muss ja irgendwo dokumentiert sein …

Bundesdatenschutzgesetz

Das Vorgehen ist mit hoher Wahrscheinlichkeit rechtswidrig. §11 zur Erhebung, Verarbeitung oder Nutzung personenbezogener Daten im Auftrag ist eine Anlaufstelle. Ich bin kein Anwalt und warte hier noch auf eine Stellungnahme.

Twitter Benutzer- und Datenschutzrichtlinien

Mit ziemlicher Sicherheit wurden durch das Crawlen die Benutzerrichtlinien und Datenschutzbestimmungen von Twitter verletzt. Nicht zuletzt durch das Ignorieren der robots.txt, die ein Auslesen verneinte.

Antrag auf Austragung

Naturgemäß gibt es jetzt einige Menschen, die mit der Erfassung öffentlich sichtbarer Beiträge ein Problem haben – übrigens tun Geheimdienste genau das.

Simon Lange hat die Option eingeräumt, Datensätze wieder zu entfernen – allerdings nur bei offensichtlichen Identitätsdiebstählen.

Ich hab einmal nach Kontaktmöglichkeiten gesucht:

Identitätsdiebstahl

Es darf bezweifelt werden, ob es nicht noch andere rechtliche Gründe geben könnte, auf eine Löschung des Datensatzes zu drängen, aber Simon Lange nennt Identitätsdiebstahl als einzigen Grund: Wenn die Realität das Bewusstsein einholt

Technische Maßnahmen

Robots.txt

Die Robots.txt untersagt es Suchmaschinen, bestimmte Bereiche zu indizieren:

# Every bot that might possibly read and respect this file.
User-agent: *
Allow: /?lang=
Allow: /hashtag/*?src=
Allow: /search?q=%23
Disallow: /search/realtime
Disallow: /search/users
Disallow: /search/*/grid

Disallow: /*?
Disallow: /*/followers
Disallow: /*/following

Disallow: /account/not_my_account

Disallow: /oauth
Disallow: /1/oauth

Twitter-Accounts

In Wenn die Realität das Bewusstsein einholt bietet Simon Lange an, seinen Account auf “Geschützt” zu stellen oder DMs zu benutzen, um nicht gecrawlt zu werden.

Inhaber von Domain und IP

Alexander Morlang recherchierte einige Details zur Domain.

Auf einer GNU/Linux-Maschine lassen sich noch einige technische Details ermitteln:

$ host bundes.it
bundes.it has address 162.159.245.73
bundes.it has address 162.159.246.73
bundes.it has IPv6 address 2400:cb00:2048:1::a29f:f549
bundes.it has IPv6 address 2400:cb00:2048:1::a29f:f649
bundes.it mail is handled by 10 mx1.bundes.it.
bundes.it mail is handled by 20 mx2.bundes.it.
$ whois bundes.it</pre>
*********************************************************************
* Please note that the following result could be a subgroup of      *
* the data contained in the database.                               *
*                                                                   *
* Additional information can be visualized at:                      *
* http://www.nic.it/cgi-bin/Whois/whois.cgi                         *
*********************************************************************

Domain:             bundes.it
Status:             ok
Created:            2014-01-19 08:36:07
Last Update:        2014-03-04 10:33:53
Expire Date:        2015-01-19

Registrant
Name:             Simon Lange
Organization:     Simon Lange
ContactID:        SL859952H-FIRMA5
Address:          Gaudystrasse 6
Berlin
10437
DE
DE
Created:          2014-01-19 08:36:05
Last Update:      2014-01-19 08:36:05

Admin Contact
Name:             Simon Lange
Organization:     Simon Lange
ContactID:        SL859952H-FIRMA5
Address:          Gaudystrasse 6
Berlin
10437
DE
DE
Created:          2014-01-19 08:36:05
Last Update:      2014-01-19 08:36:05

Technical Contacts
Name:             Marc Pfeifhofer
Organization:     Firma5
ContactID:        MP494720
Address:          Fischleintalstrasse 15
Sexten
39030
BZ
IT
Created:          2012-07-09 15:19:37
Last Update:      2012-07-09 15:19:37

Registrar
Organization:     Firma5 di Marc Pfeifhofer
Name:             FIRMA5-REG
Web:              http://www.firma5.com

Nameservers
lisa.ns.cloudflare.com
andy.ns.cloudflare.com
$ whois 162.159.245.73</pre>
#
# ARIN WHOIS data and services are subject to the Terms of Use
# available at: https://www.arin.net/whois_tou.html
#

#
# The following results may also be obtained via:
# http://whois.arin.net/rest/nets;q=162.159.245.73?showDetails=true&showARIN=false&ext=netref2
#

NetRange:       162.158.0.0 - 162.159.255.255
CIDR:           162.158.0.0/15
OriginAS:       AS13335
NetName:        CLOUDFLARENET
NetHandle:      NET-162-158-0-0-1
Parent:         NET-162-0-0-0-0
NetType:        Direct Assignment
RegDate:        2013-05-23
Updated:        2013-05-23
Ref:            http://whois.arin.net/rest/net/NET-162-158-0-0-1

OrgName:        CloudFlare, Inc.
OrgId:          CLOUD14
Address:        665 Third Street #207
City:           San Francisco
StateProv:      CA
PostalCode:     94107
Country:        US
RegDate:        2010-07-09
Updated:        2013-01-04
Comment:        http://www.cloudflare.com/
Ref:            http://whois.arin.net/rest/org/CLOUD14

OrgTechHandle: ADMIN2521-ARIN
OrgTechName:   Admin
OrgTechPhone:  +1-650-319-8930
OrgTechEmail:  admin@cloudflare.com
OrgTechRef:    http://whois.arin.net/rest/poc/ADMIN2521-ARIN

OrgAbuseHandle: ABUSE2916-ARIN
OrgAbuseName:   Abuse
OrgAbusePhone:  +1-650-319-8930
OrgAbuseEmail:  abuse@cloudflare.com
OrgAbuseRef:    http://whois.arin.net/rest/poc/ABUSE2916-ARIN

OrgNOCHandle: NOC11962-ARIN
OrgNOCName:   NOC
OrgNOCPhone:  +1-650-319-8930
OrgNOCEmail:  noc@cloudflare.com
OrgNOCRef:    http://whois.arin.net/rest/poc/NOC11962-ARIN

#
# ARIN WHOIS data and services are subject to the Terms of Use
# available at: https://www.arin.net/whois_tou.html
#

Blog-Artikel von anderen

Ohne eigenen Kommentar hier die Artikel von anderen, sofern mir bekannt. Weitere nehme ich in den Kommentaren entgegen:

  • Fefe’s Blog
  • Piratenpartei erstellt Gesinnungsdatenbank gegen linke Twitternutzer
  • Politische Vorratsdaten – eine piratige Gesinnungsdatenbank
  • Wenn die Realität das Bewusstsein einholt
  • Antwort von befreundeten Journalisten von ☭Ekelprinzessin☭ (@ekelias)  WTFPL

    Also die finden dass dieses online abstimmungs dingsbums LQFB eine “gesinnungsüberwachung” ist, weil man damit politische entscheidungsprozesse bis auf die einzeln abgegebene stimme herunter nachvollziehen könnte, und das sei abzulehnen, während es weder “gesinnungsüberwachung”, noch “anlasslose vorratsdatenspeicherung” und völlig in Ordnung sei die kommunikation von 4000 twitterusern anlasslos zu überwachen, mitzuschneiden und auf vorrat zu speichern weil sie mit ca. 20 davon ein Problem haben und hoffen ihnen dadurch später was juristisches anhängen zu können?

    Und das ist DIE Piratenpartei GEGEN Überwachung, GEGEN anlasslose Vorratsdatenspeicherung und FÜR transparente Politik?

    Die erklären anlasslose kommunikationsüberwachung von u.a. Journalisten und Politikern durch PARTEIMITGLIEDER mal eben für ok weil das Parteimitglied die SELBEN AUSREDEN benutzt wie unsere Regierung?

    Und transparente, nachvollziehbare politische entscheidungen in ihrer eigenen Partei sind dann aber plötzlich gesinnungsüberwachung, kontrolle und schlecht und datenschutz und überhaupt?

    Du verarscht mich!

Meine Meinung

Gewöhnt euch dran, dass öffentliche Meinungsäußerungen von jedem erfasst werden können. Ich finde, Simon bringt einige interessante Punkte an. Das gehört für mich zu Medienkompetenz. Vielleicht gibt es dann weniger Geflame. Als Gegemaßnahme empfehle ich ein Untersuchen der Vorwürfe, dass Piraten andere provozieren, diese Meldungen dann löschen und den Provozierten rechtlich zu Leibe rücken. Damit wird die Datenbank hoffentlich überflüssig.

Danke für’s Lesen. Anmerkungen/Kommentare/Hinweise bitte in den Kommentaren.

Advertisements

Ein Gedanke zu “Wir crawlen ihre Tweets!

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s