Jak wykorzystać dane w dziennikarstwie śledczym?

Jak wykorzystać dane w dziennikarstwie śledczym? - 1 2025

Jak dziennikarze zmieniają dane w broń przeciw korupcji

Pamiętacie aferę taśmową z 2014 roku? Nagrania były szokujące, ale prawdziwa praca dziennikarzy zaczęła się dopiero wtedy, gdy trzeba było przeanalizować setki godzin nagrań, tysiące maili i dokumentów. To właśnie moment, w którym dziennikarstwo śledcze przestało być tylko sztuką rozmowy, a stało się nauką o danych.

Narzędzia, których nie znają oszuści

W 2018 roku dziennikarze z OKO.press odkryli, jak firma budowlana oszukiwała w przetargach drogowch. Sekret? Zwykły Excel. Wystarczyło posortować dane po NIP-ach wykonawców i datach przetargów – opowiada jeden z reporterów. Nie wiedzieli, że ktoś może wpaść na pomysł sprawdzenia, czy te same firmy zawsze składają oferty minimalnie niższą od konkurencji.

Dziś w arsenale dziennikarzy są już znacznie potężniejsze narzędzia:

  • Python + Pandas – analiza milionów rekordów w kilka minut
  • OCR (np. Tesseract) – gdy trzeba przeszukać zeskanowane PDF-y
  • NodeXL – wizualizacja powiązań między osobami
  • Google Earth Engine – śledzenie zmian w terenie na przestrzeni lat

Prawda leży w krzyżówce danych

Najlepsze śledztwa powstają, gdy łączy się różne źródła danych. Tak było w przypadku afery reprywatyzacyjnej w Warszawie, gdzie dziennikarze połączyli:

Rodzaj danych Skąd Co ujawniły
Akty notarialne Sądy rejonowe Podejrzanie niskie ceny transakcji
Rejestr beneficjentów Ministerstwo Sprawiedliwości Powiązania między kupującymi
Dane o majątku Deklaracje majątkowe Nagły wzrost wartości majątków urzędników

Najtrudniejsze nie było zdobycie tych danych, ale zrozumienie, jak je ze sobą powiązać – przyznaje reporter zaangażowany w śledztwo. Czasem między pobraniem danych a publikacją mijało pół roku analiz.

Ciemna strona mocy danych

W 2021 roku pewien dziennikarz śledczy wpadł na trop nielegalnych praktyk firmy farmaceutycznej. Problem? Informacje zdobył, analizując wyciek danych medycznych pacjentów. Czy cel uświęca środki? Redakcje coraz częściej muszą odpowiadać na takie pytania.

Mamy wewnętrzne protokoły – mówi szef działu śledczego jednej z większych redakcji. Jeśli dane są jawne – używamy. Jeśli wyciekły – oceniamy ich wrażliwość. Ale zawsze pytamy: czy ujawnienie przysłuży się społeczeństwu bardziej niż zaszkodzi jednostkom?

Przyszłość: dziennikarze i algorytmy

Najnowsze projekty pokazują, że maszyny mogą być partnerami dziennikarzy:

Śledzenie zmian w dokumentach: Algorytmy porównują kolejne wersje ustaw, pokazując znikające zapisy

Analiza sieci powiązań: Programy znajdują ukryte związki między politykami i biznesem

Wykrywanie anomalii: Systemy wskazują nietypowe transakcje wśród milionów zwykłych

Ale uwaga! Algorytm pokaże ci dziwną transakcję, ale tylko człowiek zrozumie, dlaczego jest ona dziwna – ostrzega analityk danych z Fundacji ePaństwo.

Jak zacząć przygodę z dziennikarstwem danych?

Nie trzeba od razu programować w Pythonie. Zacznij od:

  1. Przeanalizuj lokalny budżet – jakie wydatki wydają się niecodzienne?
  2. Sprawdź na stronie BDL GUS dane o twojej gminie – czy coś cię zaskoczyło?
  3. Porównaj wyniki wyborcze różnych partii – może znajdziesz ciekawe korelacje?

Pamiętaj – w dziennikarstwie danych najważniejsze nie są liczby, ale historie, które za nimi stoją. Twoim zadaniem jest je opowiedzieć.