PAN: potrzebny szerszy dostęp do danych - strona 2

16.09.2021
PAN

Transparentny i efektywny proces udzielania dostępu do danych, zwłaszcza danych administracyjnych z publicznych wykazów (rejestrów), wymaga uwzględnienia tego aspektu już przy konstrukcji baz danych. Udostępnianie danych wymaga również wyznaczenia instytucji odpowiedzialnej za udzielanie tego dostępu. W przypadku złożonych baz danych i konieczności integrowania danych z różnych źródeł, przygotowanie zbioru danych do badań może wymagać niebanalnych operacji na bazach, a co za tym idzie zespołu fachowców znających strukturę zasobów, których zadaniem jest przygotowywanie danych do dalszych analiz. Obecnie, rejestry dotyczące COVID-19 znajdują się w kilku instytucjach (Centrum e-Zdrowia, Główny Inspektorat Sanitarny, Narodowy Instytut Kardiologii – Państwowy Instytut Badawczy, Narodowy Instytut Zdrowia Publicznego – PZH – Państwowy Instytut Badawczy), a dane są wymieniane pomiędzy rejestrami. Zasady ewentualnego udostępniania danych do badań nie zostały jednak określone, w tym nie została określona jedna instytucja odpowiedzialna za ten proces.

Dane wtórne pochodzące ze źródeł administracyjnych z reguły mają wiele ograniczeń, które powinny być brane pod uwagę przy ich analizie. Znajomość procesu pozyskiwania danych jest istotna zarówno w przypadku danych rejestrowych, jak i danych pozyskiwanych w trakcie zaplanowanych badań i eksperymentów. Analiza danych wtórnych wymaga więc szczegółowej wiedzy na temat procesu zbierania danych, a w przypadku bardziej złożonych zbiorów – współpracy z instytucjami odpowiedzialnymi za ich zbieranie. Dobrą praktyką może być publikowanie danych wraz z ich opisem jako osobnej publikacji, tzw. data paper, skupiającej się na samych danych bardziej niż na wnioskach z nich płynących. Publikacja taka spełniałaby również rolę docenienia samego procesu pozyskiwania danych. Znajomość tego procesu, jak i weryfikacja spójności danych powinna być jednym z zadań instytucji odpowiedzialnej za proces udostępniania danych.

Zalecenia

Stworzenie kultury szerokiego udostępniania danych może budować zaufanie do decyzji administracji, to z kolei jest kluczowe w radzeniu sobie z epidemią, dlatego zalecamy:

  • publiczne udostępnianie danych na najwyższym możliwym poziomie szczegółowości, nieodpłatnie i bez konieczności rejestracji. Takie dane powinny być dostępne dla mediów, przedsiębiorców i ogółu społeczeństwa. Wymaga to utworzenia i utrzymywania trwałej platformy, umożliwiającej wizualizację danych, ale także pobranie aktualnych danych w formie pozwalającej na ich dalszą analizę. Pociąga to za sobą konieczność jasnego ustalenia akceptowalnego i zgodnego z prawem ochrony danych osobowych i wrażliwych poziomu szczegółowości udostępnianych danych.
  • zdecydowanie większe otwarcie zbiorów danych administracyjnych i badawczych dla celów wtórnych analiz dotyczących COVID-19. Większe otwarcie zbiorów danych wymaga utworzenia infrastruktury umożliwiającej bezpiecznie udostępnianie zasobów, w tym transparentnych zasad udostępniania danych i, co bardzo ważne, wyznaczenia instytucji odpowiedzialnej za ten proces. Zasady udostępniania danych powinny zostać opracowane we współudziale środowisk naukowych oraz specjalistów ds. ochrony danych osobowych.
  • utworzenie wyspecjalizowanej i niezależnej jednostki prowadzącej repozytorium danych badawczych, w szczególności pochodzących z populacyjnych badań społecznych odnoszących się do postaw i zachowań podczas pandemii. Jednostka ta mogłaby również koordynować proces pozyskiwania takich danych, tak by umożliwić niezależną ocenę trendów.
  • udostępnianie wyników badań. Publikacje naukowe, choć cenne, pojawiają się dopiero po pewnym czasie. W okresie pandemii istotny jest czas i komunikowanie kluczowych wyników jak najszybciej. W naszym Stanowisku nr 18 poświęconym komunikacji publicznej w czasie pandemii wskazywaliśmy na decydującą rolę niezależnych instytucji i zespołów eksperckich. Takie zespoły mogłyby również stanowić forum dyskusji nad nieopublikowanymi jeszcze wynikami badań.
  • udział w międzynarodowych inicjatywach dotyczących zasobów danych dostępnych zarówno dla naukowców, jak i dla przedsiębiorców. Otwieranie zasobów informacyjnych jest postrzegane jako długofalowy kierunek rozwoju i jest częścią Europejskiej Strategii dla Danych. Strategia ta wprowadza regułę otwartego, darmowego używania i dystrybucji zbiorów danych z systemów i badań prowadzonych ze środków publicznych oraz wskazuje na konieczność określenia uczciwych i jasnych zasad dostępu do danych. Konieczna jest też inwestycja w infrastrukturę, także tą ogólnoeuropejską oraz zapewnienie odpowiednich uprawnień, narzędzi i umiejętności instytucjom generującym dane. Zgodnie z tą strategią Komisja Europejska we współpracy ze środowiskami naukowymi podjęła inicjatywę utworzenia Europejskiej Chmury dla Otwartej Nauki, w której ze strony polskiej aktywny udział bierze Narodowe Centrum Nauki. W perspektywie kilku lat Europejska Chmura będzie wirtualnym środowiskiem z łatwo dostępnymi usługami przechowywania, zarządzania, analizy i ponownego wykorzystywania danych badawczych, współdzielonych pomiędzy różnymi dyscyplinami naukowymi i państwami członkowskimi UE. Niezbędna jest jednak intensyfikacja prac w tym zakresie.

O zespole

Interdyscyplinarny zespół doradczy ds. COVID-19 powołano w PAN 30 czerwca 2020 r. Przewodniczącym grupy jest prezes PAN prof. Jerzy Duszyński, a jego zastępcą – prof. Krzysztof Pyrć (Uniwersytet Jagielloński). Funkcję sekretarza pełni dr Anna Plater-Zyberk (Polska Akademia Nauk). Członkami zespołu są ponadto: dr Aneta Afelt (Uniwersytet Warszawski), Małgorzata Kossowska (Uniwersytet Jagielloński), Radosław Owczuk (Gdański Uniwersytet Medyczny), dr hab. Anna Ochab-Marcinek (Instytut Chemii Fizycznej PAN), dr Wojciech Paczos (Instytut Nauk Ekonomicznych PAN, Cardiff University), dr hab. Magdalena Rosińska (Narodowy Instytut Zdrowia Publicznego – Państwowy Zakład Higieny), Andrzej Rychard (Instytut Filozofii i Socjologii PAN), dr hab. Tomasz Smiatacz (Gdański Uniwersytet Medyczny).

strona 2 z 2
Aktualna sytuacja epidemiologiczna w Polsce Covid - aktualne dane

COVID-19 - zapytaj eksperta

Masz pytanie dotyczące zakażenia SARS-CoV-2 (COVID-19)?
Zadaj pytanie ekspertowi!