Czym są dane ustrukturyzowane?
Dane ustrukturyzowane to informacje uporządkowane według jasno określonego schematu. Oznacza to, że poszczególne elementy danych znajdują się w przewidzianych miejscach – na przykład w konkretnych polach lub tagach – co pozwala komputerom automatycznie je lokalizować i interpretować bez zgadywania kontekstu.
Przykłady danych ustrukturyzowanych
- Pliki XML, jak np. e-faktura KSeF. Ministerstwo Finansów jasno wskazuje, że „PDF, JPG ≠ e-Faktura, e-Faktura = XML”. Faktura ustrukturyzowana to faktura wystawiona za pośrednictwem KSeF wraz z nadanym numerem identyfikującym tę fakturę w systemie. Definicja faktury ustrukturyzowanej została wprowadzona na potrzeby ustawy o VAT.
- Formularze elektroniczne, gdzie dane są wpisywane w konkretne pola (np. imię, nazwisko, adres).
- Pliki tabelaryczne (CSV, XLS/XLSX), gdzie informacje są ułożone w wiersze i kolumny.
Dzięki swojej strukturze dane takie są idealne do automatycznego przetwarzania. Systemy komputerowe łatwo importują je do baz danych, sprawdzają ich poprawność i wykorzystują informacje np. do generowania raportów czy zestawień. Typowym przykładem są formularze urzędowe lub e-faktury, które mogą być masowo przetwarzane przez systemy administracji publicznej.
Dane nieustrukturyzowane – co to takiego?
Dane nieustrukturyzowane nie mają ustalonego schematu. To po prostu teksty, obrazy lub skany, które przeznaczone są głównie do odczytu przez człowieka. Komputer nie jest w stanie automatycznie wyciągnąć z nich szczegółowych informacji, ponieważ brakuje im metadanych, które określałyby strukturę treści.
Przykłady danych nieustrukturyzowanych
- Dokumenty PDF, jak skany pism czy tradycyjne umowy.
- Pliki tekstowe DOCX lub ODT, gdzie treść jest ciągła i nie ma wyodrębnionych pól informacyjnych.
- Obrazy lub skany zapisane jako JPG, PNG lub PDF zawierający tylko grafikę.
Dokumenty te są łatwe do odczytu przez ludzi, ale wymagają dodatkowej obróbki, aby wydobyć z nich dane użyteczne dla komputerów.
Jak dobrać format podpisu elektronicznego?
Rozróżnienie między danymi ustrukturyzowanymi i nieustrukturyzowanymi ma duże znaczenie przy wyborze formatu podpisu elektronicznego.
Podpis XAdES – do danych ustrukturyzowanych
XAdES (XML Advanced Electronic Signature) jest optymalnym rozwiązaniem dla dokumentów XML, takich jak e-faktury, formularze urzędowe (np. deklaracje podatkowe czy wnioski do ZUS). Podpis ten nie ingeruje w strukturę dokumentu, dzięki czemu zachowuje integralność danych. Może być zapisany wewnątrz pliku XML lub osobno (jako zewnętrzny plik .xades lub .xml).
XAdES umożliwia automatyczne wczytanie podpisanego dokumentu do systemu komputerowego, co ułatwia i przyspiesza jego dalsze przetwarzanie.
Podpis PAdES i CAdES – do danych nieustrukturyzowanych
- PAdES (PDF Advanced Electronic Signature) idealnie sprawdza się w przypadku dokumentów PDF. Podpis jest zintegrowany bezpośrednio w pliku PDF, dzięki czemu odbiorca otrzymuje jeden wygodny do weryfikacji dokument. Dodatkowo możliwa jest graficzna wizualizacja podpisu, co poprawia czytelność i intuicyjność dokumentów.
- CAdES (CMS Advanced Electronic Signature) można użyć do podpisania praktycznie każdego pliku (Word, obraz, ZIP). Tworzy osobny plik z podpisem (najczęściej .p7s), który dołącza się do oryginalnego dokumentu. Jest szczególnie przydatny tam, gdzie nie można lub nie chce się dokumentu konwertować do formatu PDF. Należy pamiętać, format ten jest najstarszym formatem podpisu, który wywodzi się z klasycznej technologii podpisów kryptograficznych używanych już od wielu lat. Więcej o jego ograniczeniach przeczytasz tutaj (Podpis wewnętrzny a zewnętrzny – różnice, formaty i zastosowania (Część 2)
W praktyce ...
…CO WYBRAĆ?
- Dane ustrukturyzowane (np. XML) najlepiej podpisywać formatem XAdES.
- Dane nieustrukturyzowane (np. PDF, DOCX, skany) – formatem PAdES (dla PDF) lub CAdES (dla innych rodzajów plików).
Dobór odpowiedniego formatu podpisu elektronicznego do typu danych zapewnia wygodę, integralność dokumentu oraz efektywność jego dalszego wykorzystania zarówno przez ludzi, jak i systemy komputerowe.
Niezależnie jednak od wybranej metody, oba rodzaje podpisów (SimplySign i Certum Mini) gwarantują ten sam poziom bezpieczeństwa i prawnej ważności, wynikający z kwalifikowanego certyfikatu.
Posiadając tę wiedzę, możemy świadomie wybrać format i typ podpisu najlepiej dopasowany do danej sytuacji, zapewniając zarówno wygodę, jak i zgodność z przepisami.
Kwalifikowane podpisy SimplySign oraz Certum Mini
Jeśli masz jakiekolwiek wątpliwości lub pytania, skontaktuj się z nami
Odpowiemy na Twoje pytania, znajdziemy pasujący Ci termin oraz doradcę w Gdańsku, Gdyni, Krakowie, Warszawie lub Wrocławiu.
Możesz również napisać od nas emaila [email protected].