O nas

Otwarty System Antyplagiatowy (OSA) powstał w ramach projektu realizowanego przez Międzyuniwersyteckie Centrum Informatyzacji przy współpracy z Instytutem Podstaw Informatyki Polskiej Akademii Nauk i Poznańskim Centrum Superkomputerowo-Sieciowym.

Jest odpowiedzią na rosnące zjawisko plagiatowania prac dyplomowych. Na polskim rynku jest już kilka rozwiązań, które pozwalają weryfikować jakość pracy pod kątem jej oryginalności. Autorzy systemu proponują kolejne narzędzie, którego filozofia działania odbiega od pozostałych rozwiązań.

System do porównania tekstów, nie korzysta bezpośrednio z oryginalnej ich postaci, lecz ze struktur danych przechowującymi częściową informację. Są to tzw. mapy. Takie podejście ma trzy zasadnicze zalety.

  • Z bazy tych struktur nie można odtworzyć żadnego z tekstów, który posłużył do jej utworzenia.
  • Porównanie map w bazie wystarcza do wskazania zapożyczeń między badanymi pracami ze znacznie lepszą efektywnością niż porównanie oryginalnych tekstów jeden do jednego. Przeprowadzone dotychczas testy wykazały wielką odporność systemu na wszelkie, znane jego autorom, metody kamuflażu nieuprawnionych zapożyczeń (zmiana szyku, przestawianie zdań, zastąpienie części słów ich synonimami, kompilacja z wielu źródeł, podstawienia czcionek).
  • Jest możliwość indeksacji wielkich baz prac referencyjnych (np. ORPPD) poprzez mapy lub inne skróty nieodwracalne.

Tworzenie i aktualizacja bazy map ‒ oraz innych baz niezbędnych do funkcjonowania systemu ‒ są w pełni zautomatyzowane i odbywają się na podstawie przetworzenia wskazanych przez użytkownika plików zapisanych w jednym z następujących formatów:

  • txt,
  • pdf,
  • doc,
  • docx,
  • odt,
  • rtf.
  • odp,
  • epub,
  • ppt,
  • pptx,
  • ppsm,
  • ppsx,
  • pptm.

Dodatkowo w ramach jednej Uczelni system umożliwia dokładniejsze przyjrzenie się oryginałom prac, w odniesieniu do których stwierdził zbyt wysoki poziom podobieństwa ich map. Tekst badanej pracy można porównać, jeden do jednego, z oryginalnym tekstem każdej z podzbioru prac referencyjnych i polskojęzycznych stron internetowych wyselekcjonowanych przez system na bazie podobieństwa map. Zwykle jest to podzbiór kilkuelementowy.

Należy pamiętać, że każdy system antyplagiatowy, by działać skutecznie musi mieć dużą bazę wzorców (tekstów referencyjnych), z którymi następuje porównanie. W tej wersji prace mogą być porównywane z ponad 0.6 miliarda polskojęzycznych stron internetowych.