System Antyplagiat – jak to działa?

21-08-2023

System Antyplagiat firmy Plagiat.pl posiada szereg funkcji, które pozwalają w łatwy i czytelny sposób odnaleźć nieprawidłowe lub nieoznaczone zapożyczenia z innego utworu. Autorzy artykułów lub dłuższych opracowań, którzy przesyłają swoje prace do zbadania, mogą liczyć na raport antyplagiatowy w trzech formatach oraz jego krótką interpretację. Usługa ta jest dostępna tylko dla pracowników Politechniki Łódzkiej.

Plagiat.pl to polska firma z dwudziestoletnim doświadczeniem, z którą współpracuje prawie 200 wydawnictw i 700 uczelni w Polsce i na świecie. System Antyplagiat tej firmy, którym dysponuje Wydawnictwo Politechniki Łódzkiej stanowi narzędzie pomocne dla autorów i redaktorów książek i artykułów. Zyskują oni pełną wiedzę o przeanalizowanym tekście, mogą więc poprawić ewentualne błędy i uchybienia jeszcze przed wysłaniem go do publikacji. Raport antyplagiatowy nie ma na celu piętnowania kogokolwiek, tylko wskazanie miejsc, które w wyniku przeoczenia lub złego oznaczenia (brak cudzysłowu czy wyodrębnienia cytatu w tekście) zostały znalezione i zaznaczone przez System jako ewentualne nieuzasadnione zapożyczenie. We współpracy z autorami eliminujemy wszelkie ślady takich niepożądanych powtórzeń.

Sztuczna inteligencja, czyli kto jest autorem?

Od sierpnia 2023 roku system Antyplagiat został wzbogacony o moduł detekcji AI, wykrywający prawdopodobieństwo napisania tekstu przez sztuczną inteligencję. Wynikiem detekcji jest raport, w którym procentowo przedstawia się prawdopodobieństwo powstania tekstu przy udziale narzędzi opartych na GPT (Generative pre-trained transformer). Jest to, stworzony na podstawie ogromnych zbiorów tekstów, duży, maszynowy model językowy, który potrafi sam generować teksty na podstawie podanego mu kontekstu. Moduł detekcji AI pozwala także na wskazanie tych fragmentów publikacji, w których mogło dojść do użycia sztucznej inteligencji. Nowe narzędzia wykorzystywane w trakcie opracowania redakcyjnego służą przede wszystkim zagwarantowaniu oryginalności i rzetelności naukowej, zapewniając tym samym wyższą jakość przyszłych publikacji.

Proces sprawdzania w systemie Antyplagiat

Publikacja, która wpływa do Wydawnictwa Politechniki Łódzkiej w celu sprawdzenia antyplagiatowego (możliwe formaty to: doc, docx, pdf, odt, rtf, ppt, pptx) jest przygotowywana pod kątem przeskanowania w systemie Antyplagiat. Usuwane są takie elementy jak: afiliacje, abstrakty, materiały graficzne, tabele, bibliografie, czy streszczenia. Pozostawiany jest tylko merytoryczny tekst, który jest porównywany z bazami tekstów: RefBooks, Bazą Aktów Prawnych, bazą macierzystą Politechniki Łódzkiej, z Programem Wymiany Baz oraz – przede wszystkim – z zasobami Internetu. Następnie plik Word zostaje wczytany do serwisu Antyplagiat i uruchamia się procedurę sprawdzania.

Zależnie od długości tekstu i stopnia skomplikowania procedura sprawdzania trwa od kilkunastu do kilkudziesięciu minut. Po tym czasie w systemie Antyplagiat publikacja zostaje oznaczona jako sprawdzona, a na pocztę redaktora trafia e-mail z raportami podobieństwa: skróconym, pełnym i interaktywnym. Raporty, wraz z ich interpretacją, redaktor przesyła do autora/autorów pracy.

Skrócony Raport Podobieństwa

Ten raport w formacie PDF zawiera tylko statystyki, bez konkretnych przykładów w tekście. Znajdują się tu następujące elementy:

  • Alerty – zabiegi edytorskie, które mogą mieć na celu zaburzenie wyników analizy, takie jak: znaki z innego alfabetu, rozstrzelenia, mikrospacje, ukryte znaki, parafrazy.
  • Metryka podobieństw – tu badane są trzy współczynniki: Współczynnik podobieństwa 1 (WP1) – nie powinien przekroczyć 50%; Współczynnik podobieństwa 2 (WP2) – przekroczenie 5% wymaga od sprawdzającego szczegółowej analizy; Współczynnik BAP – bada, jaki procent pracy pochodzi z Bazy Aktów Prawnych Wolters Kluwer Polska. W przypadku przekroczenia współczynników, autor badanej pracy otrzymuje wytłumaczenie, na czym polega problem i jak go naprawić.
  • Aktywne listy podobieństw – tu przedstawia się dziesięć najdłuższych fragmentów znalezionych zapożyczeń i poszczególne kryptocytaty oznaczone kolorami według źródła ich pochodzenia. W analizowanych pracach najczęściej pojawiają się fragmenty cytowane z Internetu, oznaczone kolorem zielonym. Podaje się tu adresy internetowe, skąd pochodzą dane zapożyczenia.

Pełny Raport Podobieństwa

Pełny Raport Podobieństwa zawiera to wszystko, co Skrócony Raport Podobieństwa, a dodatkowo treść analizowanej publikacji, z zaznaczonymi na kolorowo miejscami, które budzą wątpliwości, czyli fragmentami zapożyczonymi. Należy te miejsca zweryfikować i sprawdzić, czy zostały oznaczone cudzysłowem lub przypisem.

Interaktywny Raport Podobieństwa

Interaktywny Raport Podobieństwa zawiera wszystko to, co Pełny Raport Podobieństwa, a dodatkowo dane przedstawione są na dzielonym ekranie, na którym na lewo widnieją dane statystyczne (analogicznie, jak w skróconym raporcie podobieństwa), a na prawo tekst z zaznaczonymi fragmentami. Na lewo można otworzyć stronę internetową, gdzie zaznaczony zostaje poszukiwany fragment, a na prawo - znaleźć adekwatny ustęp w badanej publikacji. Raport interaktywny jest najwygodniejszy do porównania badanego tekstu, wobec którego zachodzi podejrzenie plagiatu.

 

Fragment Interaktywnego Raportu Podobieństwa. Po prawej zaznaczone na zielono fragmenty pochodzące z Internetu, a na niebiesko z Bazy Aktów Prawnych Fragment Interaktywnego Raportu Podobieństwa. Po prawej zaznaczone na zielono fragmenty pochodzące z Internetu, a na niebiesko z Bazy Aktów Prawnych

Jak odczytywać Interaktywny Raport Podobieństwa

Na tekście w prawej części ekranu oznaczono fragmenty podobne, pochodzące z innych źródeł oraz cytaty. Cytaty prawidłowo oznaczone cudzysłowem wyodrębnione są liliowym kolorem tła. Zieloną czcionką program zaznacza fragmenty znalezione w Internecie (w dowolnym języku). Na czerwono – z bazy macierzystej Politechniki Łódzkiej i Programu Wymiany Baz. Na pomarańczowo wyróżnione są – fragmenty odnalezione w bazie RefBooks (wielomilionowa baza tekstów naukowych, po polsku i angielsku ze wszystkich dziedzin nauki, obejmuje zasoby m.in. Paperity, Termedia, CH Beck, ArXiv i wiele innych). Niebieskim kolorem tła – fragmenty z Bazy Aktów Prawnych Wolters Kluwer SA. Dwa odcienie zielonego i czerwonego służą do rozróżnienia osobnych fragmentów (albo pochodzących z różnych źródeł, albo z innych miejsc tego samego źródła). System zaznacza też (podkreślenie, jaśniejszy odcień) frazy, które zostały poddane drobnym modyfikacjom, takim jak: zmiana kolejności wyrazów, stosowanie wyrazów bliskoznacznych, dodawanie lub usuwanie słów. Można odczytać oryginalną frazę, zaznaczając zmodyfikowany fragment.

Lewa część ekranu zawiera to wszystko, co Skrócony Raport Podobieństwa. Rubryka „Alerty” pozwala prześledzić liczbę wystąpień zapożyczeń oraz przenieść się do miejsc w tekście, gdzie się znajdują. Odnalezione źródła podobieństwa są prezentowane w postaci posegregowanych list. Pierwsza z nich zawiera dziesięć najdłuższych fragmentów odnalezionych w innych źródłach. Na liście widoczne są dane źródła, statystyki podobieństwa oraz przycisk przeniesienia do miejsca w tekście. Miejsca oznaczone w tekście pogrubioną czcionką wskazują na to, że mamy tu do czynienia z fragmentami zawierającymi 25 słów i więcej (WP2).

W przypadku zbieżnych fragmentów odnalezionych w Internecie istnieje możliwość wyświetlenia poglądu strony internetowej na lewo, tekstu na prawo i nawigowanie między nimi. Sprawdzający może dodawać komentarze do tekstu. Raport interaktywny umożliwia dodanie oceny bezpośrednio w systemie.

W Wydawnictwie Politechniki Łódzkiej ocenę (interpretację) przekazujemy w treści e-maila z załączonymi raportami podobieństwa, skróconym i pełnym, a na życzenie autorów – także interaktywnym.