Problémy a úskalí s novou verzí systému na odhalování plagiátorství Theses.cz

16.01.2023 Systém Theses.cz, vyvíjený a provozovaný Fakultou informatiky Masarykovy univerzity, slouží k odhalování plagiátů v závěrečných pracích a je do něj zapojeno více než 60 vysokých a vyšších odborných škol v České republice a na Slovensku.

V průběhu roku 2022 Masarykova univerzita změnila algoritmus vyhledávání podobností, který má lépe odhalit plagiáty, a to zejména tak, že se zaměří na parafrázované texty. Univerzita tak chce efektivněji odhalovat opsané bakalářské či diplomové práce. Jaká je však realita? Originální práce dostávají velmi špatná hodnocení, často několik desítek procent podobnosti, přičemž jako shodu systém mnohdy označuje naprosto nesmyslné pasáže.

Uveďme si názorný příklad na fiktivním studentovi Tomášovi. Tomáš píše bakalářskou práci na téma Hodnocení pracovního výkonu zaměstnanců. Tomáš navštíví knihovnu, půjčí si doporučenou literaturu a pustí se do psaní. Myšlenky autorů odborných publikací přeformuluje a řádně ocituje. Práci odevzdá na své fakultě a těší se na příznivé hodnocení. Ze školy mu však přijde oznámení, že jeho práce byla označena jako plagiát, neboť vykazuje 45 % podobnosti s jinými pracemi. Jak je to možné?

Tomáš si vybral téma, kterému se v minulosti věnovala velká spousta studentů. Mnoho z nich čerpalo informace ze stejných knih, jako Tomáš, provádělo podobný výzkum, jako náš hypotetický student. I přes to, že Tomáš teorii psal svými slovy a vše řádně citoval, systém mu mnohé pasáže označil za plagiát a uvedl „zjištěnou podobnost s několika jinými pracemi“. Databáze Theses.cz totiž obsahuje několik desítek prací na podobná témata a systém mnohé věty, byť pokaždé originální a napsané vlastními slovy autora, označuje za plagiát. Pomyslnou třešničkou na dortu je upozornění na velkou shodu v seznamu literatury či v úvodních prohlášeních a poděkováních.

Pokud Tomášův vedoucí přikládá celkovému procentu podobnosti velkou váhu a pokud se na problematické pasáže nezaměří a neověří si, zda Tomáš text řádně citoval, potom mu práci může „shodit ze stolu“. Tomášovi pak nezbývá nic jiného, než podat odvolání, popř. podnět etické komisi školy k prošetření celého případu.

Je sice pravda, že Thesis na svých stránkách uvádí, že se nedoporučuje zjištěné výsledky předkládat jako oficiální dokument škole (prokazatelná kontrola originality je možná pouze ze strany školy), mnozí kantoři však navzdory tomu tvrdošíjně trvají na tom, že procento shody musí být maximálně jednociferné.

Doporučení pro současné a budoucí studenty proto zní - procentuální vyjádření shody systému Theses je pouze orientační a mělo by vedoucím sloužit pouze jako informace o tom, zda se má na práci více zaměřit a zkontrolovat, zda zjištěné podobné pasáže jsou řádně citovány. Pokud je tomu skutečně tak, potom i práce s procentuální podobností 70 % může být hodnocena jako původní a obdržet známku výborně. Je totiž velký rozdíl v tom, pokud je práce ze 70 % shodná s jinou (jedinou) prací, anebo je práce shodná 1 % se sedmdesáti rozdílnými diplomkami. Celkové procento shody je v obou případech stejné, nicméně je nadmíru jasné, že v prvním případě student opisoval, v druhém se o plagiátorství v žádném případě nejedná.


Zoznam článkov

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 >