С появлением Интернета жизнь людей сильно изменилась. В настоящее время нет необходимости проводить много времени за книгами в поисках необходимой информации. Люди получили неограниченный доступ практически к любой информации, что позволяет получать знания и использовать их по своему усмотрению [3]. Но человек, который делится в Интернете какой-то информацией или своими знаниями, не имеет защиты от незаконного копирования и распространения. Информация, попадая в Интернет, становится общедоступной, а вопрос о соблюдении авторского права на сегодняшний день остается нерешенным [6].
Нарушение авторского права – это правонарушение, суть которого составляет использование произведений науки, литературы и искусства, охраняемых авторским правом, без разрешения авторов или правообладателей или с нарушением условий договора об использовании таких произведений. К числу основных способов нарушения авторских прав относится незаконное копирование и распространение произведения, а также плагиат [2].
Плагиат – это заимствование чужой работы, будь то преднамеренно или непреднамеренно.
Плагиат – это использование, перефразирование и подведение итогов работы в любой форме без подтверждения ссылками на источники и представление её как своей собственной работы [1].
Неограниченный доступ к любой литературе, огромное количество публикаций в Интернете, большое число различных изданий – все это усложняет процесс определения первоначального автора [5].
Поэтому на сегодняшний день для борьбы с плагиатом в статьях, работах студентов и преподавателей, а также в других изданиях существуют специальные сервисы и программы. Например: онлайн-сервисы – Copyscape, Miratools, Антиплагиат, Istio.com, программы – Advego Plagiatus, Praide unique content analyzer, Double Content Finder.
Помимо сервисов и программ имеются специальные компьютерные методы для обнаружения плагиата (рисунок 1).
Рис. 1. Методы для обнаружения плагиата
Методы для обнаружения плагиата можно разделить по типу оценки сходства: оценка локального сходства и оценка глобального сходства (таблица 1) [11].
Таблица 1
Методы выявления плагиата
Критерии сравнения |
Оценка локального сходства |
Оценка сходства в целом (оценка глобального сходства) |
Описание |
Для обнаружения плагиата используется небольшая часть текста. |
Для обнаружения плагиата используются значительная часть или весь текст [9]. |
Способы выявления плагиата |
дактилоскопия; анализ встречаемости термина. |
анализ встречаемости термина; выявление плагиата, основанное на цитировании; изучение языковых стилей. |
Для компьютерного выявления плагиата существуют различные способы, в таблице 2 представлены некоторые из них [15].
Таблица 2
Способы выявления плагиата
Способы выявления плагиата |
Описание |
Метод дактилоскопии |
Метод дактилоскопии заключается в сравнении рассматриваемого документа с «отпечатками». «Отпечатками» является набор из нескольких строк, которые позволяют описать содержание текста и выбираются из некоторого количества текстов. При сравнении все найденные совпадения указывают на общие части текста. |
Метод анализа «множества слов» |
Метод анализа «множества слов» заключается в сравнении эталонного множества слов с двумя исследуемыми текстами. Для проверки текстов с помощью данного метода сначала с помощью специального алгоритма производится предварительная обработка текста, то есть удаляются все слова, которые не несут никакой смысловой нагрузки в тексте. После этого происходит подсчет количество пересечения слов, которые одновременно имеются в эталонном множестве и в проверяемом тексте. Для генерации эталонного множества существует 3 способа: статическое множество слов, созданное на основании научных текстов по нескольким направления; статическое множество слов, созданное на основании текстов по определенному направлению; динамическое формирование слов [7]. |
Анализ шаблона цитат |
Анализ шаблона цитат является способом, который представляет собой подпоследовательности, содержащие не только общие цитаты для двух документов, но и подобный порядок и близость цитат в тексте, являющихся основными критериями для определения шаблона цитат. |
Метод изучения языковых стилей |
Метод изучения языковых стилей является статическим методом, который заключается в сравнении моделей. Стилометрические модели — модели, построенные для разных фрагментов текста, которые стилистически отличаются друг от друга. |
Самым действенным способом для установления плагиата в РФ является экспертиза. Суть экспертизы заключается в сравнении нескольких текстов. При сравнении высчитывается процент контекстуальных совпадений, перефразирования и других форм переработки текста для определения факта, является ли текст оригинальным или нет. Экспертизу проводят специально обученные эксперты, в основном по решению суда.
Но экспертиза является дорогой и длительной процедурой. Поэтому для установления плагиата многие используют более простые и быстрые способы – онлайн-сервисы и программы. Такие системы получили название «системы антиплагиата».
Принципы работы систем антиплагиата
Системы антиплагиата используют следующие системы для поиска заимствований:
1) метапоисковые системы – системы, которые не имеют собственной базы документов. Метапоисковые системы отправляют запрос в поисковые системы сети Интернет, а также проверяют документ специальными методами (например, метод выборок);
2) поисковые системы сети Интернет – системы, которые не позволяют обнаружить заимствования. Но некоторые поисковые системы (например, Google) позволяют найти статьи, которые опубликованы в мировых изданиях, и цитирования в них, хотя и не обозначенные как заимствования;
3) специализированные системы – системы, которые имеют собственный алгоритм для поиска заимствований и свою базу документов.
Отличительной чертой метапоисковых систем является то, что они имеют доступ только к документам, которые имеются в свободном доступе. Но даже если документ находится в открытом доступе, то это не гарантия того, что он будет найден, так как часть форматов не поддерживается [10]. Еще одной особенностью таких систем является то, что проверка может быть невозможна или ее результаты будут неверны. Это происходит из-за неправомерного использования поисковой системы автоматизированными средствами и в результате возможна блокировка поисковой системы по IP.
А отличительной чертой специализированных систем является их самодостаточность, то есть они имеют свои алгоритмы, собственную базу, которая может иметь документы, не представленные в открытом доступе. К тому же специализированные системы имеют высокую скорость работы в отличие от метапоисковых систем [8].
Существует множество различных российских и зарубежных систем и программ для выявления плагиата и большинство из них используют метапоисковые системы или оболочки к ним, направленные на поисковую оптимизацию.
Следует отметить, что использовать зарубежные системы для проверки российских научных работ на заимствование не имеет особого смысла, так как они не имеют базы с русскоязычными документами [4].
Популярные российские и зарубежные онлайн-системы и программы для проверки текстов на плагиат представлены в таблице 3.
Таблица 3
Популярные российские и зарубежные системы поиска плагиата
Наименование системы для поиска плагиата |
Оплата за использование системы |
Пользователи системы |
Описание системы |
Российские системы для поиска плагиата |
|||
Антиплагиат (Антиплагиат.Ру) |
Имеются бесплатные и платные версии. Бесплатная версия имеет ограничения функциональности, а платная – имеет расширенный функционал. |
Пользоваться системой могут любые зарегистрированные пользователи, а также высшие учебные заведения. |
Система имеет набор услуг, которые реализуют технологию поиска нарушения авторских прав с помощью проверки текстовых документов на наличие заимствований из открытых источников сети Интернет и других источников [12]. |
Detector-plagiata.ru (“Детектор плагиата») |
Система имеет бесплатные и платные версии. |
Систему в основном используют издательства, учебные заведения, владельцы информационных и web-ресурсов, юридические организации и практикующие юристы, специализирующиеся на защите интеллектуальной собственности, авторы и правообладатели любых текстовых материалов. |
Система, направленная на выявление заимствований текста, осуществляет поиск плагиата не только в Интернете, но и в документах, расположенных на жестком диске или съемном носителе. Отличительной чертой «Детектор плагиата» является возможность поиска контрафактного использования произведений, находящихся под авторскими правами. |
Advego Plagiatus |
Проверка уникальности текста является бесплатным. |
Систему могут использовать любые пользователи. |
Advego Plagiatus — программа, которая проводит проверку на поиск плагиата. Данная система позволяет выбирать тип проверки: глубокая или обычная. А также в данной программе есть возможность выбора поисковых систем, в которых будет проводиться проверка [14]. |
Etxt Антиплагиат |
Система является бесплатной. |
Пользоваться системой могут любые пользователи. |
Etxt Антиплагиат — система для проверки уникальности текста. Проверку текста с помощью Etxt Антиплагиат можно осуществить 2 способами: скачав программу на сайте или использовав онлайн-версию. |
Плагиата.НЕТ |
Программа является бесплатной. |
Систему могут использовать все пользователи. |
Плагиата.НЕТ — программа для поиска плагиата. Принцип работы данной программы заключается в разбиении статьи на фразы и их поиска в Интернете. |
Зарубежные системы для поиска плагиата |
|||
Copyscape [13] |
Система является бесплатной, но имеются и платные версии для автоматической проверки. |
Пользоваться системой могут любые пользователи, но ограниченное число раз. Но для безграничного количества попыток необходимо пройти регистрацию. |
Copyscapе — система, которая осуществляет проверку на наличие заимствований с использовнием таких поисковых систем, как Google и Yahoo! |
Istio |
Существует платные и бесплатные версии Istio |
Системой могут пользоваться все незарегистрированные пользователи. |
Istio.com — система для анализа документов, которая позволяет проводить проверку на наличие заимствований и показывает сайты, откуда был скопирован текст. |
Аrticlechecker |
Сервис является бесплатным |
Система доступна для всех пользователей |
Аrticlechecker — онлайн-сервис, позволяющий проверять докуменеты с помощью Google или Yahoo поиска. |
Duplichecker |
Система является бесплатной |
Систему могут использовать все зарегистрированные пользователи. Если пользователь не зарегистрировался, то он имеет ограниченное количество проверок текста. |
Duplichecker — онлайн сервис, который проверяет каждый фрагмент текста на построчной основе для поиска в нем плагиата. |
Таким образом, можно сделать вывод, что на сегодняшний день плагиат является большой проблемой во всем мире. Существует множество систем и программ для выявления заимствований, но ни одно из них не может дать 100% гарантию, что в работе найдены все не уникальные фрагменты. И поэтому для получения более точного результата проверки лучше проверить текст несколькими системами или же обратиться за экспертизой, хотя этот способ является платным и долговременным.
Библиографическая ссылка
Севостьянова И.О. ОБЗОР СИСТЕМ ПРОВЕДЕНИЯ ПРОВЕРКИ НА ПЛАГИАТ: ОБЩЕРОССИЙСКИЕ И ЗАРУБЕЖНЫЕ // Научное обозрение. Педагогические науки. – 2017. – № 5. – С. 162-166;URL: https://science-pedagogy.ru/ru/article/view?id=1681 (дата обращения: 03.12.2024).