Алгоритм распознавания плагиатов кодов программ

Saved in:
Bibliographic Details
Title: Алгоритм распознавания плагиатов кодов программ
Publisher Information: БГТУ, 2018.
Publication Year: 2018
Subject Terms: копирайт, хэш, токенизация, кластеризация, распознавание плагиатов, теория алгоритмов
Description: В данной статье рассмотрен алгоритм распознавания плагиатов кодов программ. Предлагаемый алгоритм позволяет оценить схожесть программных текстов и построить соответствующие кластеры. Описан подход к разработке программного обеспечения, реализующего данный алгоритм, сформулированы задачи, решаемые таким программным обеспечением. Основой алгоритма распознавания плагиатов является алгоритм жадного строкового замощения, который дает хорошие результаты сравнения текстов. Кластеризация осуществляется над графом, в котором каждой вершине сопоставляется исследуемый код программы, а кластер представляет собой подмножество вершин, соответствующее подмножеству схожих программ. Граф является взвешенным: каждому ребру ставится в соответствие число от 0 до 1, выражающее степень схожести двух программ. Областью применения программного обеспечения, разработанного на основе подходов, описанных в статье, являются системы автоматизированного тестирования, применяемые при проведении соревнований по спортивному программированию.
Document Type: Article
File Description: application/pdf
Access URL: https://openrepository.ru/article?id=43825
Accession Number: edsair.httpsopenrep..c3c55113d61e0af3b44e7d5243d26a8d
Database: OpenAIRE
FullText Text:
  Availability: 0
CustomLinks:
  – Url: https://explore.openaire.eu/search/publication?articleId=httpsopenrep%3A%3Ac3c55113d61e0af3b44e7d5243d26a8d
    Name: EDS - OpenAIRE (s4221598)
    Category: fullText
    Text: View record at OpenAIRE
  – Url: https://www.webofscience.com/api/gateway?GWVersion=2&SrcApp=EBSCO&SrcAuth=EBSCO&DestApp=WOS&ServiceName=TransferToWoS&DestLinkType=GeneralSearchSummary&Func=Links&author=
    Name: ISI
    Category: fullText
    Text: Nájsť tento článok vo Web of Science
    Icon: https://imagesrvr.epnet.com/ls/20docs.gif
    MouseOverText: Nájsť tento článok vo Web of Science
Header DbId: edsair
DbLabel: OpenAIRE
An: edsair.httpsopenrep..c3c55113d61e0af3b44e7d5243d26a8d
RelevancyScore: 809
AccessLevel: 3
PubType: Academic Journal
PubTypeId: academicJournal
PreciseRelevancyScore: 809.340270996094
IllustrationInfo
Items – Name: Title
  Label: Title
  Group: Ti
  Data: Алгоритм распознавания плагиатов кодов программ
– Name: Publisher
  Label: Publisher Information
  Group: PubInfo
  Data: БГТУ, 2018.
– Name: DatePubCY
  Label: Publication Year
  Group: Date
  Data: 2018
– Name: Subject
  Label: Subject Terms
  Group: Su
  Data: <searchLink fieldCode="DE" term="%22копирайт%22">копирайт</searchLink><br /><searchLink fieldCode="DE" term="%22хэш%22">хэш</searchLink><br /><searchLink fieldCode="DE" term="%22токенизация%22">токенизация</searchLink><br /><searchLink fieldCode="DE" term="%22кластеризация%22">кластеризация</searchLink><br /><searchLink fieldCode="DE" term="%22распознавание+плагиатов%22">распознавание плагиатов</searchLink><br /><searchLink fieldCode="DE" term="%22теория+алгоритмов%22">теория алгоритмов</searchLink>
– Name: Abstract
  Label: Description
  Group: Ab
  Data: В данной статье рассмотрен алгоритм распознавания плагиатов кодов программ. Предлагаемый алгоритм позволяет оценить схожесть программных текстов и построить соответствующие кластеры. Описан подход к разработке программного обеспечения, реализующего данный алгоритм, сформулированы задачи, решаемые таким программным обеспечением. Основой алгоритма распознавания плагиатов является алгоритм жадного строкового замощения, который дает хорошие результаты сравнения текстов. Кластеризация осуществляется над графом, в котором каждой вершине сопоставляется исследуемый код программы, а кластер представляет собой подмножество вершин, соответствующее подмножеству схожих программ. Граф является взвешенным: каждому ребру ставится в соответствие число от 0 до 1, выражающее степень схожести двух программ. Областью применения программного обеспечения, разработанного на основе подходов, описанных в статье, являются системы автоматизированного тестирования, применяемые при проведении соревнований по спортивному программированию.
– Name: TypeDocument
  Label: Document Type
  Group: TypDoc
  Data: Article
– Name: Format
  Label: File Description
  Group: SrcInfo
  Data: application/pdf
– Name: URL
  Label: Access URL
  Group: URL
  Data: <link linkTarget="URL" linkTerm="https://openrepository.ru/article?id=43825" linkWindow="_blank">https://openrepository.ru/article?id=43825</link>
– Name: AN
  Label: Accession Number
  Group: ID
  Data: edsair.httpsopenrep..c3c55113d61e0af3b44e7d5243d26a8d
PLink https://erproxy.cvtisr.sk/sfx/access?url=https://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsair&AN=edsair.httpsopenrep..c3c55113d61e0af3b44e7d5243d26a8d
RecordInfo BibRecord:
  BibEntity:
    Languages:
      – Text: Undetermined
    Subjects:
      – SubjectFull: копирайт
        Type: general
      – SubjectFull: хэш
        Type: general
      – SubjectFull: токенизация
        Type: general
      – SubjectFull: кластеризация
        Type: general
      – SubjectFull: распознавание плагиатов
        Type: general
      – SubjectFull: теория алгоритмов
        Type: general
    Titles:
      – TitleFull: Алгоритм распознавания плагиатов кодов программ
        Type: main
  BibRelationships:
    IsPartOfRelationships:
      – BibEntity:
          Dates:
            – D: 01
              M: 01
              Type: published
              Y: 2018
          Identifiers:
            – Type: issn-locals
              Value: edsair
ResultId 1