HTML kodo blokų panašumo vertinimas

  • Simona Ramanauskaitė Vilniaus Gedimino technikos universitetas
  • Kiril Griazev Vilniaus Gedimino technikos universitetas
Prasminiai žodžiai HTML, duomenų panašumas, panašumo vertinimas

Santrauka

Duomenų gavyba iš interneto tinklalapių vis dažniau naudojama organizacijų darbinėje veikloje. Tačiau analizuojant šiuo metu esamą situaciją pastebima, kad egzistuoja metodų ir įrankių pasiūla, kurie gali duomenis atrinkti iš struktūrizuotų puslapių, tuo tarpu nestruktūrizuotiems net nėra mokslinio duomenų rinkinio, kuriuo vadovaujantis būtų galima kurti ir testuoti naujus duomenų atrankos metodus. Šiame darbe siekiama pakeisti šią situaciją, kaip pirmą žingsnį link restruktūrizuotų duomenų rinkinio sukūrimo, pateikiant metodą, skirtą HTML kodo blokų panašumui įvertinti. Šis metodas apima duomenų ir struktūros panašumo vertinimą ir leis kiekybiškai įvertinti dviejų HTML kodo blokų panašumo lygį.

Paskelbtas
2018-06-20
Kaip cituoti
Ramanauskaitė, S., & Griazev, K. (2018). HTML kodo blokų panašumo vertinimas. Jaunųjų Mokslininkų Darbai, 48(1), 30-35. https://doi.org/10.21277/jmd.v48i1.219
Skiltis
Technologijos mokslai