Škrábání obsahu

Autor: Robert Simon
Datum Vytvoření: 19 Červen 2021
Datum Aktualizace: 24 Červen 2024
Anonim
Škrábání obsahu - Technologie
Škrábání obsahu - Technologie

Obsah

Definice - Co znamená Scraping obsahu?

Škrábání obsahu je nezákonný způsob krádeže původního obsahu z legitimních webových stránek a zveřejnění odcizeného obsahu na jiné stránky bez vědomí nebo svolení vlastníka obsahu. Škrabky obsahu se často pokoušejí předat ukradený obsah jako svůj vlastní a neposkytují vlastníkům obsahu atribut.

Sběr obsahu lze provést pomocí ručního kopírování a vkládání, nebo může používat sofistikovanější techniky, jako je použití speciálního softwaru, programování HTTP nebo analyzátory HTML nebo DOM.

Většina obsahu, který se stává předmětem stírání, je materiál chráněný autorskými právy; jeho repostování bez souhlasu vlastníka autorských práv je trestným činem.Webové stránky škrabek jsou však hostovány po celém světě a škrabky, které jsou požádány o odstranění obsahu chráněného autorskými právy, mohou domény prostě změnit nebo zmizet.


Úvod do Microsoft Azure a Microsoft Cloud | V této příručce se dozvíte, o čem cloud computing je a jak vám může Microsoft Azure pomoci migrovat a řídit podnikání z cloudu.

Techopedia vysvětluje obsah škrábání

Škrabky obsahu mohou řídit návštěvnost svých webových stránek tím, že stírají vysoce kvalitní obsah s hustotou klíčových slov z jiných webů. Na to jsou obzvláště citlivé bloggeri, pravděpodobně proto, že je nepravděpodobné, že by jednotliví bloggerové zahájili legální útok proti škrabkám. Škrabci jsou vybízeni k tomu, aby pokračovali v této praxi, protože vyhledávače zatím nenašli účinný způsob, jak odfiltrovat jedinečný obsah od poškrábaného obsahu, což umožňuje škrabákům i nadále těžit.

Správci webových stránek se mohou chránit před škrábanci jednoduchými opatřeními, například přidáním odkazů na své vlastní stránky v obsahu. To jim alespoň umožní získat přenos zeškrábaného obsahu. Mezi sofistikovanější metody zacházení se škrabáním boti patří:


  • Komerční anti-bot aplikace
  • Chytání robotů pomocí honeypotu a blokování jejich IP adres
  • Blokování robotů pomocí kódu JavaScript