![Škrábání obsahu - Technologie Škrábání obsahu - Technologie](https://a.continuousdev.com/technology/content-scraping.png)
Obsah
- Definice - Co znamená Scraping obsahu?
- Úvod do Microsoft Azure a Microsoft Cloud | V této příručce se dozvíte, o čem cloud computing je a jak vám může Microsoft Azure pomoci migrovat a řídit podnikání z cloudu.
- Techopedia vysvětluje obsah škrábání
Definice - Co znamená Scraping obsahu?
Škrábání obsahu je nezákonný způsob krádeže původního obsahu z legitimních webových stránek a zveřejnění odcizeného obsahu na jiné stránky bez vědomí nebo svolení vlastníka obsahu. Škrabky obsahu se často pokoušejí předat ukradený obsah jako svůj vlastní a neposkytují vlastníkům obsahu atribut.
Sběr obsahu lze provést pomocí ručního kopírování a vkládání, nebo může používat sofistikovanější techniky, jako je použití speciálního softwaru, programování HTTP nebo analyzátory HTML nebo DOM.
Většina obsahu, který se stává předmětem stírání, je materiál chráněný autorskými právy; jeho repostování bez souhlasu vlastníka autorských práv je trestným činem.Webové stránky škrabek jsou však hostovány po celém světě a škrabky, které jsou požádány o odstranění obsahu chráněného autorskými právy, mohou domény prostě změnit nebo zmizet.
Úvod do Microsoft Azure a Microsoft Cloud | V této příručce se dozvíte, o čem cloud computing je a jak vám může Microsoft Azure pomoci migrovat a řídit podnikání z cloudu.
Techopedia vysvětluje obsah škrábání
Škrabky obsahu mohou řídit návštěvnost svých webových stránek tím, že stírají vysoce kvalitní obsah s hustotou klíčových slov z jiných webů. Na to jsou obzvláště citlivé bloggeri, pravděpodobně proto, že je nepravděpodobné, že by jednotliví bloggerové zahájili legální útok proti škrabkám. Škrabci jsou vybízeni k tomu, aby pokračovali v této praxi, protože vyhledávače zatím nenašli účinný způsob, jak odfiltrovat jedinečný obsah od poškrábaného obsahu, což umožňuje škrabákům i nadále těžit.
Správci webových stránek se mohou chránit před škrábanci jednoduchými opatřeními, například přidáním odkazů na své vlastní stránky v obsahu. To jim alespoň umožní získat přenos zeškrábaného obsahu. Mezi sofistikovanější metody zacházení se škrabáním boti patří:
- Komerční anti-bot aplikace
- Chytání robotů pomocí honeypotu a blokování jejich IP adres
- Blokování robotů pomocí kódu JavaScript