Etiskt Web Scraping

Är web scraping etiskt? Att bedriva web scraping kan vara etiskt under förutsättning att det görs på ett respektfullt sätt som tar hänsyn till lagar, regler och etiska normer. Det innebär att man måste undvika att samla in personlig information, respektera upphovsrätten och inte överbelasta webbplatser. Dessutom bör man vara transparent med syftet och användningen av den insamlade datan samt vara beredd att respektera eventuella förbud eller begränsningar som webbplatserna sätter upp för web scraping. Att bedriva web scraping på ett etiskt sätt kräver respekt för både lagar och användare.

Web scraping från ursprungskällan

Att göra web scraping från konkurrenters webbplatser och sedan använda denna data mot nya kunder är oetiskt. Det är viktigt att samla in data från ursprungskällan. Genom att hämta data från den ursprungliga källan undviker man risken för att begå stöld eller intrång i upphovsrättsskyddat material. Genom att fokusera på att samla in data från ursprungskällan visar man respekt för lagar, etik och rättigheter.

Personuppgifter

Personuppgifter är det information om fysiska individer, till exempel, kontaktuppgifter, i form av e-postadresser, namn och telefonnummer. Generellt är personuppgifter information som kan hjälpa identifiera en fysisk person. Även om det finns lagliga grunder för att behandla personuppgifter, ska undvika att samla in personupgifter. Generiska affärs-e-postadresser (till exempel kontakt@ eller info@) är inte personuppgifter.

Upphovsrättsskyddat data

Man får inte heller scrapa data som är upphovsrättsskyddat, exempelvis bilder, ritningar och databaser.

Web scraping bete sig som en vanligt människa

Etisk web scraping innebär också att scrapern ska bete sig så mycket som en människa som det bara går. Med andra ord ska den surfa igenom varje sida som ska scrapas, precis på samma sätt som en människa går in och kopierar och klistrar in data för hand. Skillnaden blir att scraperna kan jobba dygnet runt, och behöver inte heller ta paus för lunch eller fika.