Według danych Raven Tools ok. 29% wszystkich treści w Internecie to skopiowane treści, czyli potocznie zduplikowany content. Znaczna jego część to niezamierzone działanie firm.
Nadrzędnym celem Google jest dostarczanie użytkownikom tego, czego szukają. Jednym z elementów tej polityki jest promowanie stron internetowych z treściami wysokiej jakości, oraz „karanie” tych, którzy jakości treści nie stawiają na czele listy priorytetów.
Wysoka jakość treści ma wysoką cenę. Nic więc dziwnego, że wiele firm, szukając oszczędności, narusza wytyczne wyszukiwarki Google. Z tego artykułu dowiesz się:
- czym są unikalne treści,
- dlaczego warto zadbać o unikatowość treści na swojej stronie internetowej,
- czym grozi duplicate content i thin content.
Algorytm Panda i rozkwit copywritingu
Przed 2010 rokiem copywriter był niszowym zawodem, ot, od czasu do czasu któraś firma najęła zawodowca, by wymyślił slogan reklamowy, jak Jarek Kaniewski i: “Pij mleko, będziesz wielki” czy teraźniejsze “Brawo Ty” Plusa.
W sierpniu 2011 r. do Polski została wprowadzona jedna z pierwszych flagowych zmian algorytmu Google, czyli Panda. Głównym założeniem tej aktualizacji było promowanie stron z wartościowymi, merytorycznymi treściami, a obniżanie pozycji stron z treściami krótkimi, bezużytecznymi lub wprost skopiowanymi.
Uderzenie algorytmu szczególnie wyraźnie widać było w sklepach internetowych, które w dużej mierze miały albo puste strony produktów, albo opisy skopiowane ze strony producenta lub dostarczone przez hurtownię.
Oberwało się także specjalistom SEO, którzy uruchamiali strony bez użytecznej treści, przesycone słowami kluczowymi, stworzone przez różnego rodzaju oprogramowanie.
Wtedy też pojawiły się zamówienia na tzw. precle, czyli treści na presell pages. Jedynym celem stron presell było pozyskanie linka zwrotnego stronie pozycjonowanej. Treść na stronie presell miała być przede wszystkim unikatowa, a niekoniecznie wartościowa. Wówczas nastąpił wykwit “copywriterów” tworzących precle hurtowo za niewielką opłatą.
Czym jest duplicate content, thin content i dlaczego Google ich nie lubi
Duplicate content to sytuacja, kiedy pod dwoma różnymi adresami URL jest taka sama lub bardzo podobna treść. Oznacza to wprost, że ktoś od kogoś “ściągał”. W tym momencie Google ma problem, bo musi inwestować swoje zasoby w odkrycie tego, kto jest oryginalnym autorem, a kto kopiował.
W tym aspekcie Google przypomina naszą panią od polskiego w sytuacji, gdy podczas sprawdzania prac domowych znalazła dwa takie same wypracowania w dwóch różnych zeszytach. Google, podobnie jak nauczycielka, podejmie trud odkrycia, kto od kogo kopiował.
Google zbada datę publikacji jednej i drugiej treści oraz sprawdzi, czy na którejś ze stron nie ma atrybutu rel=”canonical” – wskazujące oryginalne źródło. Jeśli go brak to na podstawie autorytetu jednej i drugiej strony internetowej spróbuje oszacować, kto jest bardziej prawdopodobnym autorem.
Tak jak pani od polskiego. Jeśli autorem jednego z identycznych wypracowań jest uczeń piątkowy, a drugiego uczeń dwójkowy, można łatwo zgadnąć, kto od kogo ściągał.
W odróżnieniu jednak od nauczyciela, Google nie weźmie uczniów do tablicy i nie będzie ich odpytywać. Zamiast tego strona o większym prawdopodobieństwie autorstwa pojawi się wyżej w wynikach wyszukiwania, a ta o niższym (potencjalny plagiator) spadnie w pozycjach lub całkiem wyleci z indeksu.
Albo obie spadną.
Co więcej, problem „duplicate content” może dotyczyć zarówno kopiowania treści między domenami jak i w przypadku gdy kopiujemy „sami od siebie” umieszczając ten sam opis na przykład na stronie produktu i stronie głównej.
Thin content to w uproszczeniu strony, które mają bardzo małą lub brak wartości dla użytkowników.
Dlaczego Google kara za zduplikowane treści?
Marnowanie crawl budgetu
Crawl budget w wielkim skrócie oznacza zasoby, jakie Google posiada, by odwiedzać i skanować treści na Twojej stronie. Google dąży do maksymalnej efektywności, więc jeśli zobaczy tę samą treść w dwóch różnych miejscach na Twojej stronie, uzna, że marnujesz jej zasoby. Analogiczna sytuacja, ma miejsce w przypadku „thin content”. Skutkuje to, że roboty rzadziej odwiedzają Twoją stronę.
Występowanie duplicate i thin content samo w sobie sprawia, że Twoja strona ucierpi w rankingach. Marnując „crawl budget” sprawiasz, że wszelkie dokonywane zmiany będą wymagały więcej czasu, by Google je dostrzegło.
Rozmycie linków przychodzących
W sytuacji gdy ta sama treść jest opublikowana pod kilkoma różnymi adresami URL w obrębie Twojej domeny, wszystkie adresy URL mogą zyskać linki zwrotne. Większą korzyść odniesiesz, jeśli linki z innych stron w internecie będą wskazywać na jedną podstronę.
Nieprawidłowe URLe
Najpowszechniejszą sytuacją, zwłaszcza wśród nowopowstałych stron internetowych, jest brak ujednolicenia adresu URL i w efekcie strona wyświetla się w 2 różnych wersjach:
- z przedrostkiem www – www.przykladowastrona.pl,
- bez przedrostka – przykladowastrona.pl.
Dodatkowo po niepoprawnym wdrożeniu certyfikatu SSL, strona rozbija się na dwie kolejne wersje:
- https://przykladowastrona.pl,
- http://przykladowastrona.pl
Możesz być zupełnie nieświadomy, że Google zamiast jednej strony głównej widzi cztery adresy url i ocenia je jako skopiowana treść.
Plagiatorzy prześcigną Cię w pozycjach w wyszukiwarce Google
W sytuacji, kiedy masz na swojej stronie tę samą treść na kilku podstronach, a Twój konkurent skopiuje ją 1:1 i opublikuje u siebie na jednej podstronie, nawet w identycznej formie, to on w oczach Google może wyglądać lepiej.
W sytuacji gdy Google zbada Twoją stronę i stronę plagiatora i na Twojej zarejestruje zduplikowane treści, a na stronie konkurenta dany tekst będzie wyglądał jak unikalny i wartościowy to Google może uznać Ciebie za kopiującego. Tym bardziej jeśli dodamy do tego problemy z wydajnością
Niezbyt sprawiedliwe, ale pamiętaj, że robot Google to robot.
Kopiowanie treści po prostu źle wygląda
Strona ze skopiowanymi treściami robi kiepskie wrażenie. Problem jest mniejszy, kiedy sprzedajesz ogólnodostępne produkty, i chcesz wypromować stronę tekstem możliwie najtaniej. Kłopot narasta kiedy na unikatowości treści opiera się Twoja marka (np. zawodowo zajmujesz się tworzeniem treści, usługami podatkowymi, tworzeniem stron czy jakimikolwiek innymi usługami), kopiowaniem treści strzelasz sobie w kolano. Dodatkowo opinia plagiatora będzie się za Tobą ciągnąć w branży po wieki.
Nie wspominając o tym, że oryginalny autor tekstu może żądać usunięcia naruszenia jego praw autorskich oraz rekompensaty. Naruszasz w ten sposób jego własnośc intelektualną.
Unikatowe treści nadają stronie autentyczności
Wysokiej jakości treści na Twojej stronie internetowej gwarantują wzrost autorytetu zarówno w oczach Google, jak i użytkowników. Użytkownik, który widzi, że treść jest napisana porządnie, poprawnie i niesie za sobą wysoką wartość merytoryczną, na pewno doceni trud (lub inwestycję) i łatwiej zaufa Twojej firmie w kwestii produktu, który oferujesz.
Czytelnik nie będzie musiał weryfikować Ciebie jako autorytetu, bo Twoja wiedza o tym świadczy. Dodatkowo przemyślaną strategią contentową, możesz odpowiadać na pytania, które nurtują Twoich klientów. Poświęcasz czas na stworzenie treści raz, by w przyszłości uniknąć odpowiedzi na te same pytania.
Jak zadbać o unikalne treści na stronach internetowych?
Przede wszystkim – nie kopiować. Robotom Google zajmuje ułamek sekundy odnalezienie identycznego fragmentu tekstu na innych stronach internetowych. Kopiowanie w nadziei, że Google się nie dowie, to mrzonka.
Użyj narzędzi, by sprawdzić unikalność treści na stronie
Ustalmy, że duplikacja treści może zajść na dwóch płaszczyznach:
- treści już opublikowane na stronie,
- treści odebrane od wykonawcy na przykład copywritera, który pisze treści na nasze zamówienie.
W obu przypadkach warto skorzystać z narzędzi. Najbardziej znane narzędzia do badania unikatowości contentu na stronie to:
- Copyscape,
- Grammarly,
- Quetext,
- ScreamingFrog,
- Enago,
- Siteliner,
- Duplichecker,
- ProWritingAid,
- Unicheck,
- Scribbr,
- PlagScan,
- Plagramme.
Zdarza się, że duplikacja treści nie jest zamierzona. Bardzo często ma to miejsce przy błędach podczas stosowania paginacji lub niewłaściwego użycia atrybutu rel=”canonical”. Duplikację warto sprawdzić w kontekście występowania w obrębie serwisu jak i poza nim.
Ustaw przekierowania lub linki kanoniczne
Pomimo szczerych chęci, przemyślanej struktury strony i precyzyjnych procedur w firmie, na stronie nadal mogą się pojawić duplikaty. Wówczas w celu wskazania wyszukiwarce Google unikalnego tekstu możesz:
- ustawić atrybut rel=”canonical”, by wskazać Google docelowo unikalny content,
- ustawić przekierowanie 301 ze zduplikowanego contentu na właściwy adres.
To pierwsze wykonujesz wtedy, gdy nie chcesz, by strona duplikacją treści znikła z mapy witryny. Najczęściej ma to miejsce przy różnych wersjach tego samego produktu oraz paginacji. Przykładowo jeden model telefonu w róznych kolorach lub buty w różnych rozmiarach
Drugie rozwiązanie jest bardziej radykalnei odniesie lepszy skutek wtedy, gdy strona z duplikacją treści nie powinna pojawiać się w wyszukiwarce.
Zamawiaj treści z dobrego źródła
Jeżeli mówimy o treściach zamawianych od autora zewnętrznego, warto (przynajmniej na początku współpracy) sprawdzać jego utwory narzędziem antyplagiatowym. Dobry copywriter nie pozwoli sobie na zarzuty o plagiat, ale strzeżonego pan Bóg strzeże.
W dzisiejszych czasach coraz trudniej o dobrego copywritera. W branży SEO można usłyszeć głosy, że: “dobry copywriter jest na wagę złota i jak już go znajdziesz to nie należy mówić o nim nikomu. Żeby konkurencja się o nim nie dowiedziała”. Niemniej jednak jeśli chcesz zadbać o swój content marketing, popytaj znajomych, czy znają dobrego twórcę treści na strony internetowe. Zwróć uwagę na to, że świetny copywriter w temacie florystyki może totalnie nie poradzić sobie w tekstach technologicznych i na odwrót.
Wskazówka: aby łatwo sprawdzić, czy copywriter jest autorem unikalnych treści, wklej dwa, trzy zdania wprost do wyszukiwarki Google. Jeśli w wynikach wyszukiwania zobaczysz pogrubiony tekst, który teoretycznie miał byc unikatowy i jeszcze nie jest opublikowany będzie to oznaczało plagiat.

Czym grozi publikowanie tej samej treści pod wieloma adresami URL?
Jeśli chodzi o duplicate content, kary jako takiej nie ma. Pracownicy Google mówili o tym wielokrotnie, że nie karają w przypadku duplikacji treści.
Czy to oznacza, że można kopiować? Nie.
Rozważmy dwa scenariusze. Ty i Twój rywal macie domeny o podobnym autorytecie oraz rozbudowany blog firmowy. Ty masz u siebie duplikaty treści – on ma same unikalne artykuły.
Twoja strona pojawi się niżej w organicznych wynikach wyszukiwania na pożądane słowa kluczowe, niż jego.
Unikalna treść na danej stronie www zawsze będzie bardziej wartościowa w oczach Google i użytkowników.
Podsumowanie
Wierzę, że w przystepny sposób udało mi się przedstawić Ci zawiłości i problemy wynikające ze stosowania skopiowanej treści. Pamiętaj, że tworzenie unikatów dla unikatów również nie ma senu, jeśli omawiany przez Ciebie temat nie niesie wartości dla czytelnia. Pomyśl o nim w pierwszej kolejności i dostarcz 10 razy więcej wartości od swojej konkurencji!