Co to jest duplikacja treści, czyli jak uniknąć duplicate content

Freelancer SEO

Według danych Raven Tools ok. 29% wszystkich treści w Internecie to skopiowane treści, czyli potocznie zduplikowany content. Znaczna jego część to niezamierzone działanie firm.

Nadrzędnym celem Google jest dostarczanie użytkownikom tego, czego szukają. Jednym z elementów tej polityki jest promowanie stron internetowych z treściami wysokiej jakości, oraz „karanie” tych, którzy jakości treści nie stawiają na czele listy priorytetów. Algorytmy Google mają za zadanie identyfikować i obniżać widoczność strony w wynikach wyszukiwania, która zawiera zduplikowane treści, co może prowadzić do zmniejszenia organicznego ruchu i potencjalnych kar.

Wysoka jakość treści ma wysoką cenę. Nic więc dziwnego, że wiele firm, szukając oszczędności, narusza wytyczne wyszukiwarki Google. Z tego artykułu dowiesz się:

  • czym są unikalne treści,
  • dlaczego warto zadbać o unikatowość treści na swojej stronie internetowej,
  • czym grozi duplicate content i thin content.

Algorytm Panda i rozkwit copywritingu

Przed 2010 rokiem copywriter był niszowym zawodem, ot, od czasu do czasu któraś firma najęła zawodowca, by wymyślił slogan reklamowy, jak Jarek Kaniewski i: “Pij mleko, będziesz wielki” czy teraźniejsze “Brawo Ty” Plusa.

W sierpniu 2011 r. do Polski została wprowadzona jedna z pierwszych flagowych zmian algorytmu Google, czyli Panda. Głównym założeniem tej aktualizacji było promowanie stron z wartościowymi, merytorycznymi treściami, a obniżanie pozycji stron z treściami krótkimi, bezużytecznymi lub wprost skopiowanymi. Duplikacja treści szkodzi pozycjonowaniu, ponieważ może wprowadzać w błąd algorytmy Google, prowadząc do obniżenia widoczności i ruchu, a w skrajnych przypadkach do nałożenia kar lub nawet usunięcia z indeksu Google za celowe duplikowanie treści.

Uderzenie algorytmu szczególnie wyraźnie widać było w sklepach internetowych, które w dużej mierze miały albo puste strony produktów, albo opisy skopiowane ze strony producenta lub dostarczone przez hurtownię.

Oberwało się także specjalistom SEO, którzy uruchamiali strony bez użytecznej treści, przesycone słowami kluczowymi, stworzone przez różnego rodzaju oprogramowanie.

Wtedy też pojawiły się zamówienia na tzw. precle, czyli treści na presell pages. Jedynym celem stron presell było pozyskanie linka zwrotnego stronie pozycjonowanej. Treść na stronie presell miała być przede wszystkim unikatowa, a niekoniecznie wartościowa. Wówczas nastąpił wykwit “copywriterów” tworzących precle hurtowo za niewielką opłatą.

Czym jest duplicate content, thin content i dlaczego Google ich nie lubi

Duplicate content to sytuacja, kiedy pod dwoma różnymi adresami URL jest taka sama lub bardzo podobna, identyczna treść. Używanie tej samej treści oznacza, że ktoś od kogoś “ściągał”. W tym momencie Google ma problem, bo musi inwestować swoje zasoby w odkrycie tego, kto jest oryginalnym autorem, a kto kopiował, kto pokusił się o wykorzystanie nieswojej, identycznej treści.

W tym aspekcie Google przypomina naszą panią od polskiego w sytuacji, gdy podczas sprawdzania prac domowych znalazła dwa takie same wypracowania w dwóch różnych zeszytach. Google, podobnie jak nauczycielka, podejmie trud odkrycia, kto od kogo kopiował.

Google zbada datę publikacji jednej i drugiej treści oraz sprawdzi, czy na którejś ze stron nie ma atrybutu rel=”canonical” – wskazujące oryginalne źródło. Jeśli go brak to na podstawie autorytetu jednej i drugiej strony internetowej spróbuje oszacować, kto jest bardziej prawdopodobnym autorem.

Tak jak pani od polskiego. Jeśli autorem jednego z identycznych wypracowań jest uczeń piątkowy, a drugiego uczeń dwójkowy, można łatwo zgadnąć, kto od kogo ściągał.

W odróżnieniu jednak od nauczyciela, Google nie weźmie uczniów do tablicy i nie będzie ich odpytywać. Zamiast tego strona o większym prawdopodobieństwie autorstwa pojawi się wyżej w wynikach wyszukiwania, a ta o niższym (potencjalny plagiator) spadnie w pozycjach lub całkiem wyleci z indeksu.

Albo obie spadną.

Co więcej, problem „duplicate content” może dotyczyć zarówno kopiowania treści między domenami jak i w przypadku gdy kopiujemy „sami od siebie” umieszczając ten sam opis na przykład na stronie produktu i stronie głównej. Powielanie treści może mieć negatywne skutki dla SEO strony, prowadząc do niższej widoczności i atrakcyjności dla użytkowników, a nawet do całkowitego usunięcia z indeksu wyszukiwarek. Dlatego kluczowe jest, aby uniknąć duplikacji treści, stosując odpowiednie praktyki SEO.

Thin content to w uproszczeniu strony, które mają bardzo małą lub brak wartości dla użytkowników.

Dlaczego Google kara za zduplikowane treści?

Marnowanie crawl budgetu

Crawl budget w wielkim skrócie oznacza zasoby, jakie Google posiada, by odwiedzać i skanować treści na Twojej stronie. Aby efektywnie zarządzać tym budżetem i unikać marnowania zasobów na duplikaty treści, warto wykorzystać narzędzie takie jak Google Search Console. Dzięki niemu webmasterzy mogą wykrywać i zarządzać problemami związanymi z duplikacją treści, co jest kluczowe dla optymalizacji wykorzystania crawl budget.

Google dąży do maksymalnej efektywności, więc jeśli zobaczy tę samą treść w dwóch różnych miejscach na Twojej stronie, uzna, że marnujesz jej zasoby. Analogiczna sytuacja, ma miejsce w przypadku „thin content”. Skutkuje to, że roboty rzadziej odwiedzają Twoją stronę.

Występowanie duplicate i thin content samo w sobie sprawia, że Twoja strona ucierpi w rankingach. Marnując „crawl budget” sprawiasz, że wszelkie dokonywane zmiany będą wymagały więcej czasu, by Google je dostrzegło.

Rozmycie linków przychodzących

W sytuacji gdy ta sama treść jest opublikowana pod kilkoma różnymi adresami URL w obrębie Twojej domeny, wszystkie adresy URL mogą zyskać linki zwrotne. Większą korzyść odniesiesz, jeśli linki z innych stron w internecie będą wskazywać na jedną podstronę.

Powielone podstrony, zwłaszcza w sklepach internetowych, gdzie filtrowanie i sortowanie produktów może prowadzić do dodawania parametrów do URL, tworząc duplikaty, mogą rozrzedzać wartość przychodzących linków i negatywnie wpływać na SEO. Zaleca się dodanie tagu kanonicznego do URL-i z parametrami, aby uniknąć duplikacji treści.

Nieprawidłowe URLe

Najpowszechniejszą sytuacją, zwłaszcza wśród nowopowstałych stron internetowych, jest brak ujednolicenia adresu URL i w efekcie strona wyświetla się w 2 różnych wersjach:

  • z przedrostkiem www – www.przykladowastrona.pl,
  • bez przedrostka – przykladowastrona.pl.

Dodatkowo, w obrębie jednej witryny, po niepoprawnym wdrożeniu certyfikatu SSL, strona rozbija się na dwie kolejne wersje:

  • https://przykladowastrona.pl,
  • http://przykladowastrona.pl

Możesz być zupełnie nieświadomy, że Google zamiast jednej strony głównej widzi cztery adresy url i ocenia je jako skopiowana treść w obrębie jednej witryny.

Plagiatorzy prześcigną Cię w pozycjach w wyszukiwarce Google

W sytuacji, kiedy masz na swojej stronie tę samą treść na kilku podstronach, a Twój konkurent skopiuje ją 1:1 i opublikuje u siebie na jednej podstronie, nawet w identycznej formie, to on w oczach Google może wyglądać lepiej.

Dodatkowo, wyzwaniem jest 'zewnętrzna duplikacja treści’ i wpływ 'zewnętrznej duplikacji’ z innych witryn, co może co może mieć negatywne konsekwencje. Ta forma duplikacji, obejmująca kopiowanie treści dla mediów społecznościowych. Korzystanie z gotowych opisów produktów w sklepach internetowych, czy automatyczne pobieranie informacji przez programy, utrudnia eliminację duplikacji. Nie chodzi tylko o sytuacje gdy inni kopiują Twoje teksty.

W sytuacji gdy Google zbada Twoją stronę i stronę plagiatora i na Twojej zarejestruje zduplikowane treści, a na stronie konkurenta dany tekst będzie wyglądał jak unikalny i wartościowy (wystarczy nieznaczne rozwinięcie, dodanie ekstra akapitu tekstu, uczynienie treści bardziej wartościową „na pierwszy rzut oka) to Google może uznać Ciebie za kopiującego. Tym bardziej jeśli dodamy do tego problemy z wydajnością

Niezbyt sprawiedliwe, ale pamiętaj, że robot Google to robot.

Kopiowanie treści po prostu źle wygląda

Strona ze skopiowanymi treściami robi kiepskie wrażenie. Problem jest mniejszy, kiedy sprzedajesz ogólnodostępne produkty, i chcesz wypromować stronę tekstem możliwie najtaniej. Kłopot narasta kiedy na unikatowości treści opiera się Twoja marka (np. zawodowo zajmujesz się tworzeniem treści, usługami podatkowymi, tworzeniem stron czy jakimikolwiek innymi usługami), kopiowaniem treści strzelasz sobie w kolano.

Dodatkowo opinia plagiatora będzie się za Tobą ciągnąć w branży po wieki. Ważne jest również unikanie duplikowania opisów produktów w sklepach e-commerce, aby uniknąć negatywnych skutków związanych z duplikacją treści. Tworzenie unikalnych opisów produktów jest kluczowe dla uniknięcia tego problemu.

Nie wspominając o tym, że oryginalny autor tekstu może żądać usunięcia naruszenia jego praw autorskich oraz rekompensaty. Naruszasz w ten sposób jego własnośc intelektualną.

Unikatowe treści nadają stronie autentyczności

Wysokiej jakości treści na Twojej stronie internetowej gwarantują wzrost autorytetu zarówno w oczach Google, jak i użytkowników. Użytkownik, który widzi, że treść jest napisana porządnie, poprawnie i niesie za sobą wysoką wartość merytoryczną, na pewno doceni trud (lub inwestycję) i łatwiej zaufa Twojej firmie w kwestii produktu, który oferujesz.

Czytelnik nie będzie musiał weryfikować Ciebie jako autorytetu, bo Twoja wiedza o tym świadczy. Dodatkowo przemyślaną strategią contentową, możesz odpowiadać na pytania, które nurtują Twoich klientów. Poświęcasz czas na stworzenie treści raz, by w przyszłości uniknąć odpowiedzi na te same pytania.

Jak zadbać o unikalne treści na stronach internetowych?

Przede wszystkim – nie kopiować. Robotom Google zajmuje ułamek sekundy odnalezienie identycznego fragmentu tekstu na innych stronach internetowych. Kopiowanie w nadziei, że Google się nie dowie, to mrzonka. Ważne jest również, aby adresować problem wewnętrznej duplikacji treści, co jest kluczowe dla utrzymania unikalności treści na pojedynczej domenie internetowej.

Użyj narzędzi, by sprawdzić unikalność treści na stronie

Ustalmy, że duplikacja treści może zajść na dwóch płaszczyznach:

  • treści już opublikowane na stronie, 
  • treści odebrane od wykonawcy na przykład copywritera, który pisze treści na nasze zamówienie. 

W obu przypadkach warto skorzystać z narzędzi. Najbardziej znane narzędzia do badania unikatowości contentu na stronie to:

  • Copyscape, 
  • Grammarly, 
  • Quetext, 
  • ScreamingFrog,
  • Enago, 
  • Siteliner, 
  • Duplichecker,
  • ProWritingAid,
  • Unicheck,
  • Scribbr,
  • PlagScan,
  • Plagramme.

Zdarza się, że duplikacja treści nie jest zamierzona. Bardzo często ma to miejsce przy błędach podczas stosowania paginacji lub niewłaściwego użycia atrybutu rel=”canonical”. Duplikację warto sprawdzić w kontekście występowania w obrębie serwisu jak i poza nim.

Ustaw przekierowania lub linki kanoniczne

Pomimo szczerych chęci, przemyślanej struktury strony i precyzyjnych procedur w firmie, na stronie nadal mogą się pojawić duplikaty. Wówczas w celu wskazania wyszukiwarce Google unikalnego tekstu możesz:

  • ustawić atrybut rel=”canonical”, by wskazać Google docelowo unikalny content,
  • ustawić przekierowanie 301 ze zduplikowanego contentu na właściwy adres. 

To pierwsze wykonujesz wtedy, gdy nie chcesz, by strona duplikacją treści znikła z mapy witryny. Najczęściej ma to miejsce przy różnych wersjach tego samego produktu oraz paginacji. Przykładowo jeden model telefonu w róznych kolorach lub buty w różnych rozmiarach

Drugie rozwiązanie jest bardziej radykalnei odniesie lepszy skutek wtedy, gdy strona z duplikacją treści nie powinna pojawiać się w wyszukiwarce. 

Zamawiaj treści z dobrego źródła

Jeżeli mówimy o treściach zamawianych od autora zewnętrznego, warto (przynajmniej na początku współpracy) sprawdzać jego utwory narzędziem antyplagiatowym. Dobry copywriter nie pozwoli sobie na zarzuty o plagiat, ale strzeżonego pan Bóg strzeże. 

W dzisiejszych czasach coraz trudniej o dobrego copywritera. W branży SEO można usłyszeć głosy, że: “dobry copywriter jest na wagę złota i jak już go znajdziesz to nie należy mówić o nim nikomu. Żeby konkurencja się o nim nie dowiedziała”. Niemniej jednak jeśli chcesz zadbać o swój content marketing, popytaj znajomych, czy znają dobrego twórcę treści na strony internetowe. Zwróć uwagę na to, że świetny copywriter w temacie florystyki może totalnie nie poradzić sobie w tekstach technologicznych i na odwrót.

Wskazówka: aby łatwo sprawdzić, czy copywriter jest autorem unikalnych treści, wklej dwa, trzy zdania wprost do wyszukiwarki Google. Jeśli w wynikach wyszukiwania zobaczysz pogrubiony tekst, który teoretycznie miał byc unikatowy i jeszcze nie jest opublikowany będzie to oznaczało plagiat. 

jak sprawdzić unikatowość treści

Czym grozi publikowanie duplicate content pod wieloma adresami URL?

Jeśli chodzi o duplicate content, kary jako takiej nie ma. Pracownicy Google mówili o tym wielokrotnie, że nie karają w przypadku duplikacji treści. 

Czy to oznacza, że można kopiować? Nie. 

Rozważmy dwa scenariusze. Ty i Twój rywal macie domeny o podobnym autorytecie oraz rozbudowany blog firmowy. Ty masz u siebie duplikaty treści – on ma same unikalne artykuły. 

Twoja strona pojawi się niżej w organicznych wynikach wyszukiwania na pożądane słowa kluczowe, niż jego. 

Unikalna treść na danej stronie www zawsze będzie bardziej wartościowa w oczach Google i użytkowników.

Podsumowanie

Wierzę, że w przystepny sposób udało mi się przedstawić Ci zawiłości i problemy wynikające ze stosowania skopiowanej treści. Pamiętaj, że tworzenie unikatów dla unikatów również nie ma senu, jeśli omawiany przez Ciebie temat nie niesie wartości dla czytelnia. Pomyśl o nim w pierwszej kolejności i dostarcz 10 razy więcej wartości od swojej konkurencji!

Udostępnij ten artykuł
Facebook
LinkedIn
Picture of Rafał Pietraszek

Rafał Pietraszek

Pomagam przedsiębiorstwom w generowaniu większych przychodów za pomocą profesjonalnych strategii SEO.

Dodaj komentarz

Zostaw wiadomość

Wypełnij formularz, skontaktuję się z Tobą.