Duplikat treści to tekst, który pojawia się w więcej niż jednym miejscu w sieci (pod kilkoma adresami URL). Jeśli identyczna zawartość powtarza się w Internecie, roboty wyszukiwarek mają trudność z podjęciem decyzji, która wersja jest bardziej adekwatna do wprowadzonego zapytania.
Chcąc zapewnić użytkownikowi jak najlepsze wyniki wyszukiwania, algorytm rzadko wyświetla powielone treści, lecz wybiera wersję, która z największym prawdopodobieństwem jest oryginalna lub najlepsza.
Warto zapamiętać, że w przypadku duplikatów treści, roboty wyszukiwarek nie wiedzą:
- którą wersję (lub wersje) zawrzeć/wykluczyć z indeksu,
- do którego adresu URL przyporządkować dane parametry,
- którą wersję (lub wersje) ocenić dla danego zapytania.
Gdy strona zawiera duplikat treści, jej właściciel obserwuje obniżenie pozycji i zmniejszenie ruchu w witrynie, a wyszukiwarka wyświetla mniej rzetelne wyniki.
Jeśli chcesz, aby strona wyświetlała użytkownikom dokładnie to, co powinna, zadbaj o kilka podstawowych czynników:
- Stosuj przekierowania 301: w przypadku reorganizacji witryny, należy wprowadzić przekierowania 301 w pliku .htaccess, co w bezpieczny i efektywny sposób zaprowadzi odwiedzających oraz roboty wyszukiwarek na odpowiednie podstrony. Gdy mamy do czynienia z serwerem Apache, należy posłużyć się plikiem .htacces, a w przypadku IIS - konsolą administracyjną.
- Zachowaj spójność: pamiętaj, aby linki wewnętrzne były tworzone w sposób jednolity. Mianowicie, unikaj używania różnorodnej struktury np.:
http://www.przyklad.pl/strona/
http://www.przyklad.pl/strona
http://www.przyklad.pl/strona/index.htm - Posługuj się domenami najwyższego poziomu: aby użytkownik był pewien, że trafia na właściwą wersję dokumentu, o ile to możliwe, stosuj inne domeny dla każdego wariantu językowego. W takim linku: http://www.przyklad.pl/ wyraźniej widać, że chodzi o treści po polsku niż w przypadku http://www.przyklad.com/pl/strona
- Udostępniaj teksty rozsądnie: jeśli dana treść zostanie powielona, algorytm wyszukiwarki wyświetli tą wersję, którą uzna za najlepiej dopasowaną do wprowadzonej przez użytkownika frazy. Istnieje więc ryzyko, że wybierze nie tą stronę, którą chciałbyś ukazać internaucie. Warto umieszczać odnośnik do swojej witryny tam, gdzie dzielimy się treściami. Innym rozwiązaniem jest zlecenie webmasterowi zastosowania metatagu noindex, co zapobiega indeksowaniu oznaczonej tak wersji artykułu.
- Skorzystaj z Search Console, aby powiadomić Google, jak powinien zaindeksować Twoją stronę: można np. zaznaczyć, która domena jest preferowana np.:
http://example.com lub
http://www.example.com - Nie stosuj powtórzeń: przykładowo, nie trzeba wklejać informacji o konsekwencjach naruszania praw autorskich na każdej podstronie, lecz tylko umieścić na dole zwięzłe streszczenie i odnośnik do witryny ze szczegółami zagadnienia. Co więcej, można posłużyć się narzędziami do obsługi parametrów, aby wskazać Google, jak ma się do nich odnosić.
- Nie publikuj strony, jeśli nie jest ona jeszcze gotowa: linki, pod którymi nie widnieje żadna zawartość, źle wpływają na ogólne wrażenie z przeglądania witryny, więc najlepiej jest nie stosować wersji tymczasowych. Jeśli nie udało Ci się jeszcze stworzyć tekstu dla danej podstrony, wstrzymaj się z jej publikacją. W przypadku konieczności jej utworzenia, zablokuj indeksowanie przy pomocy metatagu noindex.
- Naucz się zarządzać treścią w systemie: sprawdź, czy na pewno wiesz, jak zamieszczana zawartość prezentuje się na stronie. Na forach, blogach i innych tego rodzaju systemach, zdarza się, że ten sam tekst przyjmuje różne formaty. Na przykład, post na blogu zazwyczaj widnieje na jego głównej stronie, na liście innych wpisów z tą samą etykietą, a także w archiwum.
- Zredukuj zbliżone treści do minimum: w przypadku, gdy posiadasz wiele podobnych do siebie stron, spróbuj dokonać ich rozbudowy bądź też połączyć je w całość. Na przykład, jeśli masz osobne podstrony o kilku wariantach jednego produktu z identycznymi informacjami, rozważ utworzenie jednej strony, na której będą dostępne różne rodzaje tego samego towaru lub też dodaj do każdego z poszczególnych opisów unikalne informacje na ich temat.