lis 06
Duplicate content – mity i fakty
1. Wstęp
- Nie ma limitów na powtarzanie kontentu na własnych stronach. Bo kto nam zabroni kopiowania własnej treści w kilku serwisach, czy też w ramach jednej domeny?
- Termin duplicate content został wymyślony przez firmy wyszukiwarkowe, mające problem z indeksowaniem podobnych stron. Jako że wyszukiwarki nie potrafią skutecznie zaindeksować całych zasobów Internetu – zrzucają część pracy własnych robotów na webmasterów. To oni mają przygotować zgodne z ograniczeniami robotów strony – bez duplikowanej treści i nie tylko.
2.2. Co się dzieje ze stronami z Duplicate Content
- Nic. Bardzo często serwisy mające strony z Duplicate Content nie są karane przez wyszukiwarki – do czasu …
- Degradacja. Strony mogą się znaleźć w Suplemental Index lub mieć obnizony ranking
- Usunięcie stron. Wyszukiwarki usuwają strony, które wg nich są duplikatami (wiele różnych URL-i ma tę samą zawartość)
- Usunięcie sekcji serwisuJeśli cała sekcja (katalog, subdomena, pliki robocze) jest posądzona o zbyt dużą liczbę zduplikowanych stron
- Usunięcie całego serwisu. Jeśli jest zbyt dużo problemów dla wyszukiwarek z duplikatami
- Adresy URL stron z Duplicate Content są „chore” – również linki z nich i do nich. Należy takie strony poddać kwarantannie, aby nie zaszkodziły innym stronom, czy serwisom
- Strata „link juice” – linki do różnych URL tej samej strony. Jest to przypadek, kiedy np strona główna serwisu wystepuje pod kilkoma różnymi adresami URL
3. Duplicate Pages, Duplicate Content – przyczyny
- Duplicate Pages z przyczyn technicznych. Domeny, struktura serwisu, format URL, nawigacja breadcrumb, cookies, ID sesji, strony z tagami, strony błędówRezultat: wiele unikalnych adresów URL posiadają strony o jednakowym kontencieWyszukiwarki muszą zdecydować, którą stronę trzymać w indeksach, która jest źródłem kontentu, a które duplikatami
- Duplicate Content z przyczyn edytorskich. Zduplikowane: meta tagi, footer links, strony w programach afiliacyjnychRezultat: wyszukiwarki nakładają filtry na elementy stron – choć nie tylko…Wyszukiwarki nie muszą usuwać całych stron z wyników, mogą usuwać powtarzające się sekcje stron
4. Domeny, subdomeny
- Multiple domains. Wybierz jedną, główną domenę i za pomocą przekierowania 301 zrób redirect z pozostałych domen – do strony głównej lub podstrony głównego serwisu.
- Subdomeny. Nie ma problemu, jeśli mają unikalną treść, a nie przekierowuja do głównej domeny lub innych subdomen
- Test domains. Należy zabezpieczać hasłem. Zablokować wyszukiwarki przed indeksowaniem
- Load balancing. Źle wdrożony load balancing powoduje duplikację na subdomenach: ww1., ww2., ww3
5. Z WWW czy bez WWW
- www.domena.pl vs domena.pl. Większość wyszukiwarek radzi sobie z oboma wersnazw domen
- Linkowanie
- Odnośniki bezpośrednie są najlepsze dla wyszukiwarek
- Redirect 301. Aby mieć pewność możzna zrobić przekierowanie na właściwą domenę
- Centrum Webmastera. Zarówno Google jak i Bing w swoim Centrum Webmastera umożliwiają zdefiniowanie podstawowej domeny dla serwisu WWW
6. Breadcrumb
- Typowy breadcrumb: Produkty > sport > buty > adidaswww.domena.pl/sport/buty/adidas.html
- Alternatywna lokalizacja tej samej strony. Produkty > buty > sport > adidaswww.domena.pl/buty/sport/adidas.html
- Proste rozwiązanie – produkty w głównym katalogu:www.domena.pl/adidas.html
- Każda strona z kontentem może mieć tylko jeden adres URL
- Numer ID sesji można przechować w cookie
7. Tag kanoniczny
- Oryginalny, kanoniczny URL:http://domena.pl/product.php?item=zabawki
- Ta sama treść – kategoria:http://domena.pl/product.php?item=zabawki&kat=gumowe
- Ta sama treść – id sesji:http://domena.pl/product.php?item=zabawki&sessionid=678
- Konieczne dodanie do duplikowanych stron w nagłówku:link rel=„canonical” href=„http://domena.pl/product.php?item=zabawki
- Teoretycznie zadziała, lecz nie jest to najlepsze rozwiązanie.
8. Tag kanoniczny – wady:
- Nie wiadomo jak działa – jeszcze nie…
- Póki co to wersja beta rozwiązania
- Musi być perfekcyjnie wdrożony
- Źle wdrożony może spowodować nałożenie filtrów wyszukwiarek
- Konieczne zidentyfikowanie wyszstkich problemów z Duplicate Content
- Należy zidentyfikować strony do wstawienia tagu – dlaczego ich po prostu nie poprawic?
- Serwisy bez „Duplicate content” są lepsze
- Należy stawiać serwisy eliminując od początku Duplicate Content
- Czasochłonny proces
- Lepiej wykonać serwis od samego początku eliminując problemy
9. Podsumowanie
- Nie pozostawiaj ważnych decyzji o twoim serwisie głupim maszynom wyszukiwarek
- Zbyt często nie działają prawidłowo, nie tak jak twórcy zaplanowali
- Sam decyduj o swoim serwisie w wyszukiwarkach
- Korzystaj z Centrum Webmastera Google
Autor: CeZzy => Cezary Glijer
W necie => od 1993 roku
W SEO => od 1997 roku
Firmy: MIST Cezary Glijer
Webmedia Group Ireland





![Fenomen WordPressa [Infografika]](http://www.cezzy.pl/wp-content/uploads/2012/04/wordpress180.png)
![Jak optymalizować? [SEO infografika]](http://www.cezzy.pl/wp-content/uploads/2012/04/infografika.png)


![Wpływ Internetu na nasz mózg [infografika]](http://www.cezzy.pl/wp-content/uploads/2012/04/uzaleznienie.png)







dzieki przyda się ….