JustPaste.it

Wyniki uzupełniające w Google

Post ten chciałbym poświęcić zagadnieniu wyników uzupełniających w wynikach wyszukiwania Google. W poście tym chciałbym opisać:

  • Czym są wyniki uzupełniające?
  • W jakich przypadkach widzimy podstrony serwisu jako wyniki uzupełniające?
  • Skąd mam wiedzieć, czy mam wyniki uzupełniające?
  • Jak mogę pozbyć się wyników uzupełniających

1. Czym są wyniki uzupełniające?


O wynikach uzupełniających, czyli Supplemental Index pisałem już kilka razy przy okazji takich postów jak:

Oficjalna wypowiedź Google na temat wyniku uzupełniającego brzmi:

Wynik uzupełniający to wynik wyszukiwania pobierany z naszego indeksu pomocniczego. Wobec witryn trafiających do indeksu pomocniczego możemy zastosować mniej ograniczeń niż wobec witryn uwzględnianych w indeksie głównym. Na przykład liczba parametrów w adresie URL może spowodować wykluczenie witryny z aktualizacji indeksu głównego, jednak roboty mogą ją uwzględnić w indeksie witryn uzupełniających.

Generalnie uważa się, że do indeksu uzupełniającego Google wpadają strony, którym Google nie ufa na tyle, aby wpuszczać je do głównego indeksu. Są to wyniki oznaczone w wynikach wyszukiwania kolorem zielonym.

Zrzut ekranu serwisu Gazeta.pl

2. W jakich przypadkach widzimy podstrony serwisu jako wyniki uzupełniające?

Jako wyniki uzupełniające pokazywane są często podstrony, które nie istnieją już w serwisie i zwracają kod błędu 404 jak również podstrony z wygasłych domen.
W tym przypadku w indeksie przechowywana jest ostatnia istniejąca dana wersja podstrony. Pokazywana jest ona w sytuacji, kiedy liczba wyników wyszukiwania w indeksie głównym Google dla danego zapytania jest niska.

Wcześniejsze wersje podstron serwisu.
Jako wyniki uzupełniające wyświetlane mogą być również wcześniejsze wersje podstron serwisu. Wówczas to, wcześniejsze wersje podstrony jest przechowywana w indeksie uzupełniającym, podczas gdy nowsza jej wersja jest pokazywana w głównym indeksie. Podstrona z indeksu uzupełniającego jest pokazywana wtedy, gdy użytkownik zapytuje wyszukiwarkę o słowa kluczowe, które są tylko w starszej wersji podstrony

Zrzut ekranu serwisu SGH.waw.pl

Zduplikowane adresy dla tej samej treści
Bardzo często problem wyników uzupełniających jest spowodowany kwestią zduplikowanej treści w serwisie. W sytuacji, kiedy treść podstrony istnieje pod dwoma lub więcej adresami, wówczas część z tych adresów będzie się pojawiać w wynikach indeksu głównego, część zaś w wynikach indeksu uzupełniającego. Dana podstrona może się wówczas dość długo pojawiać w indeksie uzupełniającym – nawet po zmianie jej treści, czy też całkowitym usunięciu.

Zrzut ekranu wyników wyszukiwania Google

Zmienione adresy dla podstron
W sytuacji, kiedy zmienimy adres podstrony, która została już zindeksowana zarówno stary adres jak i nowy mogą być pokazywane jako wyniki uzupełniające.

Adresy, które kiedyś kierowały do treści a obecnie są przekierowywane
Do wyników uzupełniających trafiają również adresy, które kiedyś kierowały do treści, później zaś zostały przekierowane przez 301 lub 302 na inne adresy. W takiej sytuacji stara wersja podstrony jest wyrzucana z indeksu po upływie roku.

Zrzut ekranu wyników wyszukiwania Google
Zrzut ekranu wyników wyszukiwania Google


Zbyt wiele zmiennych w adresie url

Robotom Google duże trudności mogą sprawiać adresy url, które zawierają dużo zmiennych lub też są bardzo długie. W takim przypadku podstrony takie również mogą trafić do indeksu uzupełniającego.

 

Podobne lub identyczne meta Tagi i title
Do indeksu uzupełniającego trafiają również podstrony serwisu, które mają identyczny lub też bardzo podobne meta Tagi:meta description i meta keywords jak również znaczniki Title. Roboty uznają wówczas, że podstrony te mają bardzo podobną treść, w wyniku czego nie powinny one znaleźć się głównym indeksie.

Zrzut ekranu wyników wyszukiwania Google

Orphaned pages
W wynikach indeksu uzupełniającego pojawiają się również tzw. „orphaned pages”, czyli podstrony, do których nie prowadzą żadne linki z zewnątrz (np. były w przeszłości i zostały usunięte). Takie podstrony są marginalizowane przez Google, ponieważ wyszukiwarka uznaje, że straciły one swoje pierwotne znaczenie dla danego tematu.

Brak treści na podstronie
Wiele podstron w sieci nie ma żadnej treści (np. niektóre podstrony katalogów) i w tej sytuacji takie podstrony mogą być wyświetlane jako wyniki uzupełniające. Bezpiecznym przedziałem minimum treści na stronie jest około 200 słów.

Podejrzane treści na stronie
W wynikach uzupełniających pojawić się mogą również podstrony, które zwierają „podejrzane treści”, zawierają dużą liczbę linków wychodzących, linkują do serwisów, które mają niski „TrustRank” Google, zawierają elementy spamu (np. ukryte treści).

Strony z niskim TrustRank
Do wyników uzupełniających mogą trafić także podstrony z serwisów, do których prowadzi mało linków z zewnętrznych stron. Może się wręcz zdarzyć, że w ich obrębie będą podstrony z serwisów o wysokim PR (dana podstrona posiada wtedy bardzo małą cząstkę PR jej „siostrzanych” podstron.

Zbyt szybki rozwój strony
Nie jest to do końca potwierdzona informacja i bazuje jedynie na doświadczeniach webmasterów z WebmasterWorld, ale najprawdopodobniej zbyt szybki rozwój nowej witryny idący w tysiącach podstron w bardzo krótkim okresie czasu może spowodować wrzucenie części podstron (nawet nieraz bardzo dużej części ) do wyników uzupełniających. W jednej ze swoich wypowiedzi Matt Cutts przyznał, że w rozwoju serwisu warto nie przesadzać z szybkim przyrostem dynamicznie tworzonych podstron (według niego bezpiecznym optimum jest do 5 000 podstron na tydzień).

3.Skąd mam wiedzieć, czy mam wyniki uzupełniające?

Jednym ze sposobów na sprawdzenie przynajmniej niektórych wyników uzupełniających jest komenda:

site:www.jakas-strona.pl - inurl:www

Dość dokładne liczby podstron serwisu w wynikach uzupełniających w danym DataCenter Google można sprawdzić na stronie:

http://oy-oy.eu/google/supplemental/

4. Jak mogę pozbyć się wyników uzupełniających?

Jak już wspominałem istnieje kilka możliwych przyczyn występowania danej podstrony w wynikach uzupełniających. Jeżeli widziany w wynikach wyszukiwania wynik uzupełniający jest wynikiem problemu z zduplikowaną treścią, zduplikowanymi adresami(takie same opisy description, keywords, title, te same podstrony pod różnymi adresami) to jest czym się przejmować.

  • W przypadku podobnych metatagów i title należy maksymalnie zróżnicować treści tych znaczników, by były unikalne i jednocześnie odzwierciedlały rzeczywistą zawartość podstron serwisu.
  • W przypadku zduplikowanych adresów podstron, tzn gdy ta sama treść jest dostępna pod różnymi adresami np.
    http://www.mojastrona.pl/jakas-tresc.html
    http://www.mojastrona.pl/content/view/44/48/
    http://www.mojastrona.pl/ index.php?option=com_content&task=view&id=55&Itemid=75

    należy jak najszybciej usunąć przyczynę występowania zduplikowanych adresów.

Są trzy możliwe sposoby pozbywania się zduplikowanych adresów podstron:

  • Jeżeli z jakiś powodów zależy nam na utrzymywaniu obu wersji danej podstrony (np. podstrony z podobną lub identyczną treścią dla Warszawy i Krakowa) wówczas powinniśmy jedną z nich wyindeksować z zasobów Google (np. poprzez dodanie tagu lub poprzez użycie pliku robots.txt - dokładany opis użycia tego pliku jest w poście Roboty i Googlebot).
  • Jeżeli nie zależy nam na utrzymywaniu obu adresów podstrony wówczas najlepiej jest stworzyć bezpośrednie przekierowanie 301 wszystkich zduplikowanych adresów na ten, który chcemy aby pojawiał się w głównym indeksie).

Ostatnim (i niezbyt zalecanym sposobem) jest usunięcie zduplikowanej podstrony, co w efekcie spowoduje występowanie kodu błędu 404.

Wszystkie powyższe metody nie usuną samego występowania wyników uzupełniających. Stare adresy pokazywane jako wyniki uzupełniające mogą się pojawiać jeszcze przez długi czas. Może to trwać nawet cały rok. Kwestią wyników uzupełniających zajmuje się specjalny bot Google Supplemental Googlebot, który odwiedza strony średnio co 6 miesięcy (aczkolwiek jak zapowiedział w opisanej przeze mnie w wypowiedzi Matt Cutts ma on teraz odwiedzać strony częściej). Całkowite usuwanie podstron z wyników uzupełniających odbywa się w czasie tzw. Supplemental Update, kiedy to:

  • podstrony, które były w wynikach uzupełniających a już nie istnieją lub też zostały przekierowane poprzez 301 (od ich usunięcia lub przekierowania minęło rok lub dłużej) są na stałe usuwane z indeksu Google,
  • indeks wyników uzupełniających dla zduplikowanych adresów podstron jest odświeżany (niektóre strony przechodzą do indeksu głównego, inne są z niego usuwane),
  • tworzone są całkowicie nowe wyniki uzupełniające dla adresów, które były w niedalekim czasie zmieniane i modyfikowane.

Po samym usunięciu przyczyny występowania Duplicate Content w obrębie tego samego serwisu (bądź to poprzez noindex bądź też poprzez przekierowania) nie musimy się już przejmować występującymi wynikami uzupełniającymi dla tych podstron (pomimo, że jak już wcześniej wspominałem mogą się one pojawiać jeszcze nawet przez rok).

Wyniki uzupełniające w przypadku “orphan pages” i podstron o bardzo niskim PR i TrustRank

W tym przypadku najlepszym rozwiązaniem jest skierowanie na podstrony pokazywane jako wyniki uzupełniające linki jak najwyższej jakości (uwaga - ważna jest jakość tych linków, a nie ich ilość). Sposoby na zdobycie dobrej jakości linków można znaleźć w poście Sandbox, Trustbox i filtry.
Przy stosowaniu tej metody należy zwrócić szczególną uwagę na właściwe linkowanie wewnętrzne serwisu. Warto linkować z podstron pokazywanych w indeksie głównym Google do tych pokazywanych jako wyniki uzupełniające.

Można wręcz wykorzystywać podstrony z indeksu głównego jako mapy stron dla tych z wyników uzupełniających. Aby za bardzo nie rozwodnić PR w serwisie i zwiększyć siłę linków wychodzących z danych podstron można ustawić tagi nofollow na te linki serwisu, które prowadzą do mało interesujących sekcji serwisu (nie zależy nam na ich indeksacji).

Inne rodzaje wyników uzupełniających
Jeżeli występowanie wyników uzupełniających spowodowane jest nowymi przekierowaniami 301, usunięciem podstrony i zwracaniem kodu błędu 404 (uwaga -mówimy oczywiście o rzeczywistym błędzie 404, a nie zwracaniem strony błędu 404 przez serwis) kwestiami przechowywania starszych i nowszych kopii serwisu przez Google można z czystym sumieniem zostawić je w spokoju. Google je całkowicie wyrzuci ze swojego indeksu po upływie mniej wiecej roku.

Przedruk za zgodą autora

 

Źródło: Mariusz Gąsiewski