I kiedy przestaje działać w dużych sklepach e-commerce
Wstęp: canonical, który „powinien działać”, ale nie działa
Jedno z najczęstszych zdań, jakie można usłyszeć przy audytach dużych sklepów, brzmi:
„Przecież mamy poprawnie ustawione canonicale.”
I bardzo często… to prawda.
Canonical jest poprawny technicznie, zgodny z dokumentacją Google, wdrożony globalnie.
A mimo to:
- Google indeksuje alternatywne URL-e,
- widzi duplikaty,
- raportuje „alternatywną stronę z poprawnym canonicalem”,
- nie konsoliduje sygnałów tak, jak oczekuje właściciel sklepu.
To nie jest błąd.
To jest niezrozumienie, czym canonical naprawdę jest.
Canonical nie jest poleceniem
To jest punkt wyjścia, który zmienia wszystko.
Canonical to:
- wskazówka (hint),
- sygnał probabilistyczny,
- propozycja interpretacji, a nie reguła.
Google wielokrotnie potwierdzał:
Canonical może zostać zignorowany,
jeśli inne sygnały są silniejsze lub sprzeczne.
📌 Canonical nie ma mocy decyzyjnej, jeśli stoi sam.
Kiedy canonical działa poprawnie
Canonical działa dobrze, gdy:
- skala URL-i jest niewielka,
- duplikacja jest prosta (np. http/https, www/non-www),
- Google regularnie crawluje wszystkie warianty,
- struktura linków jest spójna,
- historia domeny jest krótka.
Dlatego:
- w małych projektach canonical „wydaje się niezawodny”,
- problem ujawnia się dopiero przy skali.
Dlaczego canonical przestaje działać w e-commerce
W dużych sklepach canonical musi konkurować z innymi sygnałami.
Najczęstsze powody jego ignorowania:
1️⃣ Skala i kombinatoryka URL-i
Filtry, paginacje, sortowania i parametry tworzą tysiące wariantów, które Google musi samodzielnie sklasyfikować.
2️⃣ Sprzeczne sygnały linkowania
Jeśli:
- linkowanie wewnętrzne prowadzi do URL-i z parametrami,
- JavaScript generuje alternatywne adresy,
- stare linki zewnętrzne wskazują na warianty,
canonical przestaje być „najsilniejszym sygnałem”.
3️⃣ Brak crawl’u wariantów URL
Jeśli URL jest:
- zablokowany w robots.txt,
- rzadko odwiedzany,
Google nie widzi canonicala w praktyce, tylko pamięta go historycznie.
Canonical bez crawl’u = słaby sygnał.
4️⃣ Historia indeksu Google
Google bierze pod uwagę:
- wcześniejsze decyzje indeksacyjne,
- wcześniejsze wersje treści,
- wcześniejsze relacje URL-i.
Canonical nie resetuje historii.
Co oznacza status „alternatywna strona z poprawnym canonicalem”
Ten status w Google Search Console bywa błędnie interpretowany jako „wszystko jest OK”.
W rzeczywistości oznacza on:
Google zauważył canonical, ale nie uznał go za wystarczająco silny, aby jednoznacznie skonsolidować URL-e.
To nie błąd.
To decyzja algorytmiczna.
Dlaczego canonical nie rozwiązuje problemu „śmieciowych URL-i”
Canonical:
- nie usuwa URL-i z pamięci Google,
- nie blokuje ich powstawania,
- nie zarządza crawl budgetem,
- nie czyści indeksu.
On tylko mówi:
„Jeśli musisz wybrać — wybierz ten.”
Ale Google:
- nie zawsze musi wybierać,
- często zostawia kilka wariantów w systemie decyzyjnym.
Najczęstszy błąd strategiczny
Wiele sklepów opiera całą strategię indeksacji na jednym założeniu:
„Canonical wszystko ogarnie.”
W małej skali — czasem tak.
W dużej skali — prawie nigdy samodzielnie.
Canonical:
- nie jest warstwą ochrony,
- nie jest mechanizmem stabilizacji,
- nie jest systemem zarządzania indeksem.
Co z tego wynika (bez rozwiązań)
Ten problem prowadzi do jednego wniosku:
W e-commerce canonical musi być częścią systemu,
a nie jedynym narzędziem kontroli indeksu.
Dopóki:
- Google widzi tysiące wariantów URL-i,
- dostaje sprzeczne sygnały,
- ma bogatą historię domeny,
dopóty canonical będzie czasem ignorowany — nawet jeśli jest poprawny.
Podsumowanie w jednym zdaniu
Canonical to wskazówka, nie polecenie.
A w dużych sklepach Google słucha tylko najsilniejszych sygnałów.
