Ett problem som vi ser på nästan varje webbplats är dubbletter. Större webbplatser med hundratals sidor är särskilt benägna att detta. Men vad exakt kvalificerar som dubbletter? Varför leder dubbelt innehåll till problem och hur kan vi undvika dem? Vi täcker allt detta och mer inom den här artikeln.
Duplikat innehåll är exakt vad du tycker är det: två eller flera innehållsdelar som är identiska, den enda skillnaden är URL-adressen.
Google ser varje webbadress som en separat sida. På grund av detta skulle följande webbadresser anses vara helt olika sidor:
Problemet här är att vi i grund och botten tittar på samma sida med samma innehåll. Den enda skillnaden är att innehållet på den sista URL-adressen är i en annan ordning. Google ser detta som dubbletter innehåll.
Kopiera innehåll förvirrar sökmotorer. Varför? Eftersom de har svårt att bestämma vilken sida som är mest relevant för en sökfråga.
Sökmotorerna kommer aldrig att visa två identiska innehållsdelar i SERP: erna. Detta görs för att säkerställa högsta sökkvalitet; Att se samma innehåll två gånger är inte särskilt intressant för användaren.
Ett annat problem är rankningsstyrka av dubbla sidor. I stället för att ha en enda sida med mycket auktoritet har du flera sidor med utspädd, suboptimal prestanda. Detta kan kosta dig mycket organisk trafik.
Duplikat innehåll kan skapas medvetet eller oavsiktligt. Ändå är resultatet detsamma.
Ett exempel på avsiktligt duplikat innehåll är utskriftsversionen av en sida. Det är effektivt samma sida med samma innehåll, så när den här utskriftsversionen blir indexerad, finns det ett problem med dubbletter.
Det finns emellertid många situationer där dubblet innehåll skapas oavsiktligt. Det kan finnas flera orsaker, till exempel:
Ett sessions-ID är en variabel, en sträng slumpmässigt genererade siffror och / eller bokstäver och används för att hålla koll på besökare. De används ofta för kundvagnar, till exempel:
http://website.com/?sessionid=5649612
Problemet med session-ID är uppenbart: de kan skapa hundratals, kanske till och med tusentals dubbletter. Om du lagrar sessions-ID i kakor kan du lösa det här problemet, men om du lita på det här alternativet, glöm inte EU-cookielagen.
När folk tänker på sorteringsalternativ, brukar de tänka på webbutikens produktkataloger där användarna kan sortera efter pris, datum etc. Men sorteringsfunktioner finns ofta på andra webbplatser också. Följande webbadress använder en typisk blogg sorteringsfunktion:
http://website.com/category?sort=asc
URL-adressen med sorteringsalternativet och originalet är i princip samma sida. Det är samma innehåll, bara sorterat på ett annat sätt.
Affiliate-koder dyker upp över hela webben. De används för att identifiera hänvisaren, som i sin tur belönas för att få in en ny besökare. En affiliate-kod kan se ut så här, till exempel:
http://website.com/product?ref=name
Återigen kan denna kod skapa en kopia av den ursprungliga sidan.
Även någonting så enkelt som ett domännamn kan ibland vara problematiskt. Ta en titt på följande webbadresser:
http://website.com
http://www.website.com
Sökmotorer har kommit långt, men ibland får de fortfarande det här felet. Båda webbadresserna pekar förmodligen på hemsidan, men eftersom båda webbadresserna ser annorlunda ut, ses de ibland som olika sidor.
Vi har pratat om hur dubblet innehåll skapas, men hur kan du identifiera dubbla innehållsproblem på din webbplats?
Det enklaste sättet att göra detta är via Googles verktyg för webbansvariga. Logga in på ditt konto och gå till Optimering> HTML-förbättringar. Här hittar du en lista med dubbla titlar (vilket är förmodligen dubbletter).
Alternativt kan du ange site: -search command i urlfältet för att hitta sidor från en specifik domän (till exempel webbplats: webdesign.tutsplus.com). Den här metoden är mycket användbar om du misstänker att en viss sida har flera dubbletter. Använd kommandot webbplats och klistra in ett par meningar från den misstänkta sidan. Om du får ett meddelande från Google som säger "För att visa dig de mest relevanta resultaten har vi utelämnat några poster ...", du har förmodligen dubbletter innehåll.
Slutligen kan du också använda webbplats sökrobotar. Programvara som Xenu och Screaming Frog kan användas för att samla nödvändig information. Analysera sidtitlarna i genomsökningsrapporten och kolla på duplikat.
Som sagt säger: "Varje sjukdom har botemedel". Lyckligtvis finns det flera sätt att bota dubbla innehållsproblem:
Ett enkelt sätt att förhindra att dubblet innehåll indexeras är en 301-omdirigering. På så sätt omdirigeras användaren och sökmotorerna från dubbletter till originalet. Som ett resultat sänds all länksjuice till den ursprungliga sidan.
En 301-omdirigering implementeras på Apache-servrar genom att lägga till regler i din servers .htaccess-fil. Tänk på att den här metoden "raderar" kopian. Om du inte vill bli av med de dubbla sidorna måste du använda följande metod.
Det finns ett annat sätt att berätta för sökmotorer om dubblet innehåll de rel =”canonical”
märka. Denna del av koden ska genomföras i av en webbsida.
Låt oss säga att vi har sidan B som är en kopia av Sida A. Om vi vill informera sökmotorer om detta lägger vi följande kod i markeringen av Sida B:
Denna kod anger att den aktuella sidan är faktiskt en kopia av ovan nämnda URL. Efter att ha implementerats, kommer de flesta länksjuice att överföras till den ursprungliga sidan och därmed förbättra rankningsstyrkan på den sidan. I motsats till 301-omdirigering kommer de dubbla sidorna fortfarande att vara tillgängliga.
Vi har redan diskuterat robotarmetataggen i detalj under en tidigare handledning. Genom att lägga till en meta robotar-tagg med parametern "noindex" kan du förhindra att den dubbla sidan indexeras.
Detta är en mer avancerad lösning. Det är svårare att genomföra om du har en begränsad förståelse av kod, men det kan vara användbart vid ett flertal tillfällen.
Som tidigare nämnts domän namn kan ofta orsaka dubbla innehållsproblem (www vs icke-www-version). Du kan lösa detta problem genom att lägga till en URL-omskrivningsregel till din htaccess-fil (något annat som vi tidigare har täckt på Webdesigntuts +). Välj din önskade domän (www eller icke-www) och skriv om webbadresser automatiskt till den angivna domänen.
Ett annat problem vi har pratat om är användning av Sessions-ID. Samma webbadress med ett annat sessions-ID som bifogas kan ses som dubbletter. Återigen kan htaccess-filen användas för att inaktivera dessa parametrar. Läs Disable session ID skickas via URL av Constantin Bejenaru för att lära sig hur man gör det här.
I det föregående avsnittet pratade vi om automatisk URL-omskrivning för domännamn. Ett enklare sätt att göra detta är via Googles verktyg för webbansvariga. Logga bara in på ditt konto, gå till Konfiguration, klicka på Inställningar och ställa in en föredragen domän.
Om du använder dynamiska webbadressparametrar, Du kan berätta för Google hur du hanterar dem. På så sätt kan du se vilka parametrar som ska ignoreras. Detta kan ofta lösa många dubbla innehållsproblem. Besök Googles verktyg för webbansvariga och gå till Konfiguration> URL-parametrar. Mer information finns i Google Support, men var noga med att använda den här funktionen endast om du vet hur parametrar fungerar, annars kan du oavsiktligt blockera sidor.
Problemet är relaterat till dubbletter, men det finns vissa skillnader.
Låt oss säga att ett företag som säljer produkter i Nordamerika har två webbplatser: company.us och company.ca. Den första är riktade mot USA, den senare i Kanada. På båda sidorna hittar vi innehåll som liknar att webmastersna inte ville skriva om flera sidor text.
Det är möjligt att den amerikanska versionen överträffar den kanadensiska versionen (även på Google.ca) eftersom den har mer auktoritet. Hur kan vi åtgärda det här inriktningsproblemet?
Det finns en enkel lösning: rel = "alternate" hreflang = "x"
anteckning.
Om vi använder vårt tidigare exempel måste vi lägga till följande kod i del av .us-domänen:
På .ca-domänen måste vi placera den här koden:
I huvudsak säger du Google att det finns en alternativ version (eller dubbletter) på ett annat språk. Hreflang-attributet använder ISO 639-1 för att identifiera språket. Eventuellt kan du lägga till regionen i ISO 3166-1-format.
Förebyggande är bättre än botemedel ... Konsekvent intern koppling kan förhindra skapandet av dubbletter. Om du har http://www.website.com som en föredragen domän, peka inte på dina interna länkar till den icke-www-versionen. Samma tips gäller för inkommande länkar. Om du länkar till din egen webbplats från en annan domän, använd en konsekvent länkstruktur.
Skapa inte medvetet dubblet innehåll genom att kopiera stora bitar av text från andra webbplatser. Google kommer sannolikt att ta reda på det och konsekvenserna kanske inte är så trevliga:
I de sällsynta fall där Google uppfattar att dubblet innehåll kan visas med avsikt att manipulera våra rankningar och lura våra användare ... kan rankningen av webbplatsen drabbas, eller webbplatsen kan tas bort helt från Googles index.
Duplikat innehåll är något du ser på nästan varje sida. Det kan ha flera orsaker, oavsiktligt eller annars.
Om du inte vill förhindra åtkomst från sidan via en 301-omdirigering är det bäst att använda rel = canonical annotation. Alternativt kan du använda meta robotar-taggen eller automatisk URL-omskrivning. Googles verktyg för webbansvariga erbjuder också sätt att förhindra dubbletter.
Slutligen är det bäst att vara konsekvent i din länkning. Interna länkar och inkommande länkar ska vara desamma.