Kopyalar kontrol ediliyor. Yinelenen sayfalar: nedir, neden zararlıdırlar, nasıl bulunur ve kaldırılır. Hizmetler ve arama programları

Answertocom web sitesindeki kopya sayfalardan bahsetmiştik. Bir önceki makalenin özünü hatırlatmama izin verin. Önemli olan, blogunuzdaki hiçbir şeye giden yolu Robots.txt'de kapalı yapmamanız gerektiğidir. Aksine, robotun içeri girmesi, bakması, etiketi görmesi ve kopya sayfaları indekslememesi için robotların açık tutulması tavsiye edilir.

Sayfaların bu kopyaları kapatılırsa, bu robot büyük olasılıkla benzer kopyaları dizine ekleyecektir. Bunu hatırlamanız tavsiye edilir! Şimdi Google arama motorunda Replitok'u kullanarak kopyaları nasıl aradığımızı hatırlayalım. Ben hatırlıyorum:

site:siteniz answertocom yani benim örneğimde şöyle görünecek site: answertocom sitesi

Blogunuzda yinelenen sayfaları nasıl bulabilirsiniz?

Harika. Şimdi sayfaların diğer kopyalarını ve daha ayrıntılı kopyalarını arayacağız: özet akışı, kategori, etiket, yorum sayfası, sayfa, geri izleme, ek_id, ek

Bunları, kopyaları kullanarak yinelenen sayfaları aradığımız gibi ararız. Her şeyi benzer şekilde yapıyoruz, yani herhangi bir bloga gidip arama motoruna giriyoruz, örneğin site:realnodengi.ru beslemesi

“Gizli sonuçları göster” seçeneğini tıkladığımızda şunları göreceğiz:

22 sayfa kopya. Yem ne anlama geliyor? Bu, makale adresinin sonunda anlaşılmaz bir ektir. Gönderilerinizden herhangi biri için ctr + u tuşlarına basın; büyük olasılıkla sonunda bir yayın bağlantısı göreceksiniz. Başka bir deyişle bu tür bağlantıların kaldırılması gerekir. Bu sitenin robotlarına girelim, göreceğiz:

Yani bizim yaptığımız gerek yok. Ne yapmalıyız?Robotlarda bu tür yasakların kaldırılması tavsiye edilir. Böylece robot onlara gitmez ve "her ihtimale karşı" onları indekslemez.

Harika! Feed sayfalarını kontrol ettik.

Reall-rabota.ru gibi başka bir siteyi alalım ve sayfa ekleyelim. Site:real-rabota.ru sayfasını alacağız:

Bu sitede 61 adet kopya sayfa olduğunu görüyoruz. Onlardan kurtulmanız gerekiyor. Umarım bu blogların yazarları benim analizimden rahatsız olmazlar.

Benzer bir analizi bloglarınız için de yapın, sadece bu kopyalar için değil, yukarıda alıntıladığım kategori, etiket vb. diğer kopyalar için de.

Nasıl? Sonuçtan memnun musun?

Büyük ihtimalle tüm bu kelimelerin kopyalarını bulamazsınız. Bu elbette harika! Ama sahip olduklarınızdan kurtulmanız gerekecek! Nasıl olduğunu düşünelim mi?

Yinelenen web sitesi sayfaları nasıl kaldırılır sorun çözme

İlk önce, robotlarıma gidin ve kendiniz için kopyalayın ve uygun şekilde değiştirin İnternet sitesi sitenizin adına. Değiştirildi mi? Harika! Sanırım birçok blogun yukarıdaki sitedeki gibi yasakları vardı.

ikinci olarak, .htaccess dosyanıza aşağıdaki satırları yeniden yazın:

Bu dosya, çoğunlukla public_html olarak adlandırılan kök klasörünüzde bulunur. Bunun için genellikle programı açıp istenilen dosyayı masaüstüne aktarıyorum, bu dosyayı Notepad++ yazılımı ile açıp gerekli değişiklikleri yapıp eski dosyayı yenisiyle değiştiriyorum.

Yeni dosyayı yükledikten sonra .htaccess dosyanız şöyle görünmelidir:

Üçüncü, sonra function.php'ye yapıştırın /*** Meta robotları ADD noindex,nofollow SAYFALAR İÇİN ***/ function my_meta_noindex () ( if (is_paged() // Tümü ve tüm sayfalama sayfaları) (echo "".""."\n";)) add_action ("wp_head", "my_meta_noindex", 3); // noindex'inizi ekleyin, nofollow'u head'e ekleyin

dördüncüsü, genişletmeye git Hepsi Bir Arada Seo Paketi ve şunu yapın:

Eğer SEO gibi başka bir eklentiniz varsa anlam olarak benzer olan bölümlere noindex koyun.

Beşinci olarak, “Seçenekler”de “Ayarlar-Tartışmalar”a gidin ve onay kutusundaki onay kutusunu kaldırın Yorum Kırılımları:

Sonuç olarak çekimler hakkında detaylı bir video sunuyorum.

Hepsi bu kadar değil, hâlâ çok sayıda yinelenen sayfa ve başka saçmalık var. Kaldırılması gerekiyor. Bunu kendi başınıza yapmak her zaman kolay değildir, bu nedenle bazen bir profesyonele başvurmanız gerekir. Ama onu her zaman bulamayacaksınız ve her zaman ona başvurmayacaksınız.

Buradan tüm ayrıntıları kendiniz öğrenmeniz tavsiye edilir. Bu, kişisel iletişim yoluyla veya materyali inceleyerek yapılabilir. Video kursunu kastediyorum. Bana göre video kursu tercih edilir, çünkü... monitörünüzün önünde bir bayan tarafından eğitileceksiniz!

Bu dersi bir sebeple getirdim, çalıştım. Kişisel olarak hoşuma gitti. Daha önce Yandex bana 1220 dizine eklenmiş sayfa göstermişti, ancak gerçekte 250 tane olmasına rağmen, şimdi temizledikten sonra Yandex 490, Google 530'u gösteriyor.

Ancak, ne kadar tuhaf görünse de, çok sayıda sitede bu rakamlar 200.000 veya daha fazla çekime ulaşıyor. Şaka değil! Benzer göstergelere sahip siteler yakında arama motoru tarafından yasaklanabilir. Ama hadi yolumuza geri dönelim. İskender'in sözlerini aktaracağım:

Tüm bunlar hakkında daha fazla ayrıntı Borisov’un web sitesinde, kursun bulunduğu resme tıklamanız yeterli.

Temel olarak iş bitti, yinelenen sayfalar dizine eklendikten sonra silinecek, ancak hemen değil, birkaç ay beklemeniz gerekecek! Kaynağınızı tanıtmada iyi şanslar! Yinelenen web sitesi sayfalarını kaldırmanın başka yollarını biliyorsanız, yorumlara yazın, birlikte keşfedelim!

Her yazıda bir anekdot.

Sosyal Medya İçerik Pazarlaması: Takipçilerinizin Aklına Nasıl Girilir ve Onları Markanıza Aşık Etmek adlı yeni bir kitap yayınladık.

Bir kaynağın arama çekiciliğini artırmak, arama sıralamasını olumsuz yönde etkileyen, arama sonuçlarındaki sıralamasını düşüren ve bir çevrimiçi işi teşvik etmenin ana aracı olan bir İnternet projesinin etkinliğini azaltan yinelenen sayfalarla mücadeleyi içerir.

Kanalımızda daha fazla video - SEMANTICA ile internet pazarlamasını öğrenin

Bu neden oluyor?

Bir durum hayal edelim - sahibi, hedef kitlesi için dürüstçe benzersiz, yüksek kaliteli tematik içerik hazırladı: yararlı, güvenilir, güncel açıklamalar, yetkin eğitim materyalleri, ses ve video kayıtları, mükemmel tematik grafikler, medya formatında benzersiz yetkili raporlar Prestijli bir stüdyoda kaydedilen video talimatları, web seminerleri, marka reklamı içeren profesyonel bir video - kaynağa güven, güçlü bir itibar ve olumlu satın alma kararları için gereken her şeyi sağladı. Bu yaklaşım, trafik ve temettüler açısından umudu hak ediyor.

İhmal nedir? Bir açıklama var.

Arama motorları, kaliteli, orijinal, kullanışlı içerikleri arayan ve bu tür web kaynaklarının ve sayfalarının sıralamasını yükselten robotlardır. Benzersizlik, içeriğin kalitesinin temel kriterlerinden biridir.

Birisi kusursuz içeriğinizi dürüst olmayan bir şekilde kopyalayıp kendi web sitesinde yayınlarsa, bir arama motoru nasıl davranır - böyle bir sayfanın sıralamasını düşürür, kaynağı intihal nedeniyle yasaklar, yazarlığın ihlal edildiğini fark eder. Ne yazık ki, aynı metni ikinci kez kopyalayıp kendi kaynağınıza gönderirseniz, arama motoru tamamen aynı şekilde davranacaktır: sadece kendinizle rekabet etmiş olursunuz.

Arama motorlarının kopyalara karşı olumsuz tutumunun temelinde, İnternet kullanıcılarına gösterilen bu dikkat ilkesi ve arama sonuçlarında ilk sıralarda yalnızca en benzersiz, en taze ve yararlı olanı seçme arzusu yatmaktadır.

Prensip açıktır, ancak düşük derecelendirmenin kaynağı - site içindeki kopyalar - keşfedildiğinde site sahipleri ne kadar şaşırırlar! İlk tepki şu: kopyalarımız yok, her sayfa benzersizdir!

Neler çift olarak sayılır?

Bir web sitesindeki yinelenen sayfalar, içeriği ağda zaten mevcut olan başka bir sayfanın içeriğiyle tamamen veya kısmen örtüşen sayfalardır.

Bu tür sayfaların adresleri neredeyse aynı olabilir.

Örneğin:

www ile başlayan ve www olmadan alan adı olan,
sonunda bir eğik çizgi ile,
sonunda .php veya .html ile.

Belirtilen farklılıklara sahip birden fazla adrese sahip olan aynı sayfa, birkaç farklı sayfa olarak algılanacaktır - birbirlerine göre kopyalar.

Farklı çekimler var

Yinelenen sayfalar aynı siteye aitse bunlar dahili kopyalardır.

Tam ve eksik iç çekimler vardır (açık ve bulanık).

http://site.com/about
http://www.site.com/about
http://www.site.com/about.html
http://www.site.com/about/

tamamen aynı içerik olacak. Bir sayfa olacak, yalnızca URL farklı olacaktır. Bunlar tam çekimlerdir.

Eksik kopyalar, diğer sayfaların içeriğini kısmen tekrarlayan sayfalardır; örneğin, ana sayfadaki ana bilgi bloğu, “Hakkımızda” sayfasının içeriğini tam olarak tekrarlar ve bu tür sayfaların bağlantıları farklı olacaktır, farklı bölümler olacaktır. Menüde aktif olabilir ve yan sütun bloklarında farklı bölümler bulunabilir. Bu sayfaların URL'leri farklıdır.

Kopyaların nedeni

Eksik kopyalar site sayfalarının yapısının bilinçli seçiminin sonucuysa, sahibi genellikle tam olanları bile bilmiyor.

Tam çekimlerin nedenleri:

Sayfa başlıklarının sonunda eş anlamlılar oluşturmanıza olanak tanıyan CMS özellikleri. Sonuna / ile veya olmadan, s.html, .htm, php yazarak hep aynı sayfayı açacağız.
Bir web sitesi için www içeren ek alan adı. Sayfalar her iki alan adına da yanıt verir.
Listenin ilk sayfası hem stranitsa bağlantısı hem de stranitsa/page_1 bağlantısı tarafından açıldığında bilgilerin sayfa bazlı gösterimi ().
Sitenin herhangi bir sayfası bir menü öğesine birkaç kez bağlanabiliyorsa, aynı sayfalar için site yapısında birkaç farklı ad kullanılabilir.
Sayfa URL'lerinde değişikliklere yol açan yeniden tasarım.

Eksik alımların nedenleri

Kural olarak, sahibinin, daha fazla dikkat çekmek ve kullanılabilirliği artırmak için aynı bilgiyi farklı sayfalarda görüntüleme konusundaki bilinçli arzusu. Aynı metinler farklı bloklarda görüntüleniyor ve birçok yerde çoğaltılıyor. Makul sınırlar dahilinde bu haklıdır.

Web sitesi tanıtımı için kopyaların tehlikeleri nelerdir?

Arama motorlarının bu tür sitelere yaptırımlar uygulaması ve bunları filtrelere göndermesi nedeniyle, arama sonuçlarından kaldırılma da dahil olmak üzere sayfaların ve tüm sitenin sıralaması düşürüldüğünden, kopyalar SEO açısından istenmeyen bir durumdur.
Kopyalar sayfa içeriğinin tanıtımını engelleyerek tanıtılan sayfaların alaka düzeyini etkiler. Birden fazla aynı sayfa varsa, arama motoru bunlardan hangisinin tanıtılması gerektiğini anlayamaz ve sonuç olarak hiçbiri arama sonuçlarında üst sıralarda yer almaz.
Kopyalar site içeriğinin benzersizliğini azaltır: tüm kopyalar arasında dağılmıştır. İçeriğin benzersizliğine rağmen, arama motoru ikinci sayfayı birinciye göre benzersiz olmayan olarak algılar, ikincinin derecelendirmesini düşürür, bu da sıralamayı etkiler (siteleri arama sonuçlarına göre sıralama).
Kopyalamalar nedeniyle tanıtılan ana sayfaların ağırlığı kaybolur: tüm eşdeğer sayfalar arasında bölünür.
Arama robotları, kopyaları dizine ekleyerek bir sitenin tüm sayfalarını dizine eklemek için daha fazla zaman harcar.

Bul ve yok et

Arama motorlarının çalışma prensibine göre, yalnızca bir bağlantının bir sayfaya karşılık gelmesi gerektiği ve bir bilginin sitenin yalnızca bir sayfasında yer alması gerektiği ortaya çıkıyor. O zaman gerekli sayfaların tanıtımı için uygun koşullar olacak ve arama motorları içeriğinizi yeterince değerlendirebilecektir. Bunu yapmak için kopyaların bulunması ve ortadan kaldırılması gerekir.

Bir web sitesinde yinelenen sayfalar nasıl bulunur?

1. Bir arama motorunda, arama alanına site girerseniz bir sitenin tüm sayfalarını bulabilirsiniz: sitenin alan adı, boşlukla ayrılmış, bir metin parçası. Arama sonuçlarında bu ifadeyi içeren tüm sayfaları yalnızca sitenizde bulacaksınız.

2. Yinelenen sayfaları aramak da dahil olmak üzere siteleri analiz etmek için özel programlar vardır. Örneğin Xenu bu amaç için basit ve kullanışlıdır. Prensip şudur: Bir alan adı belirtilir, tüm sayfalar için bir arama başlatılır, hataları ve kopyaları gösteren bir rapor hazırlanır.
3. Arama motorları, web yöneticilerinin, arama robotları tarafından da aynı şekilde algılanacak en etkili ve popüler siteleri oluşturmalarına yardımcı olmak için, raporlarla birlikte ayrı bölümlere sahip olan site performans analitiği hizmetlerinin - “Web Yöneticileri için Araçlar” kullanımını sunar. yinelenen sayfalarda, sorunlu sayfaların bir listesini de buradan alabilirsiniz.

Kopyaların bir listesine sahip olarak onları ortadan kaldırmaya başlayabilirsiniz.

Yinelenen sayfalardan nasıl kurtulurum

Bir web sitesindeki yinelenen sayfaları kaldırmanın iki yolu vardır: yinelenen sayfaları ortadan kaldırmak ve bunları arama robotlarından gizlemek.

Tek sayfa - tek bağlantı ilkesinden hareket edersek, aynı sayfanın tüm varyasyonları hariç tutulmalıdır: bir seçenek istenen sayfayı açar, diğerleri sayfayı bulamaz. Sayfa bulunamazsa kullanıcıya 404 hatası verilir.Estetik açısından genellikle güzel tasarlanmış veya üzerine faydalı site malzemesi yerleştirilmiştir.

Ancak kullanıcının bakış açısından, bir sayfayı birkaç olası seçenekten yalnızca birini kullanarak bulmak zahmetlidir. Bu durumda, tüm sayfa yazma seçeneklerinin mevcut tek bir sayfaya yönlendirilmesini (otomatik yönlendirme) ayarlayın. Buna 301 yönlendirmesi denir, sunucuda özel bir htaccess dosyasında ayarlanır ve arama motorları buna oldukça sadıktır.

Nelerin indeksleneceğine ve nelerin göz ardı edileceğine ilişkin talimatlar olarak, arama motorları için oluşturulan özel bir dosyada, arama motorlarının yinelenen sayfaları indekslemesini engelleyebilirsiniz. Bu dosyayı kullanarak yinelenen sayfaların dizine eklenmesini engelleyebiliriz.

Durumun avantajı, anahtar varlığınız olan içeriğinizin saldırganlar tarafından çalınmaması, fikri mülkiyet haklarını savunmanıza, mahkemeye gitmenize, Google, Yandex, Digital Millenium Copyright'a şikayet ve mektup yazmanıza, kanıt ve ekran görüntüleriyle birlikte gerek olmamasıdır. yönetici paneli ve blog gönderileri: can sıkıcı yanlış anlaşılmayı ortadan kaldırmak için bir dizi dahili önlem almanız yeterlidir; yeniden indekslemeden kısa süre sonra, yatırdığınız bütçeden, pazarlama çabalarınızdan geri dönüş alabilecek ve işletme kârınızı artırabileceksiniz.

Arama algoritmaları sürekli olarak gelişmektedir; genellikle yinelenen sayfaları kendileri tespit edebilir ve bu tür belgeleri ana aramaya dahil etmezler. Ancak site incelemeleri yaparken algoritmaların kopyaları belirleme konusunda hala mükemmel olmaktan uzak olduğu gerçeğiyle sürekli karşılaşıyoruz.

Yinelenen sayfalar nelerdir?

Bir web sitesindeki yinelenen sayfalar, içeriği ağda zaten mevcut olan başka bir sayfanın içeriğiyle tamamen veya kısmen örtüşen sayfalardır.

Bu tür sayfaların adresleri neredeyse aynı olabilir.

Çiftler:

www ile başlayan ve www olmadan bir alan adı ile, örneğin www.site.ru ve site.ru.
sonunda eğik çizgi var, örneğin site.ru/seo/ ve site.ru/seo
sonunda.php veya.html ile, site.ru/seo.html ve site.ru/seo.php

Belirtilen farklılıklara sahip birden fazla adrese sahip olan aynı sayfa, birkaç farklı sayfa olarak algılanacaktır - birbirlerine göre kopyalar.

Kopyalar nedir?

Yinelenen site sayfalarını arama sürecine başlamadan önce, bunların 2 türü olduğuna karar vermeniz gerekir; bu, bunları bulma ve bunlarla başa çıkma sürecinin biraz farklı olacağı anlamına gelir. Dolayısıyla özellikle şunları ayırt ederler:

Çekimleri tamamla- aynı sayfa 2 veya daha fazla adreste bulunduğunda.
Kısmi kopyalar- içeriğin belirli bir kısmının birkaç sayfada çoğaltılması ancak bunların artık tam kopya olmaması.

Kopyaların nedenleri

Öncelikle sitenizde neden kopyaların bulunduğunu bulmanız gerekir. Bu prensip olarak URL'den anlaşılabilir.

Kopyalar kimlik oturumları oluşturabilir. Kullanıcı eylemlerini izlemek veya sepete eklenen öğeler hakkındaki bilgileri analiz etmek için kullanılırlar;
CMS'nin (motor) özellikleri. WordPress'te genellikle yinelenen sayfalar yoktur, ancak Joomla çok sayıda kopya oluşturur;
Parametreli URL'ler genellikle site yapısının yanlış uygulanmasına yol açar;
Yorum Sayfaları;
Yazdırılabilir sayfalar;
Fark adrestedir: www - www değil. Şimdi bile, arama robotları alan adlarını www ile ve www olmayanlarla karıştırmaya devam ediyor. Kaynağın doğru uygulanması için buna dikkat edilmelidir.

Kopyaların web sitesi tanıtımı üzerindeki etkisi

Arama motorları bu tür sitelere yaptırımlar uyguladığından ve bunları filtrelere gönderdiğinden, kopyalar SEO açısından istenmeyen bir durumdur, bunun sonucunda sayfaların ve tüm sitenin sıralaması, arama sonuçlarından kaldırılma da dahil olmak üzere düşürülür.
Kopyalar sayfa içeriğinin tanıtımını engelleyerek tanıtılan sayfaların alaka düzeyini etkiler. Birden fazla aynı sayfa varsa, arama motoru bunlardan hangisinin tanıtılması gerektiğini anlayamaz ve sonuç olarak hiçbiri arama sonuçlarında üst sıralarda yer almaz.
Kopyalar site içeriğinin benzersizliğini azaltır: tüm kopyalar arasında dağılmıştır. İçeriğin benzersizliğine rağmen, arama motoru ikinci sayfayı birinciye göre benzersiz olmayan olarak algılar, ikincinin derecelendirmesini düşürür, bu da sıralamayı etkiler (siteleri arama sonuçlarına göre sıralama).
Kopyalamalar nedeniyle tanıtılan ana sayfaların ağırlığı kaybolur: tüm eşdeğer sayfalar arasında bölünür.
Arama robotları, kopyaları dizine ekleyerek bir sitenin tüm sayfalarını dizine eklemek için daha fazla zaman harcar.

Yinelenen sayfalar nasıl bulunur?

XENU programı (tamamen ücretsiz)

Xenu Link Sleuth programı (http://home.snafu.de/tilman/xenulink.html), arama motorları tarafından indekslenmeyen siteler de dahil olmak üzere tüm sitelerdeki çevrimiçi hizmetlerden bağımsız olarak çalışır. Web yöneticisi araçlarında birikmiş istatistiklere sahip olmayan siteleri kontrol etmek için de kullanabilirsiniz.

Yinelenen başlıklar ve meta açıklamalar kullanılarak site XENU programıyla tarandıktan sonra kopyaların aranması gerçekleştirilir.

Screaming Frog SEO Spider (Kısmen Ücretsiz)

Programın adresi https://www.screamingfrog.co.uk/seo-spider/'dir. Bu program XENU ile aynı şekilde çalışır ancak daha renklidir. Program, 500'e kadar web sitesi bağlantısını ücretsiz olarak tarar; daha kapsamlı tarama, ücretli abonelik gerektirir. Ben kendim kullanıyorum.

Netpeak Spider programı (denemeyle birlikte ödenir)

Yandex Web Yöneticisi

Yinelenenleri aramak için site istatistiklerini topladıktan sonra Yandex.Webmaster'ı kullanabilirsiniz. Hesap araçlarınızda Dizine Ekleme > Aramadaki Sayfalar sekmesinde “Hariç Tutulan Sayfalar”ı görüntüleyebilir ve bu sayfaların neden dizinden kaldırıldığını öğrenebilirsiniz. Silinme nedenlerinden biri kopya içeriktir. Tüm bilgiler her sayfa adresinin altında mevcuttur.

Google Arama Konsolu

Google Web Yöneticisi Konsolu'nda ayrıca yinelenen bir arama aracı bulunur. Sitenizi Google Web Yöneticisi konsolunda açın. Arama Görünümü > HTML Optimizasyonu sekmesinde, varsa yinelenen başlıklar ve meta açıklamalar göreceksiniz. Büyük olasılıkla bunlar kopyalardır (kısmi veya tam).

Arama dili

Arama sorgusu dilini kullanarak, arama sonuçlarında yer alan tüm site sayfalarının bir listesini görüntüleyebilir (Google ve Yandex'deki "site:" operatörü) ve kopyaları "gözlerinizle" arayabilirsiniz.

Çevrimiçi hizmetler

Çevrimiçi olarak bir web sitesindeki yinelenen sayfaları kontrol eden hizmetler vardır. Örneğin Siteliner.com hizmeti (http://www.siteliner.com/). Burada bozuk bağlantıları ve kopyaları bulabilirsiniz. Abonelikle 25.000 sayfaya kadar ve ücretsiz olarak 250 sayfaya kadar kontrol edebilirsiniz.

Rus hizmeti Saitreport.ru kopyaların bulunmasında yardımcı olabilir. Hizmet adresi: https://saitreport.ru/poisk-dublej-stranic

Yinelenen web sitesi sayfalarını kaldırma

Kopyalarla başa çıkmanın çok fazla yolu yoktur, ancak bunların tümü uzman geliştiricileri dahil etmenizi veya uygun bilgiye sahip olmanızı gerektirecektir. Aslında kopyaları "köklerinden sökmek" için gereken cephanelik şu şekildedir:

Bunların fiziksel olarak kaldırılması, statik kopyalar için iyi bir çözümdür.
Kopyaların indekslenmesinin yasaklanması - ana açılış sayfalarının içeriğini kısmen kopyalayan hizmet sayfalarıyla mücadele için uygundur.
“.htaccess” yapılandırıcı dosyasında - ref etiketleri ve URL hiyerarşisindeki hatalar için iyi bir çözüm.
“ ” etiketini yüklemek, sayfalara ayırma, filtreler ve sıralama, utm sayfaları için en iyi seçenektir.
“meta name=”robots” content=”noindex, nofollow”” etiketini yükleme - basılı sürümler için bir çözüm, ürünlerle ilgili incelemeleri içeren sekmeler.

Yinelenen sayfalar için kontrol listesi

Çoğunlukla sorunun çözümü motorun kendisinin ayarlanmasında yatmaktadır ve bu nedenle optimize edicinin asıl görevi, kısmi ve tam çekimlerin tam bir listesini belirlemek ve icracıya yetkin bir teknik spesifikasyon sağlamak kadar fazla eleme yapmak değildir.

Aşağıdakileri unutmayın:

Tam kopyalar, aynı sayfanın 2 veya daha fazla adreste bulunmasıdır. Kısmi kopyalar, belirli bir içerik parçasının birden fazla sayfada çoğaltılmasıdır ancak bunlar artık tam kopya değildir.
Tam ve kısmi kopyalar, bir sitenin arama sonuçlarındaki konumunu yalnızca URL ölçeğinde değil, aynı zamanda alanın tamamında da düşürebilir.
Tam kopyaları bulmak ve ortadan kaldırmak zor değildir. Çoğu zaman, görünümlerinin nedeni sitenin CMS özelliklerine ve site geliştiricisinin SEO becerilerine bağlıdır.
Kısmi kopyaların bulunması daha zordur ve sıralamada ani kayıplara yol açmaz, ancak bunu yavaş yavaş ve site sahibi tarafından fark edilmeden yaparlar.
Kısmi ve eksiksiz yinelenen sayfaları bulmak için, arama operatörlerini, özel ayrıştırıcı programlarını, Google arama konsolunu ve sitede manuel aramayı kullanarak arama sonuçlarının izlenmesini kullanabilirsiniz.
Bir sitedeki kopyalardan kurtulmak, onları fiziksel olarak silmek, "robots.txt" dosyasında kopyaların dizine eklenmesini yasaklamak, 301 yönlendirmeleri ayarlamak, "rel=canonical" ve "meta name="robots" content="noindex'i yüklemek anlamına gelir, nofollow” etiketleri.”

Bir sitenin konum ve trafik kaybetmesinin ana nedenlerinden biri, sitedeki kopya sayfaların sayısının artmasıdır. CMS'nin (motorun) özelliklerinin bir sonucu olarak, sitedeki sayfa sayısındaki düzenli artış nedeniyle aramadan maksimum trafik alma arzusunun yanı sıra bağlantıların bilinçli veya bilinçsiz yerleştirilmesi nedeniyle ortaya çıkabilirler. üçüncü taraflarca diğer kaynaklardan alınan kopyalarınıza.

Kopya sorunu, bir arama analizörü kullanarak bir sayfanın kanonik adresini bulma sorunuyla çok yakından ilgilidir. Bazı durumlarda robot, örneğin dinamik URL'deki parametrelerin sırası değiştirilmişse kanonik adresi belirleyebilir:

?&kedi= 10 &ürün= 25

Bu aslında şu sayfayla aynı sayfadır:

Ürün= 25 &kedi= 10

Ancak çoğu durumda, özellikle kullanırken kanonik sayfayı belirlemek zordur, bu nedenle tam ve kısmi kopyalar dizinde yer alır.

İlginç olan, Yandex için kopyaların o kadar da kötü olmaması ve site arama sonuçları sayfalarında bile (birbirlerinin kısmi kopyaları olan) iyi trafik getirebilmesi, ancak Google'ın kopyalara karşı daha eleştirel olması (MFA ve şablon siteleri).

Bir web sitesinde kopyaları bulmanın temel yöntemleri

Aşağıda, web sitenizdeki yinelenen sayfaları hızlı bir şekilde bulabileceğiniz ana yöntemler bulunmaktadır. Bunları periyodik olarak kullanın.

1. Google web yöneticisi

Google Web Yöneticisi Paneline gidin. “Optimizasyon” – “HTML Optimizasyonu” menü bölümünü bulun. Bu sayfada yinelenen meta açıklamaların ve TITLE başlıklarının sayısını görebilirsiniz.

Bu şekilde sayfaların tam kopyalarını bulabilirsiniz, ancak ne yazık ki benzersiz ancak şablon başlıklarına sahip kısmi kopyaları tanımlayamazsınız.

2.Xenu programı

Xenu Link Sleuth, sitenin teknik denetimini gerçekleştirmeye ve diğer şeylerin yanı sıra yinelenen başlıkları (örneğin, Google Web Yöneticisi'ne erişiminiz yoksa) bulmaya yardımcı olan popüler optimizasyon programlarından biridir.

Bu program hakkında daha fazla ayrıntı inceleme makalesinde yazılmıştır. Siteyi tarayın, sonuçları başlığa göre sıralayın ve görsel başlık eşleşmelerini arayın. Tüm rahatlığına rağmen, bu yöntemin aynı dezavantajı vardır - kısmen yinelenen sayfaları bulmanın bir yolu yoktur.

3. Arama sonuçları

Arama sonuçları yalnızca sitenin kendisini değil aynı zamanda arama motorunun siteye karşı belirli bir tutumunu da yansıtabilir. Google'da kopyaları aramak için özel bir sorgu kullanabilirsiniz.

site:sitem.ru -site:sitem.ru /&

Bileşenlerin bulunduğu yer:

site:mysite.ru- mysite.ru sitesinin Google dizinindeki (genel dizin) sayfalarını gösterir.

site:mysite.ru/&- aramaya katılan mysite.ru sitesinin sayfalarını gösterir (ana dizin).

Bu sayede, aramaya dahil edilmeyen, az bilgi içeren ve kısmi kopya içeren sayfaları tespit edebilir ve ana dizindeki sayfaların daha üst sıralarda yer almasını engelleyebilirsiniz. Arama yaparken, daha objektif bir resim görmek için az sayıda sonuç varsa "eksik sonuçlar da dahil olmak üzere aramayı tekrarlayın" bağlantısını tıkladığınızdan emin olun (örneğe bakın) alan: drezex.com .ua -site:drezex.com.ua/&).

Artık tüm yinelenen sayfaları bulduğunuza göre, site motorunu ayarlayarak veya sayfa başlıklarına bir etiket ekleyerek bunları güvenle silebilirsiniz.

Sanırım sizin durumunuzda algoritmanın tüm sayfaları doğru değerlendireceğini ve seçiminin sizinkiyle örtüşeceğini ummamalısınız 😉 - sitedeki kopyalardan kendiniz kurtulmak daha iyidir.

Neden kopyalardan kurtulmanız gerekiyor?

Öncelikle yinelenen sayfaların tehlikelerini göz önünde bulundurmanızı öneririm.

Site indeksleme kötüleşiyor
Projenizde birkaç bin sayfa varsa ve her biri için bir kopya oluşturulmuşsa, sitenin hacmi zaten yarı yarıya "şişirilmiştir". Peki ya tek bir çekim değil de birkaç çekim yaratılırsa? Geçtiğimiz yıl her haberin otomatik olarak yedi bölüm halinde yayınlandığı, yani her sayfanın anında altı kopya daha oluşturulduğu bir haber portalının incelemesini yapmıştık.

Dahili bağlantı ağırlığı yanlış dağıtılıyor
Çoğu zaman bir sitedeki kopyalar yanlış dahili bağlantıların bir sonucu olarak ortaya çıkar. Sonuç olarak, yinelenen sayfaların ana sürümden daha önemli olduğu düşünülebilir. Kullanıcı faktörlerini unutmayın. Bir ziyaretçi kopya bir sayfaya gelirse, buna göre orijinal değil göstergeleri ölçülür.

Arama sonuçlarında ilgili sayfayı değiştirme
Arama algoritması herhangi bir zamanda bir kopyanın sorguyla daha alakalı olduğunu düşünebilir. Arama sonuçlarındaki bir sayfayı değiştirmeye genellikle sıralamalarda önemli bir düşüş eşlik eder.

Kopyalar nasıl bulunur?
Şimdi bir web sitesinde dahili kopyaları nasıl bulabileceğinize bakalım.

1. Google Web Yöneticileri Veri Analizi

Belki de en kolay yol. Yinelenen sayfaları bulmak için araç çubuğuna gitmeniz, "Arama Görünümü" sekmesini seçmeniz ve "html optimizasyonu" bağlantısını izlemeniz yeterlidir:

Amacımız şu noktalardır:
— "Tekrarlayan meta açıklama" . Aynı açıklamalara sahip sayfalar burada görüntülenir;
— "Yinelenen başlıklar (başlık etiketleri)" . Bu öğe aynı başlıklara (Başlık) sahip sayfaların bir listesini içerir.

Gerçek şu ki, sayfalarda yalnızca içerik değil, meta veriler de genellikle aynıdır. Bu sekmelerde görüntülenen sayfaların listesini analiz ederek bu tür kopyaları kolayca tespit edebilirsiniz. Yeni hatalar için yukarıda belirtilen araç çubuğu sekmelerini düzenli aralıklarla kontrol etmenizi öneririz.

Panele erişiminiz olmasa bile sayfaları eşleşen başlıklar açısından kontrol edebilirsiniz. Bunu yapmak için, arama motorunun gelişmiş aramasını kullanmanız veya ilgili sorguyu hemen arama çubuğuna girmeniz gerekecektir.

Yandex için:

site: web sitesi başlığı: (site analizi)

Google için :
site: site başlığı: site analizi

Elbette, alan adınızı ve kopyasını aradığınız başlığın bir kısmını değiştirmeniz gerekir.

2. İndekslenmiş belgelerin analizi
Analizi öncelikle dizini en fazla sayfayı içeren arama motorunda yapmak en iyisidir. Çoğu durumda bu Google'dır. Sorgu dili operatörünü "site" kullanarak, dizine eklenen sayfaların tam listesine ulaşmak kolaydır. Arama çubuğuna şunu girin:

site:site (alan adınızı belirtmeyi unutmayın) ve dizine eklenen sayfaların bir listesini alın.

Sonuçları görüntülerken standart olmayan başlıklara ve sayfa URL'lerine dikkat edin.

Örneğin, sitede CNC ayarları bulunurken, arama sonuçlarının sonunda tanımlayıcıların bulunduğu sayfalar bulunduğunu görebilirsiniz. Çoğu zaman, dizine eklenen sayfaların hızlı bir analizi, kopyaları veya diğer hataları tanımlamanıza olanak tanır.
Sitede çok sayıda sayfa varsa Xenu programı analize yardımcı olabilir. Bu aracın kullanımı hakkında Sergei Koksharov'un blogunu okuyabilirsiniz.

3. Metnin bir kısmına göre kopyaları arayın
Önceki iki yöntem, sayfalardaki meta verilerin aynı olduğu durumlarda kopyaların belirlenmesine yardımcı olur. Ancak başka durumlar da olabilir. Örneğin, bir web sitesindeki bir makale aynı anda birkaç kategoriye ayrılır ve kategori adı otomatik olarak başlığa ve açıklamaya eklenir, bu da meta verileri biçimsel olarak benzersiz kılar. Bu durumda araç çubuğunda hatalar görmeyiz ve sayfa snippet'lerini manuel olarak analiz ederken bu tür kopyaları gözden kaçırmak kolaydır.

Bir sitedeki benzer sayfaları tespit etmek için en iyi yaklaşım metnin bir kısmını aramaktır.
Bunu yapmak için "gelişmiş arama" aracını kullanmanız ve sitede sayfa metninin bir kısmını aramanız gerekir. Sorgumuzdakiyle aynı kelime sırası ve formuna sahip sayfaları aramak için metni tırnak içinde giriyoruz.
Yandex'de gelişmiş arama şu şekilde görünür:

Ve işte Google'da:

Web sitelerinde yüzlerce, hatta binlerce sayfa bulunabilir. Elbette tüm sayfaları analiz etmenize gerek yok. Gruplara ayrılabilirler. Örneğin ana sayfa, kategoriler, ürün kartları, haberler, makaleler. Kopyaları belirlemek veya sitede her şeyin yolunda olduğundan emin olmak için her türden 2-3 sayfayı analiz etmek yeterli olacaktır.

Siteyi kopyalardan temizleme
Kopyalar tespit edildikten sonra bunları kaldırmaya başlayabilirsiniz.

Tekrarların nedenini bulup ortadan kaldırıyoruz
Yapılacak ilk şey, sitede kopyaların görünmesinin nedenini bulmak ve onu ortadan kaldırmaya çalışmaktır.
Örneğin çeşitli nedenler olabilir:

site yapısının mantığındaki hatalar;
teknik hatalar;
çeşitli filtreler ve site araması.

Her durumda, durum ayrı ayrı ele alınmalıdır, ancak kopyalar işlevsel olarak kullanışlı değilse, onları terk etmek daha iyidir.

Sayfanın standart adresini belirtin
Eğer yinelenen sayfalar herhangi bir nedenle silinemiyorsa, arama robotlarına hangi sayfanın ana (kanonik) sayfa olduğunu belirtmelisiniz. Google bunun için özel bir özellik ekledi: rel=”canonical” (özelliğin kullanımına yönelik öneriler).

Bir süre sonra Yandex bunu desteklemeye başladı. Ve bugün bu, yinelenen sayfalarla mücadelede ana resmi araçtır.

301 yönlendirmelerini kullanma
rel='canonical' kullanıma sunulmadan önce 301 yönlendirmeleri, yinelenen sayfaları birleştirmenin ana yoluydu. Artık geliştiriciler ve optimize ediciler, ana site aynasına veya sonunda "/" olan veya olmayan sayfalardan yönlendirme yapmak için 301 yönlendirmelerini aktif olarak kullanmaya devam ediyor.

Robots.txt dosyasında indeksleme yasağı
Robots.txt dosyasında belirli bölümlere veya sayfa türlerine, örneğin site aramaları sonucunda oluşturulan sayfalara erişimi engelleyebiliriz. Ancak bu bizi Google'daki kopya sayfalardan kurtarmayacak. Gerçek şu ki, sayfalara erişim reddedilecek, ancak sayfalar zaten dizindeyse, yasağın eklenmesinden sonra hariç tutulmayacaktır.

Şunu da belirtmek gerekir ki, robots.txt dosyası kullanarak arama robotlarının sitenizin içeriğini taramasını engelleseniz bile Google'ın bunu başka yollarla tespit edip indekse eklemesinin mümkün olduğunu belirtmekte fayda var. Örneğin diğer siteler içeriğinize bağlantı verebilir.

Bir sayfanın indeksten çıkarılabilmesi için şunu eklemek gerekir: ancak robots.txt dosyasında sayfanın kapatılmaması önemlidir. Aksi takdirde arama robotu ona erişmeyecektir.

Sayfanız sonuçlarda görünmeye devam ederse, büyük ihtimalle etiketi ekledikten sonra sitenizi henüz taramamışızdır. (Ayrıca robots.txt dosyanızı kullanarak bu sayfayı engellediyseniz bu etiketi de göremeyiz.)

Bu bağlamda, sitede zaten kopyalar varsa, robots.txt bunların Google dizininden kaldırılmasına yardımcı olmayacaktır.

Optimize edicilere kopyalara karşı mücadelede ve projelerinin geliştirilmesinde başarılar dilemeye devam ediyor.

Haber bültenimize abone ol