• Arama motoru nedir, nasıl çalışır? İnternet arama motorları: mevcut çözümlere genel bakış

    Son yıllarda Google ve Yandex'den gelen hizmetler hayatımıza sağlam bir şekilde girdi. Bu bağlamda, birçoğu muhtemelen bir arama motorunun ne olduğunu merak ediyor? konuşmak basit kelimelerle, Bu yazılım sistemi, Dünya'da bilgi aramak için tasarlanmıştır geniş ağ. Sonuçları genellikle, genellikle arama sonuçları sayfaları (SERP'ler) olarak adlandırılan bir liste şeklinde sunulur. Bilgiler web sayfalarının, resimlerin ve diğer dosya türlerinin bir kombinasyonu olabilir. Bazı arama motorları veritabanlarında veya açık dizinlerde bulunan bilgileri de içerir.

    Yalnızca yerel düzenleyiciler tarafından desteklenen web dizinlerinin aksine, arama motorları ayrıca bir web tarayıcısında bir algoritma çalıştırarak gerçek zamanlı bilgiler içerir.

    Oluşum tarihi

    Arama motorları, Aralık 1990'da World Wide Web'den daha önce ortaya çıktı. Bu tür ilk hizmete Archie adı verildi ve FTP dosyalarının içeriğini komutlarla aradı.

    İnternet arama motoru nedir? Eylül 1993'e kadar Dünya çapında Web tamamen elle indekslenmiştir. CERN web sunucusunda barındırılan, Tim Berners-Lee tarafından düzenlenen web sunucularının bir listesi vardı. her şey gibi büyük miktar sunucular çevrimiçi oldu, yukarıdaki hizmet bu kadar büyük miktarda bilgiyi işlemeye yetişemedi.

    Web aramasına dayalı ilk arama motorlarından biri, 1994 yılında piyasaya sürülen WebCrawler idi. Öncekilerden farklı olarak, kullanıcıların herhangi bir web sayfasında herhangi bir kelimeyi aramasına izin verdi. Bu algoritma o zamandan beri tüm büyük arama motorları için standart haline geldi. Aynı zamanda kamuoyunda yaygın olarak bilinen ilk karardı. Ayrıca 1994 yılında, daha sonra büyük bir ticari proje haline gelen Lycos hizmeti başlatıldı.

    Kısa süre sonra birçok arama motoru ortaya çıktı ve popülariteleri önemli ölçüde arttı. Bunlar Magellan, Excite, Infoseek, Inktomi, Northern Light ve AltaVista'dır. yahoo! ilgilenilen web sayfalarını bulmanın en popüler yollarından biriydi, ancak arama algoritması sayfaların tam metin kopyalarında değil, kendi web dizininde çalışıyordu. Bilgi arayanlar, anahtar kelime araması yapmak yerine kataloğa da göz atabilirler.

    Yeni geliştirme turu

    Google, arama sorgularını satma fikrini 1998 yılında goto.com adlı küçük bir şirketle başlayarak benimsedi. Bu hareketin, zamanla web'deki en karlı işlerden biri haline gelen SEO işi üzerinde önemli bir etkisi oldu.

    2000 yılı civarında, Google arama motoru yaygın olarak bilinir hale geldi. Şirket, PageRank adlı bir yenilikle birçok aramada daha iyi sonuçlar elde etti. Bu yinelemeli algoritma, web sayfalarını, iyi veya arzu edilen kaynakların başkaları tarafından sıklıkla bahsedildiği varsayımına dayanarak, diğer sitelere ve sayfalara olan bağlantılarına göre değerlendirir. Google ayrıca arama motoru için minimalist bir arayüze sahiptir. Aksine, rakiplerin çoğu web portalına bir arama motoru kurmuştur. Hatta Google o kadar popüler hale geldi ki Mystery Seeker gibi dolandırıcılık motorları ortaya çıktı. Bugün, bu hizmetin birçok bölgesel sürümü var, özellikle Rusça konuşan kullanıcılar için tasarlanmış Google.ru arama motoru.

    Bu hizmetler nasıl çalışır?

    Sonuçların sıralaması ve yayınlanması nasıl? Eylem algoritması açısından arama motorları nelerdir? Bilgilerini siteden siteye web taraması yoluyla alırlar. Robot veya "örümcek", indeksleme için belirli bilgileri göndermeden önce kendisine gönderilen varsayılan robots.txt dosya adını kontrol eder. Bu, standartların yanı sıra başlıklar, sayfa içeriği, JavaScript, Basamaklı Stil Sayfaları (CSS) gibi birçok faktöre odaklanır. HTML işaretlemesi HTML meta etiketlerinde içerik veya meta veriler.

    İndeksleme, web sayfalarında bulunan sözcükleri ve diğer tanımlanabilir belirteçleri kendileriyle ilişkilendirmek anlamına gelir. alan isimleri ve alanlar HTML tabanlı. İlişkilendirmeler, web arama sorguları için kullanılabilen genel bir veritabanında oluşturulur. Kullanıcıdan gelen istek tek kelime olabilir. Dizin, bir sorguyla ilgili bilgileri olabildiğince çabuk bulmanıza yardımcı olur.

    İndeksleme ve önbelleğe alma tekniklerinden bazıları ticari sırlardır, web taraması ise tüm siteleri sistematik bir şekilde ziyaret etmenin basit bir işlemidir.

    Gezinmeler arasında, arama motorunun çalışma belleğinde saklanan sayfanın önbelleğe alınmış bir sürümü (görüntülenmesi için gereken içeriğin bir kısmı veya tamamı), istekte bulunan kullanıcıya hızlı bir şekilde gönderilir. Ziyaret gecikirse, arama motoru basitçe bir web proxy'si görevi görebilir. Bu durumda, sayfa arama dizinlerinden farklı olabilir. Önbelleğe alınan kaynak, sözcükleri dizine eklenen sürümü gösterir, bu nedenle asıl sayfanın kaybolması durumunda yararlı olabilir.

    Üst Düzey Mimari

    Tipik olarak, bir kullanıcı bir arama motoruna birkaç anahtar kelime biçiminde bir sorgu girer. Dizin, verileri içeren sitelerin adlarını zaten içeriyor anahtar kelimeler ve anında görüntülenirler. Gerçek iş yükü, bir arama sonuçları listesi olan web sayfaları oluşturmaktır. Tüm listedeki her sayfa indekslerdeki bilgilere göre sıralanmalıdır.

    Bu durumda, sonucun üst öğesi, eşleşen anahtar sözcüklerden bağlamı gösteren parçaların aranmasını, yeniden oluşturulmasını ve işaretlenmesini gerektirir. Bu, arama sonuçlarındaki her bir web sayfasının işlenmesinin yalnızca bir parçasıdır ve diğer sayfalar (onun yanında) bu son işlemin çoğunu gerektirir.

    Arama motorları, yalnızca anahtar sözcükleri aramanın ötesinde, sonuçları iyileştirmek için kendi GUI'lerini veya komut güdümlü operatörlerini ve arama seçeneklerini sunar.

    Bir geri besleme döngüsü, filtreleme ve ağırlıklandırma yoluyla kullanıcı için gerekli kontrolleri sağlarken, istenen verileri rafine ederek dikkate alır. ana sayfalar ilk arama sonuçları Örneğin, 2007'den beri Google.com, orijinal sonuçlar sayfasında en soldaki sütunda bulunan "Arama Araçlarını Göster" öğesini tıklayıp ardından istenen tarih aralığını seçerek sonuç listesini tarihe göre filtrelemeyi mümkün kıldı.

    isteklerin varyasyonu

    Çoğu arama motoru kullanımı destekler mantıksal operatörler VE, VEYA ve DEĞİL yardımcı olmak için son kullanıcılar talebi netleştirin. Bazı işleçler, kullanıcının arama terimlerini iyileştirmesine ve genişletmesine izin veren hazır değerler içindir. Robot, girilen komutları aradığı gibi kelimeleri veya tümceleri arar. Bazı arama motorları, kullanıcıların anahtar kelimeler arasındaki mesafeyi belirlemesine olanak tanıyan gelişmiş bir arama özelliği sağlar.

    Çalışmanın kullanımını içerdiği kavram tabanlı bir arama da vardır. istatistiksel analiz aradığınız kelimeleri veya kelime öbeklerini içeren sayfalarda. Ek olarak, doğal dil sorguları, kullanıcının soruyu bir kişiye soracağı biçimde girmesine olanak tanır (en tipik örnek ask.com'dur).

    Bir arama motorunun kullanışlılığı, döndürdüğü sonuç kümesinin alaka düzeyine bağlıdır. Belirli bir kelimeyi veya cümleyi içeren milyonlarca web sayfası olabilir, ancak bazıları diğerlerinden daha ilgili, popüler veya yetkili olabilir. Çoğu arama motoru, en iyi sonuçları sağlamak için sıralama yöntemlerini kullanır.

    Arama motorunun bir sorgu için hangi sayfaların en iyi eşleştiğine ve bulunan kaynakların hangi sırayla görüntülenmesi gerektiğine nasıl karar verdiği bir robottan diğerine büyük ölçüde değişir. İnternet kullanımı değiştikçe ve yeni teknolojiler geliştikçe bu uygulamalar da zaman içinde değişir.

    Arama motoru nedir: çeşitleri

    İki ana arama motoru türü vardır. Birincisi, insanların büyük ölçüde programladığı, önceden tanımlanmış ve hiyerarşik olarak sıralanmış bir anahtar kelimeler sistemidir. İkincisi, bulunan metinleri ayrıştırarak "ters çevrilmiş bir dizin" oluşturan bir sistemdir.

    Arama motorlarının çoğu, reklam geliri ile desteklenen ticari hizmetlerdir ve bu nedenle bazıları, reklamverenlerin görüntülenen sonuçlarda bir ücret karşılığında sıralanmasına olanak tanır. Sıralama için para kabul etmeyen hizmetler, görüntülenen sitelerin yanında içeriksel reklamlar yayınlayarak para kazanır. Bugüne kadar, arama motorlarında tanıtım, ağdaki en karlı kazançlardan biridir.

    En yaygın hizmetler hangileridir?

    Google, Mart 2017 itibarıyla %80,52'lik pazar payıyla dünyanın en popüler arama motorudur.

    • Google - %80,52
    • Bing - %6,92
    • Baidu - %5,94
    • yahoo! - %5,35

    Rusya ve Doğu Asya'daki arama motorları

    Rusya'da ve bazı Doğu Asya ülkelerinde Google en popüler hizmet değildir. Rus kullanıcılar arasında Yandex arama motoru, Google'a (%28,3) kıyasla popülerlik açısından lider (%61,9). Çin'de, Baidu en çok popüler hizmet. arama portalı Güney Kore- Naver, ülkedeki çevrimiçi aramaların yüzde 70'i için kullanılıyor. Ayrıca Yahoo! Japonya ve Tayvan'da doğru verileri bulmak için en popüler araçtır.

    Diğer iyi bilinen Rus arama motorları Mail ve Rambler'dır. Runet'in gelişiminin başlamasıyla birlikte çok popüler oldular, ancak şimdi konumlarını kaybettiler.

    Sınırlamalar ve arama kriterleri

    Arama motorları, web sitelerini bir dereceye kadar popülerlik ve alaka düzeyine göre sıralamak üzere programlanmışken, ampirik araştırmalar, sağladıkları bilgileri seçmek için farklı politik, ekonomik ve sosyal kriterlere işaret ediyor. Bu önyargılar ekonomik (örneğin, bir arama motorunun reklamını yapan şirketler aynı zamanda organik arama sonuçlarında daha popüler hale gelebilir) ve politik süreçlerin (örneğin, yerel yasalara uymak için arama sonuçlarının kaldırılması) doğrudan bir sonucu olabilir. Örneğin, Google, Holokost inkarının yasa dışı olduğu Fransa ve Almanya'da bazı neo-Nazi sitelerini göstermeyecektir.

    Hristiyan, İslami ve Yahudi arama motorları

    İnternetin küresel büyümesi ve Elektronik araçlar Son on yılda Müslüman dünyasındaki medya, Orta Doğu ve Asya alt kıtasındaki İslami taraftarları kendi arama motorlarını ve kullanıcıların güvenli arama yapmalarına izin verecek filtrelenmiş portalları oluşturmaya teşvik etti.

    Bu tür hizmetler, "İslam Kanunu"nun modern uzman yorumuna dayalı olarak web sitelerini "helal" veya "haram" olarak daha fazla sınıflandıran filtreler içerir.

    ImHalal portalı Eylül 2011'de ve Halalgoogling Temmuz 2013'te çevrimiçi oldu. Google ve Bing'in algoritmalarına dayalı haram filtreler kullanıyorlar.

    Diğer din odaklı arama motorları Jewgle'dır (Yahudi google versiyonu), yanı sıra Christian SeekFind.org. İnançlarını inkar eden veya aşağılayan web sitelerini filtreliyorlar.

    Arama sistemi- İnternette bilgi arama yeteneği sağlayan bir web arayüzüne sahip bir yazılım ve donanım kompleksi.

    Tüm arama motorları, özel olarak ayrılmış güçlü sunucularda bulunmaları ve etkili iletişim kanallarına bağlı olmaları gerçeğiyle birleşir. Arama motorlarına bilgi alma sistemleri (IPS) de denir. En popüler sistemlerin aynı anda hizmet verilen ziyaretçi sayısı binlerce kişiye ulaşıyor. En ünlüsü günde milyonlarca müşteriye hizmet veriyor. Bir arama motorunun bir dizine dayalı olduğu durumlarda buna dizin adı verilir. Moderatörlerin çalışmalarına dayanmaktadır. Tam metin aramalı IPS'nin kalbinde otomatik bilgi toplama yer alır. Özel programlar tarafından gerçekleştirilir. Bu programlar periyodik olarak tüm İnternet kaynaklarının içeriğini inceler. Bunu yapmak için, farklı kaynaklar arasında hareket ederler veya dedikleri gibi sürünürler. Buna göre, bu tür programlara robot denir. Başka isimler de var: WWW, World Wide Web ifadesinin kısaltması olduğundan, böyle bir programa İngilizce'de örümcek demek doğaldır. - örümcek. Son zamanlarda başka adlar da kullanılmaya başlandı: otomatik dizinler veya dizinler. Bu programların tümü, farklı URL'lerden bilgileri keşfeder ve "indirir". Belirtilen türdeki programlar, belirli bir süre sonra her kaynağı ziyaret eder. Hiçbir arama motoru tüm interneti indeksleyemez. Bu nedenle, indekslenen kaynakların adreslerinin toplandığı veritabanları, farklı arama motorları için farklıdır. Bununla birlikte, birçoğu, mümkünse, çalışmalarında World Wide Web'in tüm alanını kapsamaya çalışıyor.

    Bir arama motorunu kullanarak bilgi aramak için, kullanıcı bir arama sorgusu oluşturur. Arama motoru, kullanıcının sorgusuna bağlı olarak bir arama sonuçları sayfası oluşturur. Bu tür arama sonuçları farklı dosya türlerini birleştirebilir, örneğin: web sayfaları, resimler, video dosyaları. Bazı arama motorları, İnternet'teki veritabanlarından ve kaynak dizinlerinden de veri çeker.

    Arama ve bakım yöntemlerine göre, dört tür arama motoru ayrılır:

    1. arama robotlarını kullanan sistemler.

    2. insan kontrollü sistemler

    3.hibrit sistemler

    4.meta-sistemler.

    Arama motoru mimarisi şunları içerir: İnternet sitelerini tarayan bir arama robotu, hızlı arama sağlayan bir dizin oluşturucu ve bir arama motoru - grafiksel bir kullanıcı arayüzü.

    Bir arama motorunun amacı, anahtar sözcükleri veya anahtar sözcüklerle bir şekilde ilgili sözcükleri içeren belgeleri bulmaktır. Arama motoru daha iyidir, kullanıcının sorgusuyla ilgili daha fazla belge döndürür.

    Arama Motoru Örnekleri

    Google- en eksiksiz ve popüler yabancı IPS'lerden biri. Google IPS'nin ayırt edici bir özelliği, diğer kaynaklardan bu kaynağa olan bağlantıları analiz ederek bir belgenin alaka derecesini belirleme teknolojisidir. Diğer sayfalardaki bir sayfaya ne kadar çok bağlantı verilirse, o sayfanın Google IPS'deki sıralaması o kadar yüksek olur. Google, PageRank yetki hesaplama algoritmasını kullanır. PageRank, siteleri arama sonuçlarında sıralamada yardımcı faktörlerden biridir. PageRank tek değil, aynı zamanda çok önemli yol sitenin Google arama sonuçlarındaki konumunu belirler. Google, belirli bir sorgu için bulunan sayfaların PageRank'ını, bu sayfaların arama sonuçlarında bir ziyaretçiye görünme sırasını belirlemek için kullanır. 2010 yılında şirket, sesli arama Rusya'da. Arama yapmak için, telefonunuzdaki arama çubuğunun yanındaki düğmeye basmanız ve sorgunuzu söylemeniz gerekir, telefon sesinizi sunucuya gönderir ve tarayıcı, sorgunuzun tanındığı ve bunun için arama sonuçlarının bulunduğu bir dize görüntüler.

    Yandexşu anda en popüler yerli arama motorudur. 1997'de başladı. Kendi İnternet kaynakları kataloğunu sürdürüyor. Ayrıca çizimleri tanımlamak için en iyi arama motorudur. İngilizce sürüm, bir İnternet kaynakları dizini ile birlikte sağlanır. Gelişmiş bir istek oluşturma sistemine sahiptir. Özellikle, doğal dilde bir arama reçetesi girilmesine izin verilir - bu durumda, gerekli tüm uzantılar otomatik olarak yapılır.

    Yandex, HTML web sayfalarının yanı sıra PDF (Adobe Acrobat), Zengin Metin Biçimi (RTF), ikili Word (.doc), Excel (.xls), PowerPoint (.ppt), RSS (bloglar ve forumlar) biçimindeki belgeleri de indeksler.

    Mail.ru arama motoru 2007 yılında çalışmaya başladı. 2009 baharında dizin dosyasının hacmi, Rusça sunucularda bulunan 1,5 milyar sayfadan fazlaydı. Metin aramaya ek olarak, sistem "kendi kendine doldurulan" özel Rus sunucularında barındırılan çizimleri ve video klipleri arar: [email protected], Flamber.Ru, 35Photo.ru, PhotoForum.ru, [email protected], RuTube, Loadup, Rambler Vision ve benzerleri. Gogo.ru, arama alanını ticari siteler, bilgi siteleri, forumlar ve bloglarla sınırlamanıza olanak tanır. "Gelişmiş Arama" formu, aramaları belirli dosya türleriyle (PDF, DOC, XLS, PPT), aranan kelimelerin belgedeki konumuyla veya belirli bir alanla sınırlandırmayı da mümkün kılar. Kasım 2013 Google Oyun ana ekrandan herhangi bir sosyal ağa geçmenize izin veren ve şunları içeren Mail.Ru şirketinden arama uygulamasının yeni bir sürümü ortaya çıktı hızlı erişim resimlere, videolara ve haberlere göre arama yapmak için. Android uygulaması, ihtiyacınız olan bilgileri verimli bir şekilde bulmak için tasarlanmış bir mini tarayıcıya dönüştü. Yardımcı program ayrıca metinle değil sesle belirtilen arama sorgularını tanımayı da öğrendi. Geliştiriciler ayrıca, üzerine yerleştirilebilecek özel bir pencere öğesi oluşturduklarını da not eder. ana ekran akıllı telefon veya tablet tabanlı Google sistemleri Android. Bunun aramaya harcanan zamanı daha da azaltacağı anlaşılmaktadır.

    AltaVista- en eski arama motorlarından biri, belge hacmi açısından ilk sıralardan birini işgal ediyor - 350 milyondan fazla. AltaVista, basit ve gelişmiş aramalara izin verir. "Yardım", deneyimsiz kullanıcıların bile basit ve karmaşık sorguları doğru bir şekilde oluşturmasına olanak tanır.

    aylak aylak- 1996'da açılan ilk Rus IRS'lerinden biri. 2002'nin sonunda radikal bir modernizasyon gerçekleştirildi ve ardından Rambler liderler grubuna yeniden girdi. ağ arama. Şu anda, dizinin hacmi yaklaşık 150 milyon belgedir. Karmaşık sorgular oluşturmak için, menü öğelerini kullanarak bir arama reçetesi derlemek için geniş fırsatlar sunan "Ayrıntılı sorgu" modunun kullanılması önerilir.

    APORT. Bugüne kadar, veritabanının hacmi 20 milyondan fazla belgedir. Sistem çok çeşitli arama yeteneklerine sahiptir. APORT yerleşik bir çevirmen işlevine sahiptir, bu, kullanıcıya hem Rusça hem de Rusça olarak istekleri formüle etme fırsatı verir. İngilizce. Ayrıca APORT'un resim ve ses dosyalarını aramak için özel modları vardır.

    En yeni nesil arama motorları, bir web sayfasındaki veya bir konferans makalesindeki tüm kelimeleri indekslerken, daha önce indekslemenin kapsamı genellikle belgenin başlığı, başlıkları, ilk birkaç satırı ve adresi ile sınırlıydı. Bu, arama sonuçları her zaman gerçek verileri yansıtmadığından, dar bir konudaki materyalleri belirleme olasılığını önemli ölçüde sınırladı. Bu eksikliği ortadan kaldırarak, modern arama motorları öncekilerden çok daha güvenilirdir.

    Bir sonraki en önemli özellik, operatör sayısındaki ve diğer sorgulama unsurlarındaki artışla ifade edilen dahili arama mekanizmasının iyileştirilmesidir. Birkaç yıl önce, yalnızca iki, en iyi ihtimalle üç klasik Boole işleci kullanımdaydı: AND (ve), OR (veya) ve NOT (değil). Artık Alta Vista'da NEAR (yakında, yaklaşık) ve OpenText'te FOLLOWED BY (takip eder) var - sorguyu olabildiğince çok belirtmenize izin veren son derece yararlı mesafe işleçleri. Birçok sistem, terim sonlarını kısaltmanıza, aramaları belge oluşturma tarihine göre sınırlandırmanıza, anahtar kelimeleri yalnızca belirlenen web sayfası öğelerinde (başlık, başlıklar, e-posta adresi vb.) ve tam ifadeleri aramanıza izin verir. En son gelişmeler ayrıca belirli bir türdeki (örneğin grafik veya ses) dosyaları algılamanıza olanak tanır ve küçük ve büyük harflere duyarlıdır. Herhangi bir dilde veri aramak yaygınlaşıyor. Tüm bunlar, elde edilen sonuçların alaka düzeyini elbette artıran, yüksek doğruluk derecesine sahip bir arama reçetesi oluşturmayı mümkün kılar.

    Açık şu an en popüler arama motorları Google ve Yandex, onları karşılaştıralım:

      İndekslenen sayfaların sayısı. Google'ın 8 milyarı var ve Yandex'in sadece 2 milyarı var. Yani dört kat daha az. Google'ın zaferi.

      Sayfa indeksleme hızı. Google, yeni sayfaları bir gün içinde dizine eklerken, Yandex'in bunu yapması birkaç gün sürebilir. Google yine kazandı.

      Düzenleme alaka düzeyi. Alaka düzeyi, arama motoru sayfasında görüntülenen sonuçların sorgunuza uygunluğu anlamına gelir. Burada kazananı belirlemenin zor olduğunu hemen söylemeliyim. Google açıkladı iyi sonuçlarİnternetin yabancı segmentinde, ancak Runet'te Yandex her zaman biraz önde olmuştur.

      Ek internet hizmetleri. Burada avantaj açıkça Yandex için. Uygun bir şekilde kategoriler halinde gruplandırılmış düzinelerce farklı hizmete sahipken, Google'da bunlardan daha azı vardır ve ayrıca entegrasyon vardır. sosyal ağ Birçoğunun sevmediği Google+.

    Merhaba sevgili okuyucular! Seninle Ekaterina Kalmykova. Bugünün makalesi, arama motoru, ne olduğu, ne için olduğu gibi bir konsepte ayrılacak. İnternetteki arama motorlarının türlerine de daha yakından bakacağız.

    “Bu arama motorlarını neden bilmeliyim?” diye bir sorunuz varsa, o zaman şöyle cevap vereceğim. Bir restoranda lezzetli bir çorba yediğinizde, evde tekrar yapabilmek için hangi malzemelerden yapıldığını bilmek ister misiniz? Sonuçta, sonuçtan, yani çorbanın tadından memnunsanız, o zaman böyle bir sonuca neyin yol açtığını bilmek ister misiniz?

    Bir arama motoruyla (PS) çalışmaktan da bahsedebilirsiniz. Gelecekte kendi blogunuzu yaratırsanız, PS'nin çalışmasını bilerek uzmanlardan yardım almanıza gerek kalmayacaktır. Projenizi, arama motorunun göreceği ve diğer kullanıcılara gösterebileceği şekilde bağımsız olarak yönetebileceksiniz. Sonuçta, kaynağınızın katılımı ve buna bağlı olarak kazançlar buna bağlı olacaktır.

    Öyleyse başlayalım.

    Arama motoru nedir?

    arama motoru özel kaynak kullanıcıya talebi doğrultusunda bilgi sağlayan internette. Yani, bu kaynak içindeki tüm verileri toplar. küresel ağ, tüm web projeleri ve kullanıcıdan belirli bir istek alındığında, örneğin tematik bir blog veya web sitesine göndererek gerekli bilgileri sağlar.

    Böylece projenizi oluşturduktan sonra göreviniz konuya, yani arama motorunun "listesine" veya veritabanına girmek olacaktır. İnternette web sitesi tanıtımı herhangi bir arama motoru kullanılmadan mümkün olmadığından, kaynağınızın kalitesine, dahili ve harici optimizasyonuna dikkat etmeniz gerekecektir. Bunu nasıl yapacağımızı ileriki yazılarda tartışacağız. Bu yüzden kaçırmayın.

    Bu arada kendi blogunuzu oluşturmaya karar verirseniz şu makaleleri okumanızı tavsiye ederim:

    Hemen hemen her gün yeni web kaynakları ortaya çıktığı için, arama motorlarının veritabanı buna göre sürekli olarak güncellenmelidir. Yeni oluşturulan her sitenin robot tarafından dizine eklenmesi gerekir. Basit bir ifadeyle, PS asistanları - robotlar yeni kaynakla tanışmalı ve bu verileri arama motorunun kendisine aktarmalıdır.

    Pekala, burada muhtemelen bir robotun blogunuzu ziyaret ettiğinde her şeyi beğenmesi gerektiğini tahmin etmişsinizdir. Gelecekteki kaderin bu konuğa bağlı olacak.

    Projenizdeki robotun içeride kalmasını nasıl sağlarsınız? zevk dolu Aşağıdaki makalelerden birinde anlatacağım. Sizlerle paylaşacağım ilginç ve çok merak edilen bilgiler olacak kaçırmayın.

    Arama motorlarının çalışmaları

    PS ile ilgili tüm işler, arama çubuğuna istenen sorgunun girilmesiyle başlar. Kullanıcılar ne arıyor olabilir? Evet, lahanalı turta tarifinden "hiçbir şey yapmadan nasıl daha fazla para kazanılır" sorusuna kadar her şey.

    Kaynağınızın bir soruya cevap olarak çıkması için rakiplerinizden önde olmanız gerekiyor. Bunu yapmak için, yüksek kaliteli optimize edilmiş içerik yazmak, yani makale taleplerine yanıt vermek, iyileştirmek gibi faaliyetleri içeren projenizin tanıtımına özel önem vermeniz gerekir. davranış faktörü, yani okuyucunuzun kaynakta olmasını ilginç kılmak için bu, kullanılabilirlikte, yani ziyaretçinin rahatlığında ve diğer birçok faktörde bir gelişmedir. Hepimizin yapmayı öğreneceği şey bu.

    Arama motoru bileşenleri

    Ve arama motorlarının, örneğin aynı Google'ın kaynağınızı dizine eklemesine ne yardımcı olur?

    1. Aracılar, işin büyük bölümünü yapan işçilerdir - siteleri dizine ekler ve analiz ederler.
    2. Örümcekler (örümcek) - bir web kaynağının sayfalarını indirebilen ve toplayabilen bir program Genel bilgi onun hakkında.
    3. Paletli (paletli) - sayfalardaki tüm bağlantıları bulan ve ardından arama motorlarının aşina olmadığı yeni verileri arayan bir program.
    4. Dizin oluşturucu - metni, başlıkları, stili vb. analiz eder.
    5. Robotlar - içeriğinizin sayfalarını indeksleyin ve ayrıca çeşitli bağlantıları inceleyin.

    İndekslemenin ihtiyacınız olan şekilde gerçekleşmesi için özel bir “robots.txt” belgesi oluşturursunuz. Sistemin yalnızca ihtiyacınız olan sayfaları kontrol etmesine ve görmek istemediğiniz sayfaları kaldırmasına olanak tanır.

    Arama motoru türleri

    Bilgi alma sistemleri için birkaç seçenek vardır:

    • kataloglar. Basit bir arama karşılaştırması, bir kitaplıktaki bir kitaplıktır. Her şey orada belirli bir konunun alt kategorilerinde ve kategorilerinde saklanır. Böyle bir arama motoruna girdiyseniz, inanın orada bulacağınız bilgiler, algınız için fazlasıyla yararlı ve anlaşılır olacaktır. Söz konusu ortak site hakkında tahmin ettiniz mi? Tabii ki, bütün bir rehber toplayan Wikipedia hakkında kullanışlı bilgi.
    • Arama işaretçileri. Verilerde arama pahasına gerçekleştirilir anahtar ifadeler. Aynı anda hem uygun hem de sakıncalıdır. Bence, örneğin, "Kız sınıfını gösterir" arayan insanlar, bir kızın başparmağını nasıl gösterdiğini ve aramada pek düzgün olmayan bir şeyin ortaya çıktığını bulmak için beni anlayacaklardır. 🙂 Bu arama türü, arama motorlarının çoğunu karakterize eder.
    • derecelendirme sistemleri. Ziyaret sayısına bağlı olarak popülerliğinizi belirleyin. Tabii ki, kaynağın kendisinin kullanışlılığı ve kalitesi her zaman dikkate alınmadığı için en iyi kriter değildir. Böyle bir sistemin bir örneği İnternet kaynağı alexa.com'dur.

    Arama motorları da ikiye ayrılır genel ve özel. Genel arama motorları, bildikleri tüm web kaynakları için herhangi bir seçim yapmadan bilgi verilerini sıralar. Bunlar Yandex, Rambler, Google'ı içerir. Uzman - kullanılan dile göre sıralayın.

    Ayrıca, arama motorları ayrılabilir bölgesel ve dünya çapında dağıtım.

    Bugüne kadar, tüm arama motorları, yüksek kaliteli, ilgili kaynakları seçmek için algoritmalarını sürekli olarak geliştirmektedir.

    biraz tarih

    PS, 1996'da Runet'te göründü - bunlar Aport ve Rambler. Bir yıl sonra, 1997'de Yandex kuruldu ve bir yıl sonra, 1998'de başka bir rakip ortaya çıktı - Google. İÇİNDE şu anda en popülerleri Yandex ve Google'dır.

    Şu anda en popüler arama motorları hangileri?

    İşte istatistikler:

    Gördüğünüz gibi, Yandex artık Google ve Mail ile birlikte Rusya'da en popüler olanıdır.

    Böylece, projenizi oluştururken ve tanıtırken odaklanmanız gereken en iyi aramaları görebilirsiniz.

    Arama motoru Yandex (Yandex)

    Çalışma prensibi aşağıdaki gibidir: Arama dizisi aradığınız sorguyu girin, "Bul"a tıklayın ve çıktıyı görün. Yandex, isteğinize 13 milyon yanıt aldı. Ayrıca resimlerde, videolarda, pazarda da arama yapabilirsiniz (soldaki sütuna bakın).

    Ek olarak, arama bölgesini ayarlayabilirsiniz. Bunu yapmak için, arama çubuğundaki çarpı işaretinin yanındaki simgeye tıklayın ve filtre penceresinde istediğiniz bölgeyi seçin.

    Arama motoru Google (Google)

    Google, Yandex'e benzer şekilde çalışır. Farklı bölümlerde bilgi arayabilirsiniz: resimler, videolar, haberler, haritalar vb.

    "Arama Araçları"na tıklarsanız, bölgeyi, dili ve ne kadar süre bilgi arayacağınızı seçebileceğiniz bir ayarlar paneli açılır.

    Artık İnternette hangi arama motorlarının bulunduğunu biliyorsunuz, bunların en popülerlerini de gördünüz ve artık bilgiyle donanmış olarak, arama motorlarıyla bağlantılarınızı ve etkileşiminizi oluşturabilirsiniz.

    Hepsi bugün için. Makaleyi nasıl buldun?

    Şimdilik hepsi.

    En son haberleri kaçırmamak için blogu güncellemenizi tavsiye ederim.

    Ekaterina Kalmıkova

    Arama motorları (PS) uzun süredir internetin vazgeçilmez bir parçası olmuştur. Bugün bunlar, herhangi bir şeyi bulmak için yalnızca bir araç olmayan devasa ve karmaşık mekanizmalardır. gerekli bilgi, aynı zamanda iş için oldukça heyecan verici alanlar.


    Birçok arama kullanıcısı, çalışmalarının ilkelerini, kullanıcı isteklerinin nasıl işlendiğini, bu sistemlerin nasıl kurulduğunu ve çalıştığını hiç düşünmemiştir. Bu materyal, optimizasyonla uğraşan ve cihazı ve arama motorlarının ana işlevlerini anlayan kişilere yardımcı olacaktır.

    PS'nin işlevleri ve konsepti

    Arama sistemiİnternette arama işlevini gerçekleştirmek için tasarlanmış ve genellikle bir metin cümlesi (veya daha doğrusu) biçiminde ayarlanan bir kullanıcı isteğine yanıt vermek için tasarlanmış bir donanım-yazılım kompleksidir. arama sorgusu), alaka düzeyine göre yürütülen bilgi kaynaklarına bir referans listesi yayınlamak. En yaygın ve büyük sistemler Arama: Google, Bing, Yahoo, Baidu. Runet'te - Yandex, Mail.Ru, Rambler.

    Yandex sistemini örnek alarak arama sorgusunun anlamına daha yakından bakalım.

    Talep, kullanıcı tarafından aramasının konusuna tam olarak uygun olarak, mümkün olduğunca basit ve öz bir şekilde formüle edilmelidir. Örneğin, şu arama motorunda bilgi bulmak istiyoruz: "Kendiniz için bir araba nasıl seçilir." Bunu yapmak için açın ana sayfa ve "nasıl araba seçilir" aramak için bir sorgu girin. Ardından işlevlerimiz, ağdaki bilgi kaynaklarına sağlanan bağlantıları izlemeye indirgenir.




    Ancak bu şekilde davransak bile ihtiyacımız olan bilgiyi alamayabiliriz. Böyle olumsuz bir sonuç alırsak, sorgumuzu yeniden formüle etmemiz yeterlidir veya arama veritabanında bu tür sorgu hakkında gerçekten yararlı bir bilgi yoktur (bu, verilen "dar" sorgu parametreleriyle oldukça mümkündür, örneğin, için örneğin, "Anadyr'de araba nasıl seçilir ").

    Her arama motorunun en temel görevi, tam olarak insanların ihtiyaç duyduğu türden bilgileri sunmaktır. Ve kullanıcıları arama motorlarına "doğru" türde sorgular, yani çalışma ilkelerine karşılık gelecek ifadeler oluşturmaya alıştırmak neredeyse imkansızdır.

    Bu nedenle, arama motoru geliştiricileri, çalışmalarının, kullanıcıların ilgilendikleri bilgileri bulmalarını sağlayacak bu tür ilkeleri ve algoritmaları oluşturur. Bu, sistemin bir kişinin İnternette gerekli bilgileri ararken düşündüğü gibi "düşünmesi" gerektiği anlamına gelir.

    Sorgusunu bir arama motoruna girdiğinde, istediğini olabildiğince kolay ve hızlı bir şekilde bulmak ister. Sonucu aldıktan sonra, kullanıcı birkaç kritere göre sistem değerlendirmesini yapar. bulmayı başardı mı gerekli bilgi? Değilse, onu bulmak için sorgu metnini kaç kez yeniden biçimlendirmesi gerekti? Alınan bilgiler ne kadar günceldi? Arama motoru talebini ne kadar hızlı işleme aldı? Sağlanan arama sonuçları ne kadar kullanışlıydı? Buradaydı İstenen sonuç birinci mi yoksa 30. sırada mıydı? Yararlı bilgilerle birlikte ne kadar "çöp" (gereksiz bilgi) bulundu? PS'yi kullanırken, bir hafta içinde veya bir ay içinde onun için ilgili bilgiler olacak mı?




    Bu tür sorulara doğru cevapları alabilmek için arama geliştiricileri, sıralama ilkelerini ve algoritmalarını sürekli olarak geliştirmekte, bunlara yeni özellikler ve işlevler eklemekte ve her ne pahasına olursa olsun sistemin daha hızlı çalışmasını sağlamaya çalışmaktadır.

    Arama motorlarının temel özellikleri

    Aramanın ana özelliklerini belirleyelim:

    bütünlük

    Tamlık, aramanın en önemli özelliklerinden biridir, sorgu tarafından bulunan sayıların oranıdır. bilgi belgeleri ile ilgili internetteki toplam sayılarına bu istek. Örneğin, ağda "bir araba nasıl seçilir" ifadesini içeren 100 sayfa var ve aynı talep için toplamın yalnızca 60'ı seçildi, ardından bu durum aramanın eksiksizliği 0,6 olacaktır. Aramanın kendisi ne kadar eksiksiz olursa, kullanıcının tam olarak ihtiyaç duyduğu belgeyi, elbette varsa, bulma olasılığının o kadar yüksek olduğu açıktır.

    Kesinlik.

    Bir arama motorunun bir diğer önemli özelliği de doğruluktur. Web üzerinde bulunan sayfaların kullanıcının isteğine uygunluk derecesini belirler. Örneğin, "bir araba nasıl seçilir" anahtar ifadesi için yüzlerce belge varsa, bunların yarısı bu ifadeyi içerir ve geri kalanında bu tür kelimeler bulunur (bir araba radyosu nasıl doğru seçilir ve bir arabaya nasıl kurulur) ), o zaman arama doğruluğu 50/100 = 0,5'e eşittir.

    Arama ne kadar doğru olursa, kullanıcı ihtiyaç duyduğu bilgileri o kadar çabuk bulur, sonuçlar arasında o kadar az çeşitli "çöp" bulunur, bulunan belgeler talebin anlamına karşılık gelmez.

    alaka.

    Bu, bilginin internette yayınlandığı andan arama motorunun dizin veri tabanına girilmesine kadar geçen süre ile karakterize edilen aramanın önemli bir bileşenidir.

    Örneğin, çıkışla ilgili bilgilerin ertesi günü yeni iPad, birçok kullanıcı ilgili sorgu türleriyle aramaya yöneldi. Çoğu durumda, bu haberle ilgili bilgiler, ortaya çıkışından bu yana çok az zaman geçmesine rağmen, aramada zaten mevcuttur. Bunun nedeni, günde birkaç kez güncellenen "hızlı bir veritabanına" sahip olan büyük arama motorlarıdır.

    Arama hızı.

    Arama hızı gibi bir işlev, sözde "yük toleransı" ile yakından ilgilidir. Her saniye, çok sayıda insan aramaya yöneliyor, bu tür bir iş yükü, bir talebi işleme koyma süresinde önemli bir azalma gerektiriyor. Burada, hem arama motorunun hem de kullanıcının çıkarları tamamen örtüşür: ziyaretçi, sonuçları olabildiğince çabuk almak ister ve arama motoru, sonraki isteklerin işlenmesini yavaşlatmamak için isteğini olabildiğince çabuk işlemelidir.

    görünürlük

    Sonuçların görsel sunumu, arama kolaylığının temel bir unsurudur. Birçok sorgu için, arama motoru binlerce ve bazı durumlarda milyonlarca bulur. çeşitli belgeler. Arama için anahtar ifadelerin derlenmesinin belirsizliği veya yanlışlığı nedeniyle, ilk sorgu sonuçları bile her zaman yalnızca gerekli bilgileri içermez.

    Bu, bir kişinin genellikle sağlanan sonuçlar arasında kendi aramasını yapması gerektiği anlamına gelir. PS düzenleme sayfalarının çeşitli bileşenleri, arama sonuçlarında gezinmenize yardımcı olur.

    Arama motorlarının geçmişi

    İnternet ilk gelişmeye başladığında, düzenli kullanıcılarının sayısı azdı ve erişilecek bilgi miktarı nispeten azdı. Temel olarak, yalnızca araştırma alanlarındaki uzmanların bu ağa erişimi vardı. O zamanlar bilgi bulma görevi şimdi olduğu kadar alakalı değildi.

    Bilgi kaynaklarına geniş erişimi organize etmenin ilk yöntemlerinden biri, site kataloglarının oluşturulmasıydı ve bunlara bağlantılar konuya göre gruplandırılmaya başlandı. 1994 baharında açılan Yahoo.com kaynağı böyle bir ilk proje oldu. Daha sonra Yahoo dizinindeki sitelerin sayısı önemli ölçüde artınca dizinde gerekli bilgileri arama seçeneği eklendi. Henüz tam teşekküllü bir arama motoru değildi, çünkü böyle bir aramanın kapsamı yalnızca bu dizinde yer alan sitelerle sınırlıydı ve kesinlikle İnternet'teki tüm kaynaklarla sınırlı değildi. Bağlantı dizinleri geçmişte çok yaygın olarak kullanılıyordu, ancak günümüzde popülerliklerini neredeyse tamamen kaybettiler.

    Ne de olsa günümüzün devasa kataloglarında bile internetteki sitelerin küçük bir kısmı hakkında bilgi var. Dünyanın en ünlü ve en büyük dizini beş milyon site hakkında bilgi içerirken, Google veritabanı 25 milyardan fazla sayfa hakkında bilgi içerir.




    İlk gerçek arama motoru, 1994 yılında ortaya çıkan WebCrawler'dı.

    AltaVista ve Lycos ertesi yıl ortaya çıktı. Üstelik birincisi, çok uzun süre bilgi aramada liderdi.




    1997'de Sergey Brin, Larry Page ile birlikte bir araba yarattı. arama motoru google Stanford Üniversitesi'nde bir araştırma projesi olarak. Bugün Google, dünyanın en popüler ve popüler arama motorudur.




    Eylül 1997'de, şu anda en çok kullanılan Yandex PS (resmi olarak) duyuruldu. popüler sistem RuNet'te arama yapın.




    Buna göre Eylül 2015, arama motorlarının dünyadaki payları şu şekilde dağılıyor:
    • Google - %69,24;
    • Bing - %12,26;
    • yahoo! - %9.19;
    • Baidu - %6,48;
    • AOL - %1,11;
    • Sor - %0,23;
    • Heyecan - %0.00


    Buna göre Aralık 2016, Runet'teki arama motorlarının paylaşımları:

    • Yandex - %48,40
    • Google - %45,10
    • Search.Mail.ru - %5,70
    • Gezici - %0,40
    • Bing - %0,30
    • Yahoo - %0,10

    Arama motoru ilkeleri

    Rusya'da ana sistem arama Yandex, ardından Google ve ardından [email protected]'dur. Tüm büyük arama motorlarının diğerlerinden oldukça farklı olan kendi yapıları vardır. Ancak yine de, tüm arama motorlarında ortak olan ana unsurları ayırmak mümkündür.

    İndeksleme modülü.

    Bu bileşen üç robottan oluşur:

    Örümcek(İngilizcede örümcek) - web sayfalarını indirmek için tasarlanmış bir program. Örümcek, aynı anda tüm bağlantıları çıkarırken belirli bir sayfayı indirir. indiriliyor HTML Kodu hemen hemen her sayfadan Bunu yapmak için robotlar HTTP protokollerini kullanır.




    "Örümcek" aşağıdaki gibi çalışır. Robot, sunucuya "get/path/document" ve diğer komutlara bir istek gönderir. HTTP isteği. Yanıt olarak robot programı, bir hizmet türü ve tabii ki belgenin kendisini içeren bilgileri içeren bir metin akışı alır.
    • İndirilen sayfanın URL'si;
    • sayfanın indirildiği tarih;
    • sunucu http yanıt başlığı;
    • html kodu, sayfanın "gövdesi".
    Paletli("seyahat eden" örümcek). Bu program sayfada bulunan tüm bağlantıları otomatik olarak ziyaret eder ve ayrıca bunları vurgular. Görevi, bu bağlantılara veya belirli bir adres listesine dayanarak örümceğin gelecekte nereye gitmesi gerektiğini belirlemektir.

    indeksleyici(İndeksleme botu), örümcekler tarafından indirilen sayfaları analiz eden bir programdır.



    Dizin oluşturucu, sayfayı bileşen öğelerine tamamen ayrıştırır ve bunları kendi morfolojik ve sözcüksel algoritma türlerini kullanarak analiz eder.

    Analiz, sayfanın başlıklar, metin, bağlantılar, stil ve yapısal özellikler, html etiketleri vb. gibi çeşitli bölümleri üzerinden gerçekleştirilir.

    Böylece indeksleme modülü, belirli sayıda kaynağın bağlantılarını takip etmeyi, sayfaları indirmeyi, alınan belgelerden yeni sayfalara bağlantı kütlesini çıkarmayı ve bunların ayrıntılı bir analizini yapmayı mümkün kılar.

    Veri tabanı

    Veri tabanı(veya arama motoru dizini) - bir veri depolama kompleksi, dizin oluşturma modülü tarafından işlenen her birinin parametrelerinin ve indirilen belgenin belirli bir şekilde saklandığı bir bilgi dizisi.

    arama sunucusu

    Bu, tüm sistemin en önemli unsurudur, çünkü aramanın hızı ve tabii ki kalitesi doğrudan işlevselliğinin altında yatan algoritmalara bağlıdır.

    arama sunucusuşöyle çalışır:

    • Kullanıcıdan gelen istek morfolojik analize tabi tutulur. Veritabanında bulunan herhangi bir belgenin bilgi ortamı oluşturulur (ayrıca bir snippet olarak, yani bu talebe karşılık gelen metnin bir bilgi alanı olarak görüntülenecektir).
    • Alınan veriler, özel bir sıralama modülüne giriş parametreleri olarak iletilir. Tüm belgeler için işlenirler ve sonuç olarak, bu tür her belge için, böyle bir belgenin kullanıcının isteği ve diğer bileşenlerle alaka düzeyini karakterize eden kendi derecelendirmesi hesaplanır.
    • Kullanıcı tarafından ayarlanan koşullara bağlı olarak, bu derecelendirme başkaları tarafından iyi bir şekilde ayarlanabilir.
    • Ardından snippet'in kendisi oluşturulur, yani. Bulunan herhangi bir belge için, sorguya en çok uyan başlık, ek açıklama ve bu belgeye bir bağlantı ilgili tablodan çıkarılırken bulunan sözcük biçimleri ve sözcükler vurgulanır.
    • Alınan aramanın sonuçları, arama sonuçlarının (SERP) yayınlandığı bir sayfa biçiminde bunu yapan kişiye iletilir.
    Tüm bu unsurlar birbiriyle yakından bağlantılıdır ve işlev görür, etkileşime girer, PS'nin işleyişi için büyük kaynak harcamaları gerektiren ayrı ama oldukça karmaşık bir mekanizma oluşturur.

    Bir arama motoru, İnternet'te arama yapmak ve bir metin cümlesi (arama sorgusu) şeklinde belirtilen bir kullanıcının isteğine alaka sırasına göre bilgi kaynaklarına bağlantıların bir listesini yayınlayarak yanıt vermek için tasarlanmış bir yazılım ve donanım sistemidir. talep doğrultusunda). En büyük uluslararası arama motorları: Google, "Yahoo", "MSN". Rus İnternetinde bu "Yandex", aylak aylak, "Aport".

    Arama motorlarının temel özelliklerini açıklayalım:

      bütünlük

    Tamlık, bir arama motorunun temel özelliklerinden biridir ve istek üzerine bulunan belge sayısının, bu isteği karşılayan İnternet'teki toplam belge sayısına oranıdır. Örneğin, İnternette "nasıl araba seçilir" ifadesini içeren 100 sayfa varsa ve bunlardan yalnızca 60 tanesi ilgili sorgu için bulunduysa, arama hatırlaması 0,6 olacaktır. Açıkçası, arama ne kadar eksiksiz olursa, kullanıcının ihtiyaç duyduğu belgeyi, internette mevcut olması koşuluyla bulamama olasılığı o kadar az olur.

      Kesinlik

    Doğruluk, bir arama motorunun başka bir temel özelliğidir ve bulunan belgelerin kullanıcının sorgusuyla eşleşme derecesine göre belirlenir. Örneğin, "bir araba nasıl seçilir" sorgusu 100 belge içeriyorsa, bunların 50'si "nasıl bir araba seçilir" ifadesini içeriyorsa ve geri kalanı sadece bu kelimeleri içeriyorsa ("doğru radyo nasıl seçilir ve nasıl kurulur? bir araba”), arama doğruluğu 50/100 (=0,5) olarak kabul edilir. Arama ne kadar doğru olursa, kullanıcı ihtiyaç duyduğu belgeleri o kadar hızlı bulur, aralarında o kadar az çeşitli "çöp" bulunur, bulunan belgeler taleple o kadar az eşleşmez.

      alaka

    Alaka düzeyi, belgelerin internette yayınlandığı andan arama motorunun dizin veri tabanına girilinceye kadar geçen süre ile karakterize edilen, aramanın eşit derecede önemli bir bileşenidir. Örneğin, ilginç haberlerin ortaya çıkmasından sonraki gün, çok sayıda kullanıcı ilgili sorgularla arama motorlarına yöneldi. Nesnel olarak, bu konuyla ilgili haber bilgilerinin yayınlanmasından bu yana bir günden az bir süre geçti, ancak, büyük arama motorlarının sözde "hızlı tabanı" sayesinde ana belgeler zaten dizine eklenmiş ve aranabilir durumda. günde birkaç kez güncellenir.

      arama hızı

    Arama hızı, yük toleransı ile yakından ilgilidir. Örneğin, OOO Rambler İnternet Holding'e göre bugün çalışma saatleri içinde Rambler arama motoruna saniyede yaklaşık 60 istek geliyor. Bu tür bir iş yükü, tek bir talebin işlem süresinin kısaltılmasını gerektirir. Burada, kullanıcının ve arama motorunun çıkarları örtüşür: ziyaretçi, sonuçları olabildiğince çabuk almak ister ve sonraki isteklerin hesaplanmasını yavaşlatmamak için arama motorunun isteği olabildiğince çabuk işlemesi gerekir.

      görünürlük

    Sonuçların sunumunun görünürlüğü önemli bir bileşendir uygun arama. Çoğu sorgu için, arama motoru yüzlerce hatta binlerce belge bulur. Sorguların formülasyonundaki netlik eksikliği veya aramanın yanlışlığı nedeniyle, düzenlemenin ilk sayfaları bile her zaman yalnızca gerekli bilgileri içermez. Bu, kullanıcının genellikle bulunan listede kendi aramasını yapması gerektiği anlamına gelir. Arama motoru sonuç sayfasının çeşitli öğeleri, arama sonuçlarında gezinmenize yardımcı olur.Arama sonuçları sayfasındaki ayrıntılı açıklamalar, örneğin Yandex için, bağlantıda görüntülenebilir. http://help.yandex.ru/search/?id=481937.

    4. Arama Motorlarının Gelişiminin Kısa Tarihi

    İnternetin gelişiminin ilk döneminde, kullanıcı sayısı azdı ve mevcut bilgi miktarı nispeten azdı. Çoğunlukla, yalnızca araştırma görevlilerinin internete erişimi vardı. O zamanlar internette bilgi arama görevi şimdi olduğu kadar alakalı değildi.

    Ağın bilgi kaynaklarına erişimi düzenlemenin ilk yollarından biri, konuya göre gruplandırılmış kaynaklara bağlantılar olan açık site kataloglarının oluşturulmasıydı. Bu tür ilk proje, 1994 baharında açılan Yahoo.com'du. Yahoo dizinindeki sitelerin sayısı önemli ölçüde arttıktan sonra dizinde gerekli bilgileri arayabilme özelliği eklendi. Tam anlamıyla, henüz bir arama motoru değildi, çünkü arama kapsamı tüm İnternet kaynaklarıyla değil, yalnızca dizinde bulunan kaynaklarla sınırlıydı.

    Bağlantı dizinleri geçmişte yaygın olarak kullanılıyordu, ancak günümüzde popülaritesini neredeyse tamamen kaybetti. Modern, devasa kataloglar bile İnternet'in yalnızca önemsiz bir kısmı hakkında bilgi içerdiğinden. En büyük ağ dizini DMOZ (Açık Dizin Projesi olarak da adlandırılır) 5 milyon kaynak hakkında bilgi içerirken, Google arama motoru veritabanı 8 milyardan fazla belgeden oluşur.

    İlk tam teşekküllü arama motoru, 1994 yılında piyasaya sürülen WebCrawler projesiydi.

    1995 yılında Lycos ve AltaVista arama motorları ortaya çıktı. İkincisi, uzun yıllardır internette bilgi arama alanında lider olmuştur.

    1997'de Sergey Brin ve Larry Page, Stanford Üniversitesi'ndeki bir araştırma projesinin parçası olarak Google arama motorunu yarattı. Google şu anda dünyanın en popüler arama motoru!

    Eylül 1997'de Rusça konuşulan internette en popüler olan Yandex arama motoru resmi olarak duyuruldu.

    Şu anda, kendi veritabanlarına ve arama algoritmalarına sahip üç ana uluslararası arama motoru vardır - Google, Yahoo ve MSN. Diğer arama motorlarının çoğu (çok sayıda vardır), şu veya bu şekilde listelenen üçünün sonuçlarını kullanır. Örneğin, AOL araması (search.aol.com) Google'ı kullanırken AltaVista, Lycos ve AllTheWeb Yahoo'yu kullanır.

    5. Arama motorunun bileşimi ve ilkeleri

    Rusya'da ana arama motoru Yandex'dir, ayrıca - Rambler.ru, Google.ru, Aport.ru, Mail.ru. Üstelik şu anda Mail.ru, Yandex arama motorunu ve veritabanını kullanıyor.

    Hemen hemen tüm büyük arama motorlarının diğerlerinden farklı olarak kendi yapıları vardır. Ancak, tüm arama motorlarında ortak olan ana bileşenleri ayırmak mümkündür. Yapıdaki farklılıklar ancak bu bileşenlerin etkileşim mekanizmalarının uygulanması şeklinde olabilir.

    indeksleme modülü

    İndeksleme modülü üç yardımcı programdan (robotlar) oluşur:

    Örümcek (örümcek) - web sayfalarını indirmek için tasarlanmış bir program. "Örümcek" sayfayı indirir ve bu sayfadaki tüm dahili bağlantıları çıkarır. Her sayfanın html kodu indirilir. Robotlar, sayfaları indirmek için HTTP protokollerini kullanır. "Örümcek" şu şekilde çalışır. Robot, sunucuya "get/path/document" isteğini ve diğer bazı HTTP istek komutlarını gönderir. Yanıt olarak robot, hizmet bilgilerini ve belgenin kendisini içeren bir metin akışı alır.

      Sayfa URL'si

      sayfanın indirildiği tarih

      sunucu yanıtı http başlığı

      sayfa gövdesi (html kodu)

    Paletli ("gezgin" örümcek) - sayfada bulunan tüm bağlantıları otomatik olarak takip eden bir program. Sayfada bulunan tüm bağlantıları seçer. Görevi, bağlantılara veya önceden tanımlanmış bir adres listesine dayanarak örümceğin bundan sonra nereye gitmesi gerektiğini belirlemektir. Tarayıcı, bulunan bağlantıları izleyerek, arama motorunun henüz bilmediği yeni belgeleri arar.

    Indexer (robot-indexer) - örümcekler tarafından indirilen web sayfalarını analiz eden bir program. Dizin oluşturucu, sayfayı bileşen parçalarına ayırır ve bunları kendi sözcüksel ve morfolojik algoritmalarını kullanarak analiz eder. Metin, başlıklar, bağlantılar, yapısal ve stil özellikleri, özel hizmet html etiketleri vb. sayfanın çeşitli öğeleri analiz edilir.

    Böylece indeksleme modülü, belirli bir kaynak kümesini referans olarak taramayı, karşılaşılan sayfaları indirmeyi, alınan belgelerden yeni sayfalara bağlantılar çıkarmayı ve bu belgelerin eksiksiz bir analizini gerçekleştirmeyi mümkün kılar.

    Veri tabanı

    Veritabanı veya arama motoru dizini, dizin oluşturma modülü tarafından indirilen ve işlenen tüm belgelerin özel olarak dönüştürülmüş parametrelerini depolayan bir bilgi dizisi olan bir veri depolama sistemidir.

    arama sunucusu

    Arama sunucusu, tüm sistemin en önemli unsurudur, çünkü aramanın kalitesi ve hızı doğrudan işleyişinin altında yatan algoritmalara bağlıdır.

    Arama sunucusu şu şekilde çalışır:

      Kullanıcıdan alınan istek morfolojik analize tabi tutulur. Veritabanında yer alan her belgenin bilgi ortamı oluşturulur (bu daha sonra bir snippet olarak, yani isteğe karşılık gelen olarak görüntülenecektir) metin bilgisi arama sonuçları sayfasında).

      Alınan veriler, giriş parametreleri olarak özel bir sıralama modülüne iletilir. Veriler tüm belgeler için işlenir, sonuç olarak, her belge için, kullanıcı tarafından girilen sorgunun alaka düzeyini ve bu belgenin arama motoru dizininde saklanan çeşitli bileşenlerini karakterize eden kendi derecelendirmesi hesaplanır.

      Kullanıcının seçimine bağlı olarak, bu derecelendirme ek koşullarla ayarlanabilir (örneğin, "gelişmiş arama").

      Ardından, bir pasaj oluşturulur, yani bulunan her belge için bir başlık, sorguya en iyi uyan kısa bir açıklama ve belge tablosundan belgenin kendisine bir bağlantı çıkarılır ve bulunan kelimeler vurgulanır.

      Alınan arama sonuçları, kullanıcıya arama sonuçlarını yayınlama sayfası olan SERP (Arama Motoru Sonuç Sayfası) biçiminde iletilir.

    Gördüğünüz gibi, tüm bu bileşenler birbiriyle yakından ilişkilidir ve etkileşim içinde çalışarak arama motoru için büyük miktarda kaynak gerektiren net, oldukça karmaşık bir mekanizma oluşturur.

    Hiçbir arama motoru tüm İnternet kaynaklarını kapsamaz.

    Her arama motoru, kendine özgü yöntemleri kullanarak İnternet kaynakları hakkında bilgi toplar ve periyodik olarak güncellenen kendi veritabanını oluşturur. Bu veritabanına erişim kullanıcıya verilir.

    Arama motorları, bir kaynak aramak için iki yol uygular:

      konuya göre ara kataloglar - bilgişeklinde sunulur hiyerarşik yapı. Açık Üst düzey- genel kategoriler (“İnternet”, “İş”, “Sanat”, “Eğitim” vb.), bir sonraki seviyede kategoriler bölümlere vb. ayrılır. En düşük seviye - belirli web sayfalarına veya diğer bilgi kaynaklarına bağlantılar.

      Anahtar kelime arama (dizin arama veya ayrıntılı arama) - kullanıcı arama motoruna gönderir rica etmek, anahtar kelimelerden oluşur. sistem İadeler kullanıcıya istek üzerine bulunan kaynakların bir listesi.

    Çoğu arama motoru, her iki arama yöntemini birleştirir.

    Arama motorları yerel, küresel, bölgesel ve özel olabilir.

    İnternetin Rusya kısmında (Runet), en popüler genel amaçlı arama motorları Rambler (www.rambler.ru), Yandex (www.yandex.ru), Aport (www.aport.ru), Google (www. .google.ru).

    Çoğu arama motoruportallar şeklinde uygulanmaktadır.

    Portal (İngilizce'den.portal - ana giriş, gate), çeşitli İnternet hizmetlerini birleştiren bir web sitesidir: arama araçları, posta, haberler, sözlükler vb.

    Portallar özelleştirilebilir (örneğin,www. Müze. tr) ve genel (örneğin,www. km. tr).

    Anahtar kelime araması

    Aranan anahtar kelimeler kümesine arama terimi veya arama konusu da denir.

    Bir istek, tek bir kelimeden veya operatörlerle birleştirilmiş kelimelerin bir kombinasyonundan oluşabilir - sistemin hangi eylemi gerçekleştirmesi gerektiğini belirlediği semboller. Örneğin: "Moskova Peter" sorgusu, hem Moskova hem de Peter olmak üzere her iki kelimeyi de içeren belgeleri aramanız gerektiğini belirten bir AND işleci içerir (boşluk bu şekilde algılanır).

    Aramanın alakalı olması için (İngilizce'den ilgili - alakalı, alakalı), birkaç genel kural dikkate alınmalıdır:

      Sorguda kelimenin hangi biçimde kullanıldığına bakılmaksızın, arama Rus dilinin kurallarına göre tüm kelime biçimlerini dikkate alır. Örneğin, "bilet" sorgusu aynı zamanda "bilet", "bilet" vb. kelimeleri de bulacaktır.

      Gereksiz linkleri görmemek için sadece özel isimlerde büyük harfler kullanılmalıdır. Örneğin "demirciler" in talebi üzerine, demirciler ve Kuznetsov'lardan bahseden belgeler bulunacak.

      Birkaç anahtar kelime kullanarak aramanızı daraltmanız önerilir.

      İstenilen adres bulunan ilk yirmi adres arasında yer almıyorsa talebi değiştirmelisiniz.

    Her arama motoru kendi sorgulama dilini kullanır. Onunla tanışmak için, arama motorunun yerleşik yardımını kullanın.

    Büyük sitelerin web sayfalarında yerleşik arama motorları olabilir.

    Bu tür arama motorlarındaki sorgular, kural olarak, küresel arama motorlarındakilerle aynı kurallara göre oluşturulur, ancak yardıma aşina olmak burada da gereksiz olmayacaktır.

    gelişmiş Arama

    Arama motorları, kullanıcının karmaşık bir sorgu oluşturması için bir mekanizma sağlayabilir. Bir bağlantıyı takip etmek gelişmiş Arama arama parametrelerini düzenlemenize, ek parametreler belirlemenize ve arama sonuçlarını görüntülemenin en uygun biçimini seçmenize olanak tanır. Aşağıda, HindEx ve Rambler sistemlerinde gelişmiş bir aramada belirtilebilecek parametreler açıklanmaktadır.

    Parametre açıklaması

    Yandex'de isim

    Başlıkaylak aylak

    Anahtar kelimeler nerede aranmalı ( belge başlığı, gövde metni vb.)

    sözlük filtresi

    Metne göre ara...

    Belgede hangi kelimeler bulunmalı veya bulunmamalı ve eşleşme ne kadar doğru olmalı?

    sözlük filtresi

    Sorgu sözcüklerini ara... Aşağıdaki sözcükleri içeren belgeleri hariç tut...

    Anahtar kelimeler birbirinden ne kadar uzakta olmalıdır?

    sözlük filtresi

    Sorgu kelimeleri arasındaki mesafe...

    Belge tarih sınırı

    belge tarihi...

    Aramanızı bir veya daha fazla siteyle sınırlayın

    Site/Üst

    Belgeleri yalnızca aşağıdaki sitelerde arayın...

    Aramayı belge diline göre sınırlayın

    Belge dili...

    Belirli bir ada veya başlığa sahip bir resim içeren belgeleri arayın

    resim

    sayfa arama nesneleri içeren

    özel nesneler

    Arama sonuçları sunum formu

    Sayı biçimi

    Arama sonuçları gösteriliyor

    Bazı arama motorları (örneğin, Yandex), sorguları doğal dilde girmenize izin verir. Bulması gereken şeyi yazarsınız (örneğin: Moskova'dan St. Petersburg'a tren bileti siparişi vermek). Sistem talebi analiz eder ve sonucu döndürür. Size uymuyorsa, sorgulama diline geçin.