• Arama motorları. İnternet arama motorları: mevcut çözümlere genel bakış

    Her an, bir kişi kararlar verir. Sonuç: ilerlemek, yerinde yaygara yapmak veya bilgi alanında hareket etmek, ama nerede? Arama motoru ne demek?

    İyi görme, işitme, tüm duyu organlarının güvenilir çalışması ve nesnel bir gerçeklik algısı büyük ölçüde belirleyicidir. doğru uygulama birikmiş deneyim ve bilgi, sezgiye kendini ifade etme şansı verir. Ancak doğru cevap, yalnızca doğru sorunun değil, aynı zamanda çözümü için doğru toplanmış bilgilerin sonucudur (bu, kriterin alanıdır).

    Kısaca arama motoru ne demek? İnternet arama geçmişi

    Bilgisayarların ve internetin seçkinlerin elinde olduğu bir zamanda, geleneksel kütüphanecilik mantığı rağbet görüyordu. Dosyalar, veriler, çözümler, programlar ve yapılmış ve yararlı olabilecek her şeyden oluşan bir katalog bilgi alanında yönlendirme için yeterli olduğunda, sorunun çözümünü neden karmaşıklaştıralım?

    Kullanıcılar bir anıt dikmeli mi? Ağların, dizinlerin, iletişim fırsatlarının ve "birincil" birikimin bilgisayar hayranlarının çalışmalarından kaynaklandığını hatırlayın:

    • bilgi sermayesi;
    • modern fikirlerin temelleri (unutulmaya yüz tuttular, ancak geçici görünümleri uzun vadeli bir bakış açısı oluşturdu).

    Bilgisayarların gücü ve yetenekleri hızla bilgi işlem alanından bilgi işleme alanına taşındı. İnternet, uygulama alanlarında ve insanların zihninde hızla yeni bölgeleri fethetmeye başladı. Basit kütüphanecilik anında arama motorlarının karmaşık mekanizmalarına taşındı.

    Çok sayıda arama ordusu, robot, "örümcek" ve diğer algoritmalar, İnternet alanına düşen her şeyi titizlikle incelemeye başladı. Belki de arama motorunun ne olduğunu, aramanın nasıl çalıştığını, İnternet'in ne olduğunu netleştirenler onlardı. Bilgileri indekslemeyi öğrendiler, neyin kullanılabileceğini ve nasıl kullanılacağını anlamaya başladılar.

    Eski bir "bilgi öncesi dünya", tufan öncesi silahlar, ilkel toplama yöntemleri - tıpkı insanların sosyal, sosyal açıdan önemli, doğadan makullük kriterine göre ayrılmış bir şeyi temsil etmeye yeni başladıkları bir zamanda balık tutma ve avlanma gibi.

    Endeksleme: köle değiliz ama yine de hiçbir şeyimiz yok

    indeksleme bilgi alanı, toplanan bilgilerde yönlendirme yöntemi ve dış (İnternet) ortamda tespit edilen değişiklikler nedeniyle mevcut olanı doğru bir şekilde düzeltme yeteneği, hayatta kalmanın temeli oldu. Bu, vahşi yaşamda kabul edilir ve İnternet alanı zaten kendi ve kesinlikle gerçek hayatını kazanmıştır.

    Tarihte her zaman hatırlanabilen bir şey olmuştur, ancak şu soru her zaman ortaya çıkar, gerçekten öyle miydi, bu tarihsel "varlık" gerçek insanlarla ve unutulmaz anılarla bağlantılı mı?

    Belki de merdiven boşluğundaki komşunun Google'ın yaratıcısı olduğu veya Yandex'in refahı için temel temelleri formüle ettiği ortaya çıktı. Ancak birçok kişi, köprü metni fikrinin başlangıç ​​noktası olarak 1945'i gösteriyor ve Salton's Magic Automatic Text Extractor, modern arama teknolojisinin babası olarak kabul ediliyor.

    O zamandan beri köprünün altından çok sular aktı ve ilk arama motorlarının, ilk eski algoritmaların ve fikirlerin listesi o kadar büyük ki, geçmişi sistematik hale getirmek ve dizine eklemek için kendi içinde iyi bir arama görevi.

    Google'ın bir fenomen olarak ortaya çıkmasının sebebinin ve modern sistem- bu sadece gerçek bir insan değil, arkadaşları ve kız arkadaşları. Bu, istenen rezonansı veya ilişkilendirmeyi başarıyla uyandıran bilgi alanında neden tamamen farklı bir nokta değil?

    Kümülatif kamu bilinci, hâlâ Edison'un ampulünün kendi versiyonundan çok uzak olduğu o karanlık evrendir.

    Yıl 1994: Hangi bot "anne" anahtar kelimesini söyledi?

    İÇİNDE modern dünya geçmişe inanmak zor, ancak tarihlerin doğruluğu ve gerçek kişilerin katılımı göz önüne alındığında, görünüşe dikkat edilmelidir. anahtar kelimeler- bu henüz anlamsal bir çekirdek değil.

    Geçen yüzyılın sonunda bir arama motorunun ne anlama geldiği zaten kesinlikle açıktı: bir müşteri için mücadelede rekabet eden bir derecelendirmeye sahip bir düzine popüler arama motoruydu. Bazıları Yahoo'yu severdi, diğerleri Aport'u severdi, diğerleri Rambler'ı severdi ama sonunda Google ve Yandex kaldı.

    Bütün bunlar kelimeler, görüşler, tercihler ve ilginç gerçeklerdir. Bununla birlikte, arama işinin canavarları oluşturuldu, temeller oluşturuldu, nesnel bilgi ve anlayışta sağlam deneyimler atıldı:

    • arama mekanizmaları;
    • anahtar kelimeler;
    • anlamsal çekirdek

    Köprü metni sadece gelişmekle kalmadı, aynı zamanda İnternet programcılığının temeli haline geldi ve ilgili ciddi teknolojilerin yolunu açtı.

    Ana şey: anladığımız gibi öz değil ve ne oluyor. Bir hareket yönü olması ve doğru olması önemlidir. Döviz kurundaki dalgalanmalar normaldir, dalgalanmalar olmasaydı kriterleri optimize etmek için bir neden olmazdı. Ve sorudaki ve cevaptaki kriterler en önemli şeydir.

    Yıl 1989: unutulan canlanma

    Geri alma, özel bir tarihsel mekanizmadır ve her zaman ilginç bir gerçektir. İnsanlar, özellikle bilim adamları ve kalifiye uzmanlar, şeylerin özünü unutup rüyalara dalma eğilimindedir. Savaşlar, gladyatörler ve korkunç savaşlar dünyası, kamu ve özel zihinlerde sürmekte olan yarışmalara kıyasla eğlencelidir. İşte karanlığın krallığı ama ilerlemeniz gerekiyor ve her adımda zafer kazanmadan bunu yapamazsınız.

    Arama motorunun çalışma prensibi, algoritmanın temelini oluşturdu. Algoritmaların birçok gerçek uygulaması vardır. Çok azı hayatta kaldı, ancak tüm İnternet topluluğunu kendi aralarında bölen şey buydu. Arama alanındaki idealler için mücadele o zamanlar zaten önemliydi, ama hatta Kısa hikaye Arama motorlarının gelişimi tüketicinin ilgisini çekmeyi bıraktı.

    Kullanıcının bir cevaba ihtiyacı var, bilim adamlarının ve uzmanların başarılarına değil. Tüketici, yeterli bir yanıt almak ve arama motorunun doğru çalıştığından, nesnel kriterleri uyguladığından emin olmak için bir soruyu nasıl doğru bir şekilde formüle edeceğini bilmek ister.

    OOP ve bulutların 1989-1991'de icat edildiği ilginç gerçeği kimin umurunda. Kesinlikle kimse! Ancak yalnızca bir düzine yıl önce bir geri dönüş vardı: şimdi OOP'siz ve bulut teknolojileri yasaktır. Ancak geri alma doğru yönde "yuvarlanmadı", bu nedenle bir arama motorunun ne anlama geldiği sorusuna özel bir cevap yok. Yeni bir şey ortaya çıkmadı, ama gereksiz - evet.

    Arama ve arama motorunun tanımı

    Hesap makineleri ortaya çıktığında, bir kişi toplama, çarpma, bölme kurallarını unutacağını düşündü. Zaman geçti ve korku dağıldı. Hesap makineleri canlıdır ve bir kişi bir sütunda en basit matematiksel işlemlerin nasıl yapıldığını unutmamıştır.

    Google ve Yandex'in çalıştığı ve etrafta az sayıda saygın arama motorunun bulunduğu bir zamanda, bir görüş vardı: arama bir bilgisayar algoritmasıdır ve arama motoru (bir kelimenin tanımı ve anlamı) bir yazılımdır. ve internette bilgi arama yeteneği sağlayan bir web arayüzüne sahip donanım kompleksi.

    Arama motoru sonuçları

    Bir arama motorunun ne anlama geldiğini hayal etmek kolaydır. Bir sorgu dizisi var, ziyaretçi bir anahtar kelime yazıyor, "ara" düğmesine basıyor ve sonucu alıyor. Ancak SERP cevap değildir ve anahtar kelime de soru değildir.

    İÇİNDE sıradan hayat bir kişi anahtar kelimeler kullanmaz ve asla herhangi bir "sorun" almaz. Çocuk yemek yemek isterse, bunu annesine veya babasına söyleyecektir. Her şey bebeğin tam olarak ne istediğine bağlıdır: gerçekten yemek yemek veya dondurma için para kazanmak. Ebeveynin tepkisi kelimelerden yoksun olabilir, ancak eylem takip edecektir.

    Çalışan, işverenle anahtar kelimeler aracılığıyla iletişime geçmeyecek, aksi takdirde ihraç sonucu sözsüz bir işten çıkarma olacaktır.

    Bütün bunlar gerçekler, ancak bir kişi ve bir bilgisayar sistemi farklı bir ilişki alanıdır. Bir arama motorunun ne anlama geldiğine dair net bir fikir olduğu sürece - bunlar sorular, cevaplar, kriterler değil, anahtar kelimeler ve motorun sonuçlarıdır (arama sonuçları).

    Anın gerçek faydası

    SEO tutkusu, web stüdyolarının sayısındaki hızlı artış, reklamcılığın gelişimi, fikirlerin empoze edilmesi, tonlarca spam ve yayında çöp - tüm bunlar doğal ve nesnel olarak normaldir. Spam, bilgisayar korsanları ve olumsuzluklarla savaşmanın zamanı geldi. Bunu dikkatli bir şekilde yapmak gerekiyor, ancak mevcut durumdan asıl fayda, arama işinin geliştirilmesindeki başka bir aşamadır.

    Anahtar kelimeler harika. anlamsal çekirdek site harika Bir bilgisayar, metinleri farklı dillere çevirebilir ve doğal cümleleri çözümleyebilir. SQL dili veritabanlarıyla "iletişimde" fiili hale geldi. SQL'in birçok lehçesi vardır ve bu gerçek bir göstergedir. Yapay dil uygulanabilir hale geldi! Dil, büyük miktarda sistematikleştirilmiş bilgiye erişim sağlayabilir.

    Oracle ve diğer büyük veritabanı liderleri, bilgileri sunmak için onlarca yıl harcadılar. Google - bilgi toplama ve indeksleme mekanizmaları hakkında. Linux ailesi yerini korudu, Windows ayakta kaldı ve programlama dillerinin sayısı yeterli seviyeye daraldı.

    Yapay zeka hayaller dünyasına girdi, geliştiriciler ve tüketiciler nesnel olarak yaratıcı bilgi yönetimi ve kullanımı dünyasına koştu.

    Arama sonuçları: önemli ve yararsız

    Arama sonuçlarını organize etmek o kadar da zor değil ama son on yılda değişmedi. Esasen, bu doğru. Arama çubuğu bir soru değil de bir anahtar kelime içeriyorsa, o zaman ne tür bir yanıttan bahsedebiliriz? Tüm modern arama motorlarında kriterler vardır, bunlara gereken anlayışla davranılır, ancak tüketiciyi neden sınırlandıralım?

    Kullanıcının arama sonuçlarının hangi bölümünü seçtiğine tepkisi önemlidir. Bu, arama motorunun sonuçları hakkındaki görüşüdür. Arama motorları bunu takdir eder ve yalnızca belirli bir talepte değil, genel olarak dikkate alır.

    Anahtar kelime akışı ve SERP akışı, bilgi çöpü içerir. Bu aynı zamanda kriterlerin oluşum sebebidir. Arama görevini bir anahtar kelimenin ve bir algoritmanın birikmiş bilgiye uygulanması, birikmiş bilginin arıtılması olarak düşünmek mümkün değildir.

    Beklentiler hakkında: aramadan çözüme

    En iyi karar herhangi bir karar vermemektir. Arama motorlarının geliştiricileri bunu anlasın ya da anlamasın, geliştiricilerin bir anahtar kelimeye yanıt bağlamında bir arama motorunun ne olduğunu, zaten mevcut ve sistematikleştirilmiş verilerden bilgi çıkarma açısından bir dizin gibi bildikleri gerçeği kalır.

    Tüketici, arama sonuçlarından uygun gördüğünü kendisi seçecek ve bir karar verecektir. Arama motoru bunu dikkate alacak ve hatırlayacaktır. Bir kişinin alınan bilgileri nasıl elden çıkaracağı - bu, bir sonraki anahtar kelime olacaktır.

    Böylece arama motoru karar vermeyi öğrenir ve kişi soru formüle etmeyi öğrenir. Şimdiye kadar bunlar anahtar kelimeler ve cevabın sonucu arama sonuçları. Ancak nicelik her zaman niteliğe dönüşür.

    İnternet arama motorları nelerdir? İleriye doğru harekete dayalı bir gerçeklik. Pek çok pratik görev, bilgisayar sistemlerinden zeka gerektirmez. Çoğu durumda, doğru soruları yeterince cevaplamaları yeterlidir.

    Merhaba sevgili okuyucular! Seninle Ekaterina Kalmykova. Bugünün makalesi, arama motoru, ne olduğu, ne için olduğu gibi bir konsepte ayrılacak. İnternetteki arama motorlarının türlerine de daha yakından bakacağız.

    “Bu arama motorlarını neden bilmeliyim?” diye bir sorunuz varsa, o zaman şöyle cevap vereceğim. Bir restoranda lezzetli bir çorba yediğinizde, evde tekrar yapabilmek için hangi malzemelerden yapıldığını bilmek ister misiniz? Sonuçta, sonuçtan, yani çorbanın tadından memnunsanız, o zaman böyle bir sonuca neyin yol açtığını bilmek ister misiniz?

    Bir arama motoruyla (PS) çalışmaktan da bahsedebilirsiniz. Gelecekte kendi blogunuzu yaratırsanız, PS'nin çalışmasını bilerek uzmanlardan yardım almanıza gerek kalmayacaktır. Projenizi, arama motorunun göreceği ve diğer kullanıcılara gösterebileceği şekilde bağımsız olarak yönetebileceksiniz. Sonuçta, kaynağınızın katılımı ve buna bağlı olarak kazançlar buna bağlı olacaktır.

    Öyleyse başlayalım.

    Arama motoru nedir?

    arama motoru özel kaynak kullanıcıya talebi doğrultusunda bilgi sağlayan internette. Yani, bu kaynak içindeki tüm verileri toplar. küresel ağ, tüm web projeleri ve kullanıcıdan belirli bir istek alındığında, örneğin tematik bir blog veya web sitesine göndererek gerekli bilgileri sağlar.

    Böylece projenizi oluşturduktan sonra göreviniz konuya, yani arama motorunun "listesine" veya veritabanına girmek olacaktır. İnternette web sitesi tanıtımı herhangi bir arama motoru kullanılmadan mümkün olmadığından, kaynağınızın kalitesine, dahili ve harici optimizasyonuna dikkat etmeniz gerekecektir. Bunu nasıl yapacağımızı ileriki yazılarda tartışacağız. Bu yüzden kaçırmayın.

    Bu arada kendi blogunuzu oluşturmaya karar verirseniz şu makaleleri okumanızı tavsiye ederim:

    Hemen hemen her gün yeni web kaynakları ortaya çıktığı için, arama motorlarının veritabanı buna göre sürekli olarak güncellenmelidir. Yeni oluşturulan her sitenin robot tarafından dizine eklenmesi gerekir. konuşmak basit kelimelerle, PS asistanları - robotlar yeni kaynakla tanışmalı ve bu verileri arama motorunun kendisine aktarmalıdır.

    Pekala, burada muhtemelen bir robotun blogunuzu ziyaret ettiğinde her şeyi beğenmesi gerektiğini tahmin etmişsinizdir. Gelecekteki kaderiniz bu konuğa bağlı olacaktır.

    Projenizdeki robotun içeride kalmasını nasıl sağlarsınız? zevk dolu Aşağıdaki makalelerden birinde anlatacağım. Sizlerle paylaşacağım ilginç ve çok merak edilen bilgiler olacak kaçırmayın.

    Arama motorlarının çalışmaları

    PS ile ilgili tüm işler, arama çubuğuna istenen sorgunun girilmesiyle başlar. Kullanıcılar ne arıyor olabilir? Evet, lahanalı turta tarifinden "hiçbir şey yapmadan nasıl daha fazla para kazanılır" sorusuna kadar her şey.

    Kaynağınızın bir soruya cevap olarak çıkması için rakiplerinizden önde olmanız gerekiyor. Bunu yapmak için, yüksek kaliteli optimize edilmiş içerik yazmak, yani makale taleplerine yanıt vermek, iyileştirmek gibi faaliyetleri içeren projenizin tanıtımına özel önem vermeniz gerekir. davranış faktörü, yani okuyucunuzun kaynakta olmasını ilginç kılmak için bu, kullanılabilirlikte, yani ziyaretçinin rahatlığında ve diğer birçok faktörde bir gelişmedir. Hepimizin yapmayı öğreneceği şey bu.

    Arama motoru bileşenleri

    Ve arama motorlarının, örneğin aynı Google'ın kaynağınızı dizine eklemesine ne yardımcı olur?

    1. Aracılar, işin büyük bölümünü yapan işçilerdir - siteleri dizine ekler ve analiz ederler.
    2. Örümcekler (örümcek) - bir web kaynağının sayfalarını indirebilen ve onun hakkında genel bilgileri toplayabilen bir program.
    3. Paletli (paletli) - sayfalardaki tüm bağlantıları bulan ve ardından arama motorlarının aşina olmadığı yeni verileri arayan bir program.
    4. Dizin oluşturucu - metni, başlıkları, stili vb. analiz eder.
    5. Robotlar - içeriğinizin sayfalarını indeksleyin ve ayrıca çeşitli bağlantıları inceleyin.

    İndekslemenin ihtiyacınız olan şekilde gerçekleşmesi için özel bir “robots.txt” belgesi oluşturursunuz. Sistemin yalnızca ihtiyacınız olan sayfaları kontrol etmesine ve görmek istemediğiniz sayfaları kaldırmasına olanak tanır.

    Arama motoru türleri

    Bilgi alma sistemleri için birkaç seçenek vardır:

    • kataloglar. Basit bir arama karşılaştırması, bir kitaplıktaki bir kitaplıktır. Her şey orada belirli bir konunun alt kategorilerinde ve kategorilerinde saklanır. Böyle bir arama motoruna girdiyseniz, inanın orada bulacağınız bilgiler, algınız için fazlasıyla yararlı ve anlaşılır olacaktır. Söz konusu ortak site hakkında tahmin ettiniz mi? Tabii ki, bir dizi yararlı bilgi toplayan Wikipedia hakkında.
    • Arama işaretçileri. Verilerde arama, anahtar ifadeler pahasına gerçekleştirilir. Aynı anda hem uygun hem de sakıncalıdır. Bence, örneğin, "Kız sınıfını gösterir" arayan insanlar, bir kızın başparmağını nasıl gösterdiğini ve aramada pek düzgün olmayan bir şeyin ortaya çıktığını bulmak için beni anlayacaklardır. 🙂 Bu arama türü, arama motorlarının çoğunu karakterize eder.
    • derecelendirme sistemleri. Ziyaret sayısına bağlı olarak popülerliğinizi belirleyin. Tabii ki, kaynağın kendisinin kullanışlılığı ve kalitesi her zaman dikkate alınmadığı için en iyi kriter değildir. Böyle bir sistemin bir örneği, İnternet kaynağı alexa.com'dur.

    Arama motorları da ikiye ayrılır genel ve özel. Genel arama motorları, bildikleri tüm web kaynakları için herhangi bir seçim yapmadan bilgi verilerini sıralar. Bunlar Yandex, Rambler, Google'ı içerir. Uzman - kullanılan dile göre sıralayın.

    Ayrıca, arama motorları ayrılabilir bölgesel ve dünya çapında dağıtım.

    Bugüne kadar, tüm arama motorları, yüksek kaliteli, ilgili kaynakları seçmek için algoritmalarını sürekli olarak geliştirmektedir.

    biraz tarih

    PS, 1996'da Runet'te göründü - bunlar Aport ve Rambler. Bir yıl sonra, 1997'de Yandex kuruldu ve bir yıl sonra, 1998'de başka bir rakip ortaya çıktı - Google. Şu anda en popüler olanları Yandex ve Google'dır.

    Şu anda en popüler arama motorları hangileri?

    İşte istatistikler:

    Gördüğünüz gibi, Yandex artık Google ve Mail ile birlikte Rusya'da en popüler olanıdır.

    Böylece, projenizi oluştururken ve tanıtırken odaklanmanız gereken en iyi aramaları görebilirsiniz.

    Arama motoru Yandex (Yandex)

    Çalışma prensibi aşağıdaki gibidir: Arama dizisi aradığınız sorguyu girin, "Bul"a tıklayın ve çıktıyı görün. Yandex, isteğinize 13 milyon yanıt aldı. Ayrıca resimlerde, videolarda, pazarda da arama yapabilirsiniz (soldaki sütuna bakın).

    Ek olarak, arama bölgesini ayarlayabilirsiniz. Bunu yapmak için, arama çubuğundaki çarpı işaretinin yanındaki simgeye tıklayın ve filtre penceresinde istediğiniz bölgeyi seçin.

    Arama motoru Google (Google)

    Google, Yandex'e benzer şekilde çalışır. Farklı bölümlerde bilgi arayabilirsiniz: resimler, videolar, haberler, haritalar vb.

    "Arama Araçları"na tıklarsanız, bölgeyi, dili ve ne kadar süre bilgi arayacağınızı seçebileceğiniz bir ayarlar paneli açılır.

    Artık İnternette hangi arama motorlarının bulunduğunu biliyorsunuz, bunların en popülerlerini de gördünüz ve artık bilgiyle donanmış olarak, arama motorlarıyla bağlantılarınızı ve etkileşiminizi oluşturabilirsiniz.

    Hepsi bugün için. Makaleyi nasıl buldun?

    Şimdilik hepsi.

    En son haberleri kaçırmamak için blogu güncellemenizi tavsiye ederim.

    Ekaterina Kalmıkova

    Arama sistemi- İnternette bilgi arama yeteneği sağlayan bir web arayüzüne sahip bir yazılım ve donanım kompleksi.

    Tüm arama motorları, özel olarak ayrılmış güçlü sunucularda bulunmaları ve etkili iletişim kanallarına bağlı olmaları gerçeğiyle birleşir. Arama motorlarına bilgi alma sistemleri (IPS) de denir. En popüler sistemlerin aynı anda hizmet verilen ziyaretçi sayısı binlerce kişiye ulaşıyor. En ünlüsü günde milyonlarca müşteriye hizmet veriyor. Bir arama motorunun bir dizine dayalı olduğu durumlarda buna dizin adı verilir. Moderatörlerin çalışmalarına dayanmaktadır. Tam metin aramalı IPS'nin kalbinde otomatik bilgi toplama yer alır. Özel programlar tarafından gerçekleştirilir. Bu programlar periyodik olarak tüm İnternet kaynaklarının içeriğini inceler. Bunu yapmak için, farklı kaynaklar arasında hareket ederler veya dedikleri gibi sürünürler. Buna göre, bu tür programlara robot denir. Başka isimler de var: WWW, World Wide Web ifadesinin kısaltması olduğundan, böyle bir programa İngilizce'de örümcek demek doğaldır. - örümcek. Son zamanlarda başka adlar da kullanılmaya başlandı: otomatik dizinler veya dizinler. Bu programların tümü, farklı URL'lerden bilgileri keşfeder ve "indirir". Belirtilen türdeki programlar, belirli bir süre sonra her kaynağı ziyaret eder. Hiçbir arama motoru tüm interneti indeksleyemez. Bu nedenle, indekslenen kaynakların adreslerinin toplandığı veritabanları, farklı arama motorları için farklıdır. Bununla birlikte, birçoğu, mümkünse, çalışmalarında World Wide Web'in tüm alanını kapsamaya çalışıyor.

    Bir arama motorunu kullanarak bilgi aramak için, kullanıcı bir arama sorgusu oluşturur. Arama motoru, kullanıcının sorgusuna bağlı olarak bir arama sonuçları sayfası oluşturur. Bu tür arama sonuçları farklı dosya türlerini birleştirebilir, örneğin: web sayfaları, resimler, video dosyaları. Bazı arama motorları, İnternet'teki veritabanlarından ve kaynak dizinlerinden de veri çeker.

    Arama ve bakım yöntemlerine göre, dört tür arama motoru ayrılır:

    1. arama robotlarını kullanan sistemler.

    2. insan kontrollü sistemler

    3.hibrit sistemler

    4.meta-sistemler.

    Arama motoru mimarisi şunları içerir: İnternet sitelerini tarayan bir arama robotu, hızlı arama sağlayan bir dizin oluşturucu ve bir arama motoru - grafiksel bir kullanıcı arayüzü.

    Bir arama motorunun amacı, anahtar sözcükleri veya anahtar sözcüklerle bir şekilde ilgili sözcükleri içeren belgeleri bulmaktır. Arama motoru daha iyidir, kullanıcının sorgusuyla ilgili daha fazla belge döndürür.

    Arama Motoru Örnekleri

    Google- en eksiksiz ve popüler yabancı IPS'lerden biri. Google IPS'nin ayırt edici bir özelliği, diğer kaynaklardan bu kaynağa olan bağlantıları analiz ederek bir belgenin alaka derecesini belirleme teknolojisidir. Diğer sayfalardaki bir sayfaya ne kadar çok bağlantı verilirse, o sayfanın Google IPS'deki sıralaması o kadar yüksek olur. Google, PageRank yetki hesaplama algoritmasını kullanır. PageRank, siteleri arama sonuçlarında sıralamada yardımcı faktörlerden biridir. PageRank, bir sitenin Google arama sonuçlarındaki konumunu belirlemenin tek ama çok önemli yolu değildir. Google, arama sonuçlarında bu sayfaların ziyaretçiye sunulma sırasını belirlemek için belirli bir sorgu için bulunan sayfaların PageRank'ini kullanır.Şirket, 2010 yılında Rusya'da sesli aramayı başlattı. Arama yapmak için, telefonunuzdaki arama çubuğunun yanındaki düğmeye basmanız ve sorgunuzu söylemeniz gerekir, telefon sesinizi sunucuya gönderir ve tarayıcı, sorgunuzun tanındığı ve bunun için arama sonuçlarının bulunduğu bir dize görüntüler.

    Yandexşu anda en popüler yerli arama motorudur. 1997'de başladı. Kendi İnternet kaynakları kataloğunu sürdürüyor. Ayrıca çizimleri tanımlamak için en iyi arama motorudur. İngilizce sürüm, bir İnternet kaynakları dizini ile birlikte sağlanır. Gelişmiş bir istek oluşturma sistemine sahiptir. Özellikle, doğal dilde bir arama reçetesi girilmesine izin verilir - bu durumda, gerekli tüm uzantılar otomatik olarak yapılır.

    Yandex, HTML web sayfalarının yanı sıra PDF (Adobe Acrobat), Zengin Metin Biçimi (RTF), ikili Word (.doc), Excel (.xls), PowerPoint (.ppt), RSS (bloglar ve forumlar) biçimindeki belgeleri de indeksler.

    Mail.ru arama motoru 2007 yılında çalışmaya başladı. 2009 baharında dizin dosyasının hacmi, Rusça sunucularda bulunan 1,5 milyar sayfadan fazlaydı. Metin aramaya ek olarak, sistem "kendi kendine doldurulan" özel Rus sunucularında barındırılan çizimleri ve video klipleri arar: [email protected], Flamber.Ru, 35Photo.ru, PhotoForum.ru, [email protected], RuTube, Loadup, Rambler Vision ve benzerleri. Gogo.ru, arama alanını ticari siteler, bilgi siteleri, forumlar ve bloglarla sınırlamanıza olanak tanır. "Gelişmiş Arama" formu, aramaları belirli dosya türleriyle (PDF, DOC, XLS, PPT), aranan kelimelerin belgedeki konumuyla veya belirli bir alanla sınırlandırmayı da mümkün kılar. Kasım 2013'te, Google Play'de, ana ekrandan herhangi bir sosyal ağa geçmenize olanak tanıyan ve resim, video ve haber aramak için hızlı erişim içeren Mail.Ru şirketinden arama uygulamasının yeni bir sürümü çıktı. Android uygulaması, ihtiyacınız olan bilgileri verimli bir şekilde bulmak için tasarlanmış bir mini tarayıcıya dönüştü. Yardımcı program ayrıca metinle değil sesle belirtilen arama sorgularını tanımayı da öğrendi. Geliştiriciler ayrıca, üzerine yerleştirilebilecek özel bir pencere öğesi oluşturduklarını da not eder. ana ekran Google Android sistemine dayalı akıllı telefon veya tablet. Bunun aramaya harcanan zamanı daha da azaltacağı anlaşılmaktadır.

    AltaVista- en eski arama motorlarından biri, belge hacmi açısından ilk sıralardan birini işgal ediyor - 350 milyondan fazla. AltaVista, basit ve gelişmiş aramalara izin verir. "Yardım", deneyimsiz kullanıcıların bile basit ve karmaşık sorguları doğru bir şekilde oluşturmasına olanak tanır.

    aylak aylak- 1996'da açılan ilk Rus IRS'lerinden biri. 2002'nin sonunda radikal bir modernizasyon gerçekleştirildi ve ardından Rambler liderler grubuna yeniden girdi. ağ arama. Şu anda, dizinin hacmi yaklaşık 150 milyon belgedir. Karmaşık sorgular oluşturmak için, menü öğelerini kullanarak bir arama reçetesi derlemek için geniş fırsatlar sunan "Ayrıntılı sorgu" modunun kullanılması önerilir.

    APORT. Bugüne kadar, veritabanının hacmi 20 milyondan fazla belgedir. Sistem çok çeşitli arama yeteneklerine sahiptir. APORT, kullanıcının sorguları hem Rusça hem de İngilizce olarak formüle etmesine izin veren yerleşik bir tercüman işlevine sahiptir. Ayrıca APORT'un resim ve ses dosyalarını aramak için özel modları vardır.

    En yeni nesil arama motorları, bir web sayfasındaki veya bir konferans makalesindeki tüm kelimeleri indekslerken, daha önce indekslemenin kapsamı genellikle belgenin başlığı, başlıkları, ilk birkaç satırı ve adresi ile sınırlıydı. Bu, arama sonuçları her zaman gerçek verileri yansıtmadığından, dar bir konudaki materyalleri belirleme olasılığını önemli ölçüde sınırladı. Bu eksikliği ortadan kaldırarak, modern arama motorları öncekilerden çok daha güvenilirdir.

    Bir sonraki en önemli özellik, operatör sayısındaki ve diğer sorgulama unsurlarındaki artışla ifade edilen dahili arama mekanizmasının iyileştirilmesidir. Birkaç yıl önce, yalnızca iki, en iyi ihtimalle üç klasik Boole işleci kullanımdaydı: AND (ve), OR (veya) ve NOT (değil). Artık Alta Vista'da NEAR (yakında, yaklaşık) ve OpenText'te FOLLOWED BY (takip eder) var - sorguyu olabildiğince çok belirtmenize izin veren son derece yararlı mesafe işleçleri. Birçok sistem, terim sonlarını kısaltmanıza, aramaları belge oluşturma tarihine göre sınırlandırmanıza, anahtar kelimeleri yalnızca belirlenen web sayfası öğelerinde (başlık, başlıklar, e-posta adresi vb.) ve tam ifadeleri aramanıza izin verir. En son gelişmeler ayrıca belirli bir türdeki (örneğin grafik veya ses) dosyaları algılamanıza olanak tanır ve küçük ve büyük harflere duyarlıdır. Herhangi bir dilde veri aramak yaygınlaşıyor. Tüm bunlar, elde edilen sonuçların alaka düzeyini elbette artıran, yüksek doğruluk derecesine sahip bir arama reçetesi oluşturmayı mümkün kılar.

    Şu anda en popüler arama motorları olan Google ve Yandex'i karşılaştıralım:

      İndekslenen sayfaların sayısı. Google'ın 8 milyarı var ve Yandex'in sadece 2 milyarı var. Yani dört kat daha az. Google'ın zaferi.

      Sayfa indeksleme hızı. Google, yeni sayfaları bir gün içinde dizine eklerken, Yandex'in bunu yapması birkaç gün sürebilir. Google yine kazandı.

      Düzenleme alaka düzeyi. Alaka düzeyi, arama motoru sayfasında görüntülenen sonuçların sorgunuza uygunluğu anlamına gelir. Burada kazananı belirlemenin zor olduğunu hemen söylemeliyim. Google, İnternet'in yabancı segmentinde iyi sonuçlar verdi, ancak Runet'te Yandex her zaman biraz önde oldu.

      Ek internet hizmetleri. Burada avantaj açıkça Yandex için. Uygun bir şekilde kategoriler halinde gruplandırılmış düzinelerce farklı hizmete sahipken, Google'da bunlardan daha azı vardır ve ayrıca entegrasyon vardır. sosyal ağ Birçoğunun sevmediği Google+.

    Bir arama motorunun mimarisi tipik olarak şunları içerir:

    Ansiklopedik YouTube

      1 / 5

      ✪ Ders 3: Bir arama motoru nasıl çalışır? SEO'ya Giriş

      ✪ İçeriden arama motoru

      ✪ Shodan - Siyah Google

      ✪ Cheburashka arama motoru Rusya'da Google ve Yandex'in yerini alacak

      ✪ Ders 1 - Bir arama motoru nasıl çalışır?

      altyazılar

    Hikaye

    Kronoloji
    Yıl sistem Etkinlik
    1993 W3Katalog?! öğle yemeği
    Aliweb öğle yemeği
    Atlama İstasyonu öğle yemeği
    1994 web gezgini öğle yemeği
    bilgi aramak öğle yemeği
    Lycos öğle yemeği
    1995 AltaVista öğle yemeği
    daum Temel
    açık metin web dizini öğle yemeği
    Macellan öğle yemeği
    Heyecanlandırmak öğle yemeği
    SAPO öğle yemeği
    yahoo! öğle yemeği
    1996 köpek yığını öğle yemeği
    Inktomi Temel
    aylak aylak Temel
    sıcak bot Temel
    Ask Jeeves Temel
    1997 Kuzey Işığı öğle yemeği
    Yandex öğle yemeği
    1998 Google öğle yemeği
    1999 Tüm Web öğle yemeği
    GenieKnows Temel
    Naver öğle yemeği
    teoma Temel
    Vivisimo Temel
    2000 Baidu Temel
    Exalead Temel
    2003 bilgi.com öğle yemeği
    2004 yahoo! Aramak Son lansman
    A9.com öğle yemeği
    sogou öğle yemeği
    2005 MSN Arama Son lansman
    Ask.com öğle yemeği
    Nigma öğle yemeği
    iyi arama öğle yemeği
    Arastır beni Temel
    2006 wiki arama Temel
    Quaero Temel
    Canlı Arama öğle yemeği
    ChaCha Başlat (beta)
    Guruji.com Başlat (beta)
    2007 wiki arama öğle yemeği
    Sproose öğle yemeği
    Wikia Arama öğle yemeği
    blackle.com öğle yemeği
    2008 ÖrdekÖrdek Git öğle yemeği
    sürtük öğle yemeği
    Pikolatör öğle yemeği
    Görüntüle öğle yemeği
    cuil öğle yemeği
    Boogami öğle yemeği
    Sıçrayan Balık Başlat (beta)
    ormanlık öğle yemeği
    VADLO öğle yemeği
    Gücü ayarla öğle yemeği
    2009 bing öğle yemeği
    KAZ.KZ öğle yemeği
    yebol Başlat (beta)
    Mugurdi kapanış
    izci öğle yemeği
    2010 cuil kapanış
    Blekko Başlat (beta)
    Görüntüle kapanış
    2012 WAZZUB öğle yemeği
    2014 Uydu Başlat (beta)

    İnternetin gelişiminin ilk aşamalarında Tim Berners-Lee, CERN web sitesinde yayınlanan web sunucularının bir listesini tuttu. Giderek daha fazla site vardı ve böyle bir listeyi manuel olarak sürdürmek giderek daha zor hale geldi. NCSA web sitesinde özel bir "Yenilikler!" bölümü vardı. (eng. What's New!), yeni sitelere bağlantılar yayınladılar.

    İnternette arama yapmak için ilk bilgisayar programı Archie(İngilizce archie - "c" harfi olmadan arşiv). 1990 yılında Montreal'deki McGill Üniversitesi'nde bilgisayar bilimi öğrencileri olan Alan Emtage, Bill Heelan ve J. Peter Deutsch tarafından oluşturuldu. Program, mevcut tüm anonim FTP sunucularından tüm dosyaların listelerini indirdi ve dosya adlarına göre aranabilen bir veritabanı oluşturdu. Ancak, Archie'nin programı bu dosyaların içeriğini indekslemedi, çünkü veri miktarı o kadar küçüktü ki her şey elle kolayca bulunabiliyordu.

    Geliştirme ve dağıtım ağ protokolü 1991 yılında Minnesota Üniversitesi'nde Mark McCahill tarafından icat edilen Gopher, iki yeni arama programları, Veronica ve Jughead. Archie gibi onlar da Gopher'in dizin sistemlerinde saklanan dosya adlarına ve başlıklara baktılar. Veronica (İngilizce) Bilgisayarlı Arşivlere Çok Kolay Kemirgen Odaklı Net Çapında Dizin), tüm Gopher listelerindeki çoğu Gopher menü başlığı için anahtar kelime aramasına izin verdi. Jughead Programı Jonzy'nin Evrensel Sincap Hiyerarşisi Kazısı ve Sergisi) belirli Gopher sunucularından alınan menü bilgileri. Archie'nin arama motorunun adı çizgi roman serisiyle ilgili olmasa da "Archie", yine de Veronica ve Jughead bu çizgi romanlardaki karakterlerdir.

    1993 yazına gelindiğinde, çok sayıda özel dizin manuel olarak tutulsa da, web'de arama yapmak için henüz tek bir sistem yoktu. Cenevre Üniversitesi'nden Oscar Nierstrasz, bu sayfaları periyodik olarak kopyalayan ve standart bir formatta yeniden yazan bir dizi Perl betiği yazdı. Bunun temeli oldu W3Katalog?! 2 Eylül 1993'te başlatılan ilk ilkel web arama motoru.

    Muhtemelen Perl'de yazılan ilk arama motoru, Matthew Gray'in Haziran 1993'te yaptığı bir bot olan "World Wide Web Wanderer" idi. Bu robot "Wandex" arama dizinini yarattı. Wanderer robotunun amacı, boyutu ölçmekti. Dünya çapında Ağ ve sorgudaki kelimeleri içeren tüm web sayfalarını bulun. 1993 yılında ikinci arama motoru Aliweb ortaya çıktı. Aliweb bir tarayıcı kullanmadı, bunun yerine web sitesi yöneticilerinden sitelerinde belirli bir biçimde bir dizin dosyasının bulunduğuna dair bildirimler bekledi.

    Atlama İstasyonu, Aralık 1993'te Jonathan Fletcher tarafından oluşturuldu, bir tarayıcı kullanarak web sayfalarını aradı ve dizine ekledi ve arama sorgularını formüle etmek için bir arayüz olarak bir web formu kullandı. Üçünü birleştiren ilk İnternet arama aracıydı. temel fonksiyonlar arama motoru (kontrol, indeksleme ve gerçek arama). Zamanın sınırlı bilgisayar kaynakları nedeniyle, indeksleme ve dolayısıyla arama, yalnızca tarayıcının bulduğu web sayfalarının başlıkları ve başlıklarıyla sınırlıydı.

    Arama motorları, 1990'ların sonundaki Dot-com Balonuna katıldı. Birkaç şirket, halka arzları sırasında rekor karlar elde ederek pazara muhteşem bir şekilde girdi. Bazıları halka açık arama motoru pazarını terk etti ve yalnızca kurumsal sektörle çalışıyor, örneğin: Kuzey Işığı.

    Google, anahtar kelime satma fikrini 1998 yılında, goto.com'da arama motoru çalıştıran küçük bir şirketken aldı. Bu hareket, arama motorlarının birbirleriyle rekabet etmekten İnternet'teki en karlı iş girişimlerinden biri haline gelmesine doğru bir kaymaya işaret ediyordu. Arama motorları, arama sonuçlarında ilk sıraları tek tek şirketlere satmaya başladı.

    arama motoru Google sistemi 2000'li yılların başından beri öne çıkıyor. Şirket, PageRank algoritmasını kullanan iyi arama sonuçları nedeniyle yüksek bir konuma ulaştı. Algoritma, Google'ın kurucuları Sergey Brin ve Larry Page tarafından yazılan "Arama Motorunun Anatomisi" başlıklı makale ile kamuoyuna sunuldu. Bu yinelemeli algoritma, "iyi" ve "önemli" sayfaların diğerlerinden daha fazla bağlantı aldığını varsayarak, bir web sayfasına giden köprülerin sayısına ilişkin bir tahmine dayalı olarak web sayfalarını sıralar. Google'ın arayüzü, arama motorunu web portalına yerleştiren birçok rakibinin aksine, gereksiz hiçbir şeyin olmadığı sade bir tarzda tasarlanmıştır. Google arama motoru o kadar popüler hale geldi ki onu taklit edenler ortaya çıktı, örneğin, Gizem Arayıcı(gizli arama motoru).

    Rusça bilgi arayın

    1996 yılında Altavista arama motorunda Rus morfolojisi dikkate alınarak bir arama yapıldı ve orijinal Rus arama motorları Rambler ve Aport devreye alındı. 23 Eylül 1997'de Yandex arama motoru açıldı. 22 Mayıs 2014'te, 2015 yılında beta testinde olan Rostelecom tarafından ulusal arama motoru Sputnik açıldı. 22 Nisan 2015 açıldı yeni hizmet Uydu. Arttırılmış güvenlik ile çocuklar için özel çocuklar.

    Küme analizi ve meta veri arama yöntemleri büyük popülerlik kazanmıştır. Bu türden uluslararası makinelerden en ünlüsü "Sakar"şirketler Vivisimo. 2005 yılında Moskova Devlet Üniversitesi'nin desteğiyle otomatik kümelemeyi destekleyen Nigma arama motoru Rusya'da piyasaya sürüldü. 2006 yılında, bir etiket bulutu biçiminde görsel kümeleme sunan Rus meta makinesi Quintura açıldı. Nigma ayrıca görsel kümeleme ile deneyler yaptı.

    arama motoru nasıl çalışır

    Bir arama motorunun ana bileşenleri: arama robotu, indeksleyici, arama motoru.

    Kural olarak, sistemler aşamalı olarak çalışır. İlk olarak, tarayıcı içeriği alır, ardından dizin oluşturucu aranabilir bir dizin oluşturur ve son olarak tarayıcı, dizine alınmış verileri aramak için işlevsellik sağlar. Arama motorunu güncellemek için bu indeksleme döngüsü tekrarlanır.

    Arama motorları, HTML sayfalarından aldıkları birçok web sayfası hakkında bilgi depolayarak çalışır. Arama robotu veya "paletli" (İng. Paletli) - sayfada bulunan tüm bağlantıları otomatik olarak takip eden ve bunları vurgulayan bir program. Tarayıcı, bağlantılara veya önceden tanımlanmış bir adres listesine dayalı olarak, arama motorunun henüz bilmediği yeni belgeleri arar. Site sahibi, sitenin dosyalarının, sayfalarının veya dizinlerinin indekslenmesini önlemek için kullanılabilen robots.txt'yi kullanarak belirli sayfaları hariç tutabilir.

    Arama motoru, daha fazla indeksleme için her sayfanın içeriğini analiz eder. Kelimeler başlıklardan, sayfa metninden veya özel alanlardan - meta etiketlerden çıkarılabilir. Dizin oluşturucu, bir sayfayı parçalara ayırdıktan sonra kendi sözcüksel ve morfolojik algoritmalarını kullanarak analiz eden bir modüldür. Bir web sayfasının tüm öğeleri izole edilir ve ayrı ayrı analiz edilir. Web sayfası verileri, sonraki isteklerde kullanılmak üzere bir dizin veritabanında saklanır. Dizin, kullanıcının isteği hakkında hızlı bir şekilde bilgi bulmanızı sağlar. Google mağazası gibi bir dizi arama motoru orijinal sayfa tamamen veya kısmen, sözde önbellek ve ayrıca çeşitli bilgiler web sayfası hakkında. AltaVista gibi diğer sistemler, bulunan her sayfanın her kelimesini saklar. Önbelleği kullanmak, halihazırda ziyaret edilen sayfalardan bilgi çıkarılmasını hızlandırmaya yardımcı olur. Önbelleğe alınan sayfalar her zaman kullanıcının arama sorgusunda belirttiği metni içerir. Bu, web sayfası güncellendiğinde, yani artık kullanıcının isteğinin metnini içermediğinde ve önbellekteki sayfa hala eski olduğunda yararlı olabilir. Bu durum linklerin kaybolması ile alakalıdır (İng. linkrot) ve Google'ın kullanıcı dostu (kullanılabilirlik) yaklaşımı. Bu, sorgu metnini içeren önbellekten kısa metin parçaları çıkarmayı içerir. En az sürpriz ilkesi geçerlidir, kullanıcı genellikle arama kelimelerini alınan sayfaların metinlerinde görmeyi bekler ( kullanıcı beklentileri). Önbelleğe alınan sayfaları kullanarak aramaları hızlandırmanın yanı sıra, önbelleğe alınan sayfalar artık başka yerde bulunmayan bilgileri içerebilir.

    Arama motoru, indeksleyiciden alınan çıktı dosyalarıyla çalışır. Arama motoru, kullanıcı isteklerini kabul eder, bir dizin kullanarak işler ve arama sonuçlarını döndürür.

    Bir kullanıcı bir arama motoruna (genellikle anahtar kelimeler kullanarak) bir sorgu girdiğinde, sistem dizinini kontrol eder ve en alakalı web sayfalarının bir listesini (bazı kriterlere göre sıralanmış), genellikle belgenin başlığını ve bazen metnin parçaları. Arama dizini, web sayfalarından çıkarılan bilgilere dayalı özel bir tekniğe göre oluşturulmuştur. 2007'den beri Google arama motoru zamana göre arama yapmanızı, istediğiniz belgeleri oluşturmanızı sağlar ("Arama Araçları" menüsünü çağırın ve zaman aralığını belirtin). Çoğu arama motoru, aranan anahtar sözcüklerin listesini iyileştirmenize veya genişletmenize olanak tanıyan, sorgularda Boolean AND, OR, NOT operatörlerinin kullanımını destekler. Bu durumda, sistem kelimeleri veya cümleleri tam olarak girildiği gibi arayacaktır. Bazı arama motorları izin verir yaklaşık arama, bu durumda kullanıcılar, anahtar kelimelere olan mesafeyi belirterek arama alanını genişletir. Ayrıca orada kavramsal arama, hangi kullanır istatistiksel analiz aranan kelime ve deyimlerin web sayfalarının metinlerinde kullanılması. Bu sistemler, sorguları doğal dilde oluşturmanıza olanak tanır. Böyle bir arama motorunun bir örneği, ask com web sitesidir.

    Bir arama motorunun kullanışlılığı, bulduğu sayfaların alaka düzeyine bağlıdır. Milyonlarca web sayfası bir kelime veya kelime öbeği içerebilirken, bazıları diğerlerinden daha ilgili, popüler veya yetkili olabilir. Çoğu arama motoru, "en iyi" sonuçları listenin başına getirmek için sıralama yöntemlerini kullanır. Arama motorları hangi sayfaların daha alakalı olduğuna ve sonuçların hangi sırayla farklı şekillerde gösterilmesi gerektiğine karar verir. İnternetin kendisi gibi arama yöntemleri de zamanla değişir. Böylece, iki ana arama motoru türü ortaya çıktı: önceden tanımlanmış ve hiyerarşik olarak sıralanmış anahtar kelimelerden oluşan sistemler ve metin analizine dayalı olarak ters bir indeksin oluşturulduğu sistemler.

    Çoğu arama motoru, reklamlardan kar elde eden ticari işletmelerdir, bazı arama motorlarında belirli bir anahtar kelime için üst sıraları bir ücret karşılığında satın alabilirsiniz. Sonuç sıralaması için ücret talep etmeyen arama motorları, içeriğe dayalı reklamcılık, reklam mesajları ise kullanıcının isteğine karşılık gelir. Bu tür reklamlar, bir arama sonuçları listesiyle birlikte sayfada görüntülenir ve arama motorları, bir kullanıcı reklam mesajlarını her tıkladığında kazanır.

    Arama Motoru Türleri

    Dört tür arama motoru vardır: robotik, insan güdümlü, hibrit ve meta sistemler.

    • arama robotlarını kullanan sistemler
    Üç bölümden oluşurlar: bir paletli ("bot", "robot" veya "örümcek"), bir dizin ve bir arama motoru yazılımı. Tarayıcı, ağı atlamak ve web sayfalarının listelerini oluşturmak için gereklidir. dizin - büyük arşiv web sayfalarının kopyaları. Hedef yazılım- Arama sonuçlarını değerlendirin. Bu mekanizmadaki tarayıcının sürekli olarak ağı keşfetmesi nedeniyle bilgiler daha günceldir. Modern arama motorlarının çoğu bu türden sistemlerdir.
    • insan kontrollü sistemler (kaynak katalogları)
    Bu arama motorları, web sayfalarının listelerini alır. Dizin bir adres, bir başlık ve Kısa Açıklama alan. Kaynak kataloğu, yalnızca web yöneticileri tarafından kendisine gönderilen sayfa açıklamalarındaki sonuçları arar. Dizinlerin avantajı, tüm kaynakların manuel olarak kontrol edilmesidir, bu nedenle içeriğin kalitesi, birinci tür sistem tarafından otomatik olarak elde edilen sonuçlara kıyasla daha iyi olacaktır. Ancak bir dezavantaj da var - bu dizinlerin güncellenmesi manuel olarak yapılır ve önemli ölçüde geride kalabilir gerçek durum işler. Sayfa sıralamaları anında değişemez. Bu tür sistemlerin örnekleri şunlardır: Yahoo dizini, dmoz ve Galaksi.
    • hibrit sistemler
    Yahoo, Google, MSN gibi arama motorları, arama robotları ve insan kontrollü sistemler kullanan sistemlerin fonksiyonlarını birleştirir.
    • meta sistemler
    Meta arama motorları, birkaç arama motorunun sonuçlarını aynı anda birleştirir ve sıralar. Bu arama motorları, her arama motorunun benzersiz dizin ve arama motorları daha az "akıllıydı". Arama artık çok geliştiği için bunlara olan ihtiyaç azaldı. Örnekler: Meta Paletli ve MSN Arama.

    Arama motoru pazarı

    Google, %68,69'luk pazar payıyla dünyanın en popüler arama motorudur. Bing ikinci sırada yer alıyor, payı %12,26.

    Dünyanın en popüler arama motorları:

    Arama sistemi Temmuz 2014'te pazar payı Ekim 2014 Pazar payı Eylül 2015 Pazar payı
    Google 68,69 % 58.01 % 69.24%
    Baidu 17,17 % 29.06 % 6,48%
    bing 6.22 % 8.01 % 12,26%
    yahoo! 6.74 % 4.01 % 9,19%
    AOL 0,13 % 0.21 % 1,11%
    Heyecanlandırmak 0.22 % 0,00 % 0.00%
    Sormak 0,13 % 0,10 % 0,24%

    Asya

    Doğu Asya ülkelerinde ve Rusça Google- en popüler arama motoru değil. Örneğin Çin'de daha popüler Soso arama motoru.

    İÇİNDE Güney Kore sakinlerinin yaklaşık %70'i Naver'in kendi arama portalını kullanıyor. Japonya ve Yahoo! Tayvan, sırasıyla Japonya ve Tayvan'daki en popüler arama motorlarıdır.

    Rusya ve Rusça arama motorları

    Rusça arama sorgularının kapsamına ilişkin Haziran 2015'teki LiveInternet verilerine göre:

    • Tüm dillerde:
      • yahoo! (%0,1) ve bu şirketin sahip olduğu arama motorları: Inktomi, AltaVista , Tüm web
    • İngilizce konuşan ve uluslararası:
      • Askjeeves(Teoma mekanizması)
    • Rusça konuşan - "Rusça konuşan" arama motorlarının çoğu birçok dilde - Ukraynaca, Beyaz Rusça, İngilizce, Tatarca ve diğerleri - indeksler ve metinleri arar. Tüm belgeleri arka arkaya dizine ekleyen "tüm dilleri içeren" sistemlerden farklıdırlar, çünkü esas olarak Rusça'nın hakim olduğu etki alanlarında bulunan kaynakları dizine eklerler veya robotlarını Rusça sitelerle sınırlandırırlar.

    Bazı arama motorları harici arama algoritmaları kullanır.

    Nicel Google Arama Motoru Verileri

    İnternet kullanıcılarının ve arama motorlarının sayısı ve bu sistemler için kullanıcı gereksinimleri sürekli artmaktadır. Gerekli bilgileri arama hızını artırmak için büyük arama motorları çok sayıda sunucu içerir. Sunucular genellikle sunucu merkezleri (veri merkezleri) halinde gruplanır. Popüler arama motorları, tüm dünyaya dağılmış sunucu merkezlerine sahiptir.

    Ekim 2012'de Google, kullanıcılara şirketin veri merkezlerini tanıma fırsatı verilen İnternetin Yaşadığı Yer projesini başlattı.

    Google arama motoru, veri merkezlerinin çalışması hakkında şunları bilir:

    • 2011 itibariyle tüm Google veri merkezlerinin toplam kapasitesinin 220 MW olduğu tahmin ediliyor.
    • 2008'de ne zaman Google yılı Oregon'da toplam 6,5 milyon m² alana sahip üç binadan oluşan yeni bir kompleks açmayı planlayan Harper's Magazine, böylesine büyük bir kompleksin 100 MW'ın üzerinde elektrik tükettiğini hesapladı ki bu da bir enerji tüketimi ile karşılaştırılabilir. 300.000 kişilik şehir.
    • 2012'deki tahmini Google sunucusu sayısı 1.000.000'dir.
    • Google'ın veri merkezlerine yaptığı harcama 2006'da 1,9 milyar dolar ve 2007'de 2,4 milyar dolardı.

    Aralık 2014 itibariyle Google tarafından indekslenen World Wide Web'in boyutu yaklaşık 4.36 milyar sayfadır.

    Dini yasakları dikkate alan arama motorları

    İnternetin küresel yayılımı ve popülaritesinin artması elektronik aletler Arap ve Müslüman dünyasında, özellikle Orta Doğu ve Hindistan Yarımadası ülkelerinde, İslami gelenekleri dikkate alan yerel arama motorlarının gelişmesine katkıda bulunmuştur. Bu tür arama motorları, kullanıcıların pornografi içeren siteler gibi yasaklanmış sitelere girmemesine yardımcı olan ve yalnızca içeriği İslam inancına aykırı olmayan siteleri kullanmalarına izin veren özel filtreler içerir. Ramazan ayından kısa bir süre önce, Temmuz 2013'te dünya tanıtıldı helal arama- Google ve Bing gibi diğer arama motorlarından alınan arama sonuçlarını filtreleyerek kullanıcılara yalnızca helal "doğru" bağlantılar veren bir sistem. İki yıl önce, Eylül 2011'de Orta Doğu'daki kullanıcılara hizmet vermek üzere I'mHalal arama motoru hizmete girdi. Ancak sahibine göre bu arama hizmeti, finansman yetersizliği nedeniyle kısa süre içinde kapatılmak zorunda kaldı.

    İslam dünyasında yatırım eksikliği ve teknolojinin yavaş yayılması ilerlemeyi engelledi ve ciddi bir İslami arama motorunun başarısını engelledi. Müslüman yaşam tarzı web projelerine yapılan büyük yatırımların başarısızlığı, bunlardan biri Müslüman. Rite Internet Ventures gibi yatırımcılardan milyonlarca dolar aldı ve şimdi - I'mHalal'ın kapatılmadan önceki son gönderisine göre - "bir sonraki Facebook veya Google'ın yalnızca Orta Doğu'da olabileceği" gibi şüpheli bir fikirle geliyor. . parlak gençliğimizi desteklerseniz." Bununla birlikte, İslami internet uzmanları yıllardır şeriata uygun olup olmadığını belirlemekle ve web sitelerini "helal" veya "haram" olarak sınıflandırmakla meşguller. Tüm eski ve yeni İslami arama motorları, yalnızca özel olarak indekslenmiş bir veri kümesidir veya Google, Yahoo ve Bing gibi, kullanıcıların çıplaklık hakkında siteler gibi haram sitelere erişmesini engellemek için kullanılan bir tür filtreleme sistemi olan büyük arama motorlarıdır. LGBT, kumar ve İslam karşıtı sayılan her şey.

    Diğer din odaklı arama motorları arasında, Google'ın Yahudi versiyonu olan Jewogle ve kullanıcıları inançlarını zayıflatabilecek veya zayıflatabilecek içerikten uzak tutan filtreler içeren bir Hristiyan sitesi olan SeekFind.org yaygındır.

    Kişisel sonuçlar ve filtre balonları

    Google ve Bing gibi birçok arama motoru, bir kullanıcının sistemdeki geçmiş faaliyetlerine dayanarak hangi bilgileri görmek istediğini seçici olarak tahmin etmek için algoritmalar kullanır. Sonuç olarak, web siteleri yalnızca kullanıcının geçmiş ilgi alanlarıyla tutarlı bilgiler gösterir. Bu etkiye "filtre balonu" denir.

    Tüm bunlar, kullanıcıların kendi bakış açılarıyla çelişen çok daha az bilgi almalarına ve kendi “bilgi balonlarında” entelektüel olarak izole olmalarına yol açar. Bu nedenle, "kabarcık etkisi" sivil kanaatin oluşumu için olumsuz sonuçlar doğurabilir.

    Arama motoru önyargısı

    Arama motorları, web sitelerini popülerlik ve alaka düzeyine göre sıralamak üzere programlanmış olsa da, gerçek şu ki, deneysel araştırmalar çeşitli siyasi, ekonomik ve sosyal faktörlerin SERP'leri etkilediğini gösteriyor.

    Bu önyargı, ekonomik ve ticari süreçlerin doğrudan bir sonucu olabilir: Bir arama motorunda reklam veren şirketler, o arama motorundaki organik arama sonuçlarında daha popüler hale gelebilir. Yerel yasalara uymayan arama sonuçlarının kaldırılması, siyasi süreçlerin etkisinin bir örneğidir. Örneğin, Google, Holokost inkarının yasa dışı olduğu Fransa ve Almanya'da bazı neo-Nazi web sitelerini görüntülemeyecektir.

    Arama motoru algoritmaları genellikle daha "popüler" sonuçlar lehine biçimlendirilmemiş bakış açılarını dışlamak üzere tasarlandığından, önyargı sosyal süreçlerin bir sonucu olabilir. Büyük arama motorlarının indeksleme algoritmaları Amerikan sitelerine öncelik verir.

    Arama bombası, arama sonuçlarını siyasi, sosyal veya ticari nedenlerle manipüle etme girişimlerine bir örnektir.

    Ayrıca bakınız

    • Qwika
    • Elektronik kütüphane#Listeler kütüphaneler ve arama sistemleri
    • Web geliştirici araç çubuğu

    notlar

    Edebiyat

    • Ashmanov I. S., Ivanov A.A. Arama motorlarında web sitesi tanıtımı. - M. : Williams, 2007. - 304 s. - ISBN 978-5-8459-1155-1.
    • Baykov V.D.İnternet. Bilgi arayın. Web sitesi tanıtımı. Petersburg. : BHV-Petersburg, 2000. - 288 s. - ISBN 5-8206-0095-9.
    • Kolisnichenko D.N.İnternette arama motorları ve web sitesi tanıtımı. - M.: Diyalektik, 2007. - 272 s. - ISBN 978-5-8459-1269-5.
    • Lande D.V.İnternette bilgi arayın. - M. : Diyalektik, 2005. - 272 s. - ISBN 5-8459-0764-0.
    • Lande D.V., Snarsky A. A., Bezsudnov I.V.İnternet: Karmaşık ağlarda gezinme modeller ve algoritmalar. - M.: Librokom (Editoryal URSS), 2009. - 264 s. - ISBN 978-5-397-00497-8.
    • Chu H., Rosenthal M. World Wide Web için arama motorları: Karşılaştırmalı çalışma ve değerlendirme metodolojisi (İngilizce) // YILLIK TOPLANTI-AMERİKAN TOPLULUĞU BİLGİ BİLİMİ İÇİN TUTANAKLAR: dergi. - 1996. - Cilt. 33 . - S.127-135.
    • Gandal, Neil.İnternet arama motoru pazarındaki rekabet dinamikleri. - 2001. - Cilt. 19. - S. 1103–1117. -

    Arama motorları (PS) uzun süredir internetin vazgeçilmez bir parçası olmuştur. Bugün bunlar, herhangi bir şeyi bulmak için yalnızca bir araç olmayan devasa ve karmaşık mekanizmalardır. gerekli bilgi, aynı zamanda iş için oldukça heyecan verici alanlar.


    Birçok arama kullanıcısı, çalışmalarının ilkelerini, kullanıcı isteklerinin nasıl işlendiğini, bu sistemlerin nasıl kurulduğunu ve çalıştığını hiç düşünmemiştir. Bu materyal, optimizasyonla uğraşan ve cihazı ve arama motorlarının ana işlevlerini anlayan kişilere yardımcı olacaktır.

    PS'nin işlevleri ve konsepti

    Arama sistemiİnternette arama işlevini gerçekleştirmek ve genellikle bir metin cümlesi (veya daha doğrusu) biçiminde ayarlanan bir kullanıcı isteğine yanıt vermek için tasarlanmış bir donanım-yazılım kompleksidir. arama sorgusu), alaka düzeyine göre yürütülen bilgi kaynaklarına bir referans listesi yayınlamak. En yaygın ve büyük sistemler Arama: Google, Bing, Yahoo, Baidu. Runet'te - Yandex, Mail.Ru, Rambler.

    Yandex sistemini örnek alarak arama sorgusunun anlamına daha yakından bakalım.

    Talep, kullanıcı tarafından aramasının konusuna tam olarak uygun olarak, mümkün olduğunca basit ve öz bir şekilde formüle edilmelidir. Örneğin, bu arama motorunda şu bilgileri bulmak istiyoruz: "Kendiniz için bir araba nasıl seçilir." Bunu yapmak için açın ana sayfa ve "nasıl araba seçilir" aramak için bir sorgu girin. Ardından işlevlerimiz, ağdaki bilgi kaynaklarına sağlanan bağlantıları izlemeye indirgenir.




    Ancak bu şekilde davransak bile ihtiyacımız olan bilgiyi alamayabiliriz. Böyle olumsuz bir sonuç alırsak, sorgumuzu yeniden formüle etmemiz gerekiyor veya arama tabanında gerçekten yararlı bir bilgi yok. bu tür istek ("Anadyr'de araba nasıl seçilir" gibi verilen "dar" sorgu parametreleriyle bu oldukça mümkündür).

    Her arama motorunun en temel görevi, tam olarak insanların ihtiyaç duyduğu türden bilgileri sunmaktır. Ve kullanıcıları arama motorlarına "doğru" türde sorgular, yani çalışma ilkelerine karşılık gelecek ifadeler oluşturmaya alıştırmak neredeyse imkansızdır.

    Bu nedenle, arama motoru geliştiricileri, çalışmalarının, kullanıcıların ilgilendikleri bilgileri bulmalarını sağlayacak bu tür ilkeleri ve algoritmaları oluşturur. Bu, sistemin bir kişinin İnternette gerekli bilgileri ararken düşündüğü gibi "düşünmesi" gerektiği anlamına gelir.

    Sorgusunu bir arama motoruna girdiğinde, istediğini olabildiğince kolay ve hızlı bir şekilde bulmak ister. Sonucu aldıktan sonra, kullanıcı birkaç kritere göre sistem değerlendirmesini yapar. bulmayı başardı mı gerekli bilgi? Değilse, onu bulmak için sorgu metnini kaç kez yeniden biçimlendirmesi gerekti? Alınan bilgiler ne kadar günceldi? Arama motoru talebini ne kadar hızlı işleme aldı? Sağlanan arama sonuçları ne kadar kullanışlıydı? Buradaydı İstenen sonuç birinci mi yoksa 30. sırada mıydı? Yararlı bilgilerle birlikte ne kadar "çöp" (gereksiz bilgi) bulundu? PS'yi kullanırken, bir hafta içinde veya bir ay içinde onun için ilgili bilgiler olacak mı?




    Bu tür sorulara doğru cevapları alabilmek için arama geliştiricileri, sıralama ilkelerini ve algoritmalarını sürekli olarak geliştirmekte, bunlara yeni özellikler ve işlevler eklemekte ve her ne pahasına olursa olsun sistemin daha hızlı çalışmasını sağlamaya çalışmaktadır.

    Arama motorlarının temel özellikleri

    Aramanın ana özelliklerini belirleyelim:

    bütünlük

    Tamlık, aramanın en önemli özelliklerinden biridir, sorgu tarafından bulunan sayıların oranıdır. bilgi belgeleri ile ilgili internetteki toplam sayılarına bu istek. Örneğin, ağda "nasıl araba seçilir" ifadesini içeren 100 sayfa var ve aynı sorgu için toplam sayının yalnızca 60'ı seçildi, bu durumda arama hatırlaması 0,6 olacaktır. Aramanın kendisi ne kadar eksiksiz olursa, kullanıcının tam olarak ihtiyaç duyduğu belgeyi, elbette varsa, bulma olasılığının o kadar yüksek olduğu açıktır.

    Kesinlik.

    Bir arama motorunun bir diğer önemli işlevi de doğruluktur. Web üzerinde bulunan sayfaların kullanıcının isteğine uygunluk derecesini belirler. Örneğin, "bir araba nasıl seçilir" anahtar ifadesi için yüzlerce belge varsa, bunların yarısı bu ifadeyi içerir ve geri kalanında bu tür kelimeler bulunur (bir araba radyosu nasıl doğru seçilir ve bir arabaya nasıl kurulur) ), o zaman arama doğruluğu 50/100 = 0,5'e eşittir.

    Arama ne kadar doğru olursa, kullanıcı ihtiyaç duyduğu bilgileri o kadar çabuk bulur, sonuçlar arasında o kadar az çeşitli "çöp" bulunur, bulunan belgeler talebin anlamına karşılık gelmez.

    alaka.

    Bu, bilginin internette yayınlandığı andan arama motorunun indeks tabanına girilmesine kadar geçen süre ile karakterize edilen aramanın önemli bir bileşenidir.

    Örneğin, çıkışla ilgili bilgilerin ertesi günü yeni iPad, birçok kullanıcı ilgili sorgu türleriyle aramaya yöneldi. Çoğu durumda, bu haberle ilgili bilgiler, ortaya çıkışından bu yana çok az zaman geçmesine rağmen, aramada zaten mevcuttur. Bunun nedeni, günde birkaç kez güncellenen "hızlı bir veritabanına" sahip olan büyük arama motorlarıdır.

    Arama hızı.

    Arama hızı gibi bir işlev, sözde "yük toleransı" ile yakından ilgilidir. Her saniye, çok sayıda insan aramaya yöneliyor, bu tür bir iş yükü, bir talebi işleme koyma süresinde önemli bir azalma gerektiriyor. Burada, hem arama motorunun hem de kullanıcının çıkarları tamamen örtüşür: ziyaretçi, sonuçları olabildiğince çabuk almak ister ve arama motoru, sonraki isteklerin işlenmesini yavaşlatmamak için isteğini olabildiğince çabuk işlemelidir.

    görünürlük

    Sonuçların görsel sunumu, arama kolaylığının temel bir unsurudur. Birçok sorgu için, arama motoru binlerce ve bazı durumlarda milyonlarca bulur. çeşitli belgeler. Arama için anahtar ifadelerin derlenmesinin belirsizliği veya yanlışlığı nedeniyle, ilk sorgu sonuçları bile her zaman yalnızca gerekli bilgileri içermez.

    Bu, bir kişinin genellikle sağlanan sonuçlar arasında kendi aramasını yapması gerektiği anlamına gelir. PS düzenleme sayfalarının çeşitli bileşenleri, arama sonuçlarında gezinmenize yardımcı olur.

    Arama motorlarının geçmişi

    İnternet ilk gelişmeye başladığında, düzenli kullanıcılarının sayısı azdı ve erişilecek bilgi miktarı nispeten azdı. Temel olarak, yalnızca araştırma alanlarındaki uzmanların bu ağa erişimi vardı. O zamanlar bilgi bulma görevi şimdi olduğu kadar alakalı değildi.

    Bilgi kaynaklarına geniş erişimi organize etmenin ilk yöntemlerinden biri, site kataloglarının oluşturulmasıydı ve bunlara bağlantılar konuya göre gruplandırılmaya başlandı. 1994 baharında açılan Yahoo.com kaynağı böyle bir ilk proje oldu. Daha sonra Yahoo dizinindeki sitelerin sayısı önemli ölçüde artınca dizinde gerekli bilgileri arama seçeneği eklendi. Henüz tam teşekküllü bir arama motoru değildi, çünkü böyle bir aramanın kapsamı yalnızca bu dizinde yer alan sitelerle sınırlıydı ve kesinlikle İnternet'teki tüm kaynaklarla sınırlı değildi. Bağlantı dizinleri geçmişte çok yaygın olarak kullanılıyordu, ancak günümüzde popülerliklerini neredeyse tamamen kaybettiler.

    Ne de olsa günümüzün devasa kataloglarında bile internetteki sitelerin küçük bir kısmı hakkında bilgi var. Dünyanın en ünlü ve en büyük dizini beş milyon site hakkında bilgi içerirken, Google veritabanı 25 milyardan fazla sayfa hakkında bilgi içerir.




    İlk gerçek arama motoru, 1994 yılında ortaya çıkan WebCrawler'dı.

    AltaVista ve Lycos ertesi yıl ortaya çıktı. Üstelik birincisi, çok uzun süre bilgi aramada liderdi.




    1997'de Sergey Brin, Larry Page ile birlikte Stanford Üniversitesi'nde bir araştırma projesi olarak Google arama motorunu yarattı. Bugün Google, dünyanın en popüler ve popüler arama motorudur.




    Eylül 1997'de, şu anda en çok kullanılan Yandex PS (resmi olarak) duyuruldu. popüler sistem RuNet'te arama yapın.




    Buna göre Eylül 2015, arama motorlarının dünyadaki payları şu şekilde dağılıyor:
    • Google - %69,24;
    • Bing - %12,26;
    • yahoo! - %9.19;
    • Baidu - %6,48;
    • AOL - %1,11;
    • Sor - %0,23;
    • Heyecan - %0.00


    Buna göre Aralık 2016, Runet'teki arama motorlarının paylaşımları:

    • Yandex - %48,40
    • Google - %45,10
    • Search.Mail.ru - %5,70
    • Gezici - %0,40
    • Bing - %0,30
    • Yahoo - %0,10

    Arama motoru ilkeleri

    Rusya'da ana sistem arama Yandex, ardından Google ve ardından [email protected]'dur. Tüm büyük arama motorlarının diğerlerinden oldukça farklı olan kendi yapıları vardır. Ancak yine de, tüm arama motorlarında ortak olan ana unsurları ayırmak mümkündür.

    İndeksleme modülü.

    Bu bileşen üç robottan oluşur:

    Örümcek(İngilizcede örümcek) - web sayfalarını indirmek için tasarlanmış bir program. "Örümcek" belirli bir sayfayı indirir ve aynı anda tüm bağlantıları çıkarır. indiriliyor HTML Kodu hemen hemen her sayfadan Bunu yapmak için robotlar HTTP protokollerini kullanır.




    "Örümcek" aşağıdaki gibi çalışır. Robot, sunucuya "get/path/document" ve diğer HTTP istek komutlarına bir istek gönderir. Yanıt olarak robot programı, bir hizmet türü ve tabii ki belgenin kendisini içeren bilgileri içeren bir metin akışı alır.
    • İndirilen sayfanın URL'si;
    • sayfanın indirildiği tarih;
    • sunucu http yanıt başlığı;
    • html kodu, sayfanın "gövdesi".
    Paletli("seyahat eden" örümcek). Bu program sayfada bulunan tüm bağlantıları otomatik olarak ziyaret eder ve ayrıca bunları vurgular. Görevi, bu bağlantılara veya belirli bir adres listesine dayanarak örümceğin gelecekte nereye gitmesi gerektiğini belirlemektir.

    indeksleyici(İndeksleme botu), örümcekler tarafından indirilen sayfaları analiz eden bir programdır.



    Dizin oluşturucu, sayfayı bileşen öğelerine tamamen ayrıştırır ve bunları kendi morfolojik ve sözcüksel algoritma türlerini kullanarak analiz eder.

    Başlıklar, metin, bağlantılar, stil ve yapısal özellikler gibi sayfanın çeşitli bölümlerinde analiz yapılır, html etiketleri ve benzeri.

    Böylece indeksleme modülü, belirli sayıda kaynağın bağlantılarını takip etmeyi, sayfaları indirmeyi, alınan belgelerden yeni sayfalara bağlantı kütlesini çıkarmayı ve bunların ayrıntılı bir analizini yapmayı mümkün kılar.

    Veri tabanı

    Veri tabanı(veya arama motoru dizini) - bir veri depolama kompleksi, dizin oluşturma modülü tarafından işlenen her birinin parametrelerinin ve indirilen belgenin belirli bir şekilde saklandığı bir bilgi dizisi.

    arama sunucusu

    Bu en çok önemli unsurçünkü aramanın hızı ve tabii ki kalitesi doğrudan işlevselliğinin altında yatan algoritmalara bağlıdır.

    Arama sunucusu şu şekilde çalışır:

    • Kullanıcıdan gelen istek morfolojik analize tabi tutulur. Veritabanında bulunan herhangi bir belgenin bilgi ortamı oluşturulur (ayrıca bir snippet olarak, yani bu talebe karşılık gelen metnin bir bilgi alanı olarak görüntülenecektir).
    • Alınan veriler, özel bir sıralama modülüne giriş parametreleri olarak iletilir. Tüm belgeler için işlenirler ve sonuç olarak, bu tür her belge için, böyle bir belgenin kullanıcının isteği ve diğer bileşenlerle alaka düzeyini karakterize eden kendi derecelendirmesi hesaplanır.
    • Kullanıcı tarafından ayarlanan koşullara bağlı olarak, bu derecelendirme başkaları tarafından iyi bir şekilde ayarlanabilir.
    • Ardından snippet'in kendisi oluşturulur, yani. Bulunan herhangi bir belge için, sorguya en çok uyan başlık, ek açıklama ve bu belgeye bir bağlantı ilgili tablodan çıkarılırken bulunan sözcük biçimleri ve sözcükler vurgulanır.
    • Alınan aramanın sonuçları, arama sonuçlarının (SERP) yayınlandığı bir sayfa biçiminde bunu yapan kişiye iletilir.
    Tüm bu unsurlar birbiriyle yakından bağlantılıdır ve işlev görür, etkileşime girer, PS'nin işleyişi için büyük kaynak harcamaları gerektiren ayrı ama oldukça karmaşık bir mekanizma oluşturur.