• Dünyadaki popüler arama motorları. arama motorları nelerdir

    Bu nedir

    DuckDuckGo oldukça iyi bilinen bir açık kaynaklı arama motorudur. kaynak kodu. Sunucular ABD'de bulunmaktadır. Arama motoru, kendi robotuna ek olarak diğer kaynakların sonuçlarını kullanır: Yahoo, Bing, Wikipedia.

    Daha iyi

    DuckDuckGo, kendisini nihai gizlilik ve gizlilik araması olarak konumlandırır. Sistem, kullanıcı hakkında herhangi bir veri toplamaz, günlük tutmaz (arama geçmişi yok), kullanım kurabiye maksimum sınırlı.

    DuckDuckGo, kullanıcılardan kişisel bilgi toplamaz veya paylaşmaz. Bu bizim gizlilik politikamızdır.

    DuckDuckGo'nun kurucusu Gabriel Weinberg

    Buna ne için ihtiyacın var

    Tüm büyük arama motorları, arama sonuçlarını monitörün önündeki kişi hakkındaki verilere dayanarak kişiselleştirmeye çalışır. Bu fenomene "filtre balonu" denir: kullanıcı yalnızca tercihleriyle tutarlı olan veya sistemin böyle düşündüğü sonuçları görür.

    Web'deki geçmiş davranışınıza bağlı olmayan nesnel bir resim oluşturur ve tematik sorunları ortadan kaldırır. google reklamları ve isteklerinize göre "Yandex". DuckDuckGo sayesinde yabancı dillerde bilgi aramak kolaylaşırken Google ve Yandex, sorgu başka bir dilde girilse bile varsayılan olarak Rusça siteleri tercih ediyor.


    Bu nedir

    not Evil, anonim Tor ağında arama yapan bir sistemdir. Kullanmak için, örneğin özel bir .

    Not Evil, türünün tek arama motoru değildir. LOOK (Tor tarayıcısında normal İnternet'ten erişilebilen varsayılan arama) veya TORCH (Tor ağındaki en eski arama motorlarından biri) ve diğerleri vardır. Google'a açıkça atıfta bulunulması nedeniyle Evil değil'de karar kıldık (sadece başlangıç ​​sayfasına bakın).

    Daha iyi

    orada aranıyor google nerede, "Yandex" ve diğer arama motorları prensip olarak kapatılmıştır.

    Buna ne için ihtiyacın var

    Tor ağında, yasalara uyan İnternette bulunamayan birçok kaynak vardır. Ve yetkililerin Web içeriği üzerindeki kontrolü sıkılaştıkça sayıları artacaktır. Tor, sosyal ağları, torrent izleyicileri, medyası, pazar yerleri, blogları, kitaplıkları vb. ile Web içinde bir tür ağdır.

    3. YaCy

    Bu nedir

    YaCy, P2P ağları prensibiyle çalışan merkezi olmayan bir arama motorudur. Birincil olan her bilgisayar yazılım modülü, interneti kendi başına tarar, yani bir arama robotunun analogudur. Elde edilen sonuçlar, tüm YaCy katılımcıları tarafından kullanılan ortak bir veri tabanında toplanır.

    Daha iyi

    YaCy, aramayı organize etmek için tamamen farklı bir yaklaşım olduğu için burada bunun daha iyi mi yoksa daha kötü mü olduğunu söylemek zor. Tek bir sunucu ve sahip şirketin olmaması, sonuçları herhangi birinin tercihinden tamamen bağımsız hale getirir. Her düğümün özerkliği sansürü hariç tutar. YaCy, derin web'de ve dizine eklenmemiş genel ağlarda arama yapabilir.

    Buna ne için ihtiyacın var

    Açık kaynaklı yazılımların ve devlet kurumlarının ve büyük şirketlerin etkisinde olmayan ücretsiz İnternetin destekçisiyseniz, YaCy sizin seçiminizdir. Aynı zamanda bir şirket içinde veya diğer bir aramayı organize etmek için de kullanılabilir. çevrimdışı ağ. Ve YaCy günlük yaşamda çok kullanışlı olmasa da buna değer. Google'a alternatif Arama süreci açısından.

    4. Pipl

    Bu nedir

    Pipl, belirli bir kişi hakkında bilgi aramak için tasarlanmış bir sistemdir.

    Daha iyi

    Pipl'in yazarları, özel algoritmalarının "normal" arama motorlarından daha verimli arama yaptığını iddia ediyor. Özellikle sosyal ağ profilleri, yorumlar, katılımcı listeleri ve mahkeme kararları veritabanları gibi kişiler hakkında bilgilerin yayınlandığı çeşitli veritabanlarına öncelik verilmektedir. Pipl'in bu alandaki liderliği Lifehacker.com, TechCrunch ve diğer yayınlar tarafından onaylanmıştır.

    Buna ne için ihtiyacın var

    ABD'de yaşayan bir kişi hakkında bilgi bulmanız gerekiyorsa, Pipl çok daha fazla olacaktır. Google'dan daha verimli. Görünüşe göre Rus mahkemelerinin veritabanlarına arama motoru erişemiyor. Bu nedenle Rusya vatandaşlarıyla pek iyi baş edemiyor.

    Bu nedir

    FindSounds başka bir özel arama motorudur. Açık kaynaklarda çeşitli sesler arar: ev, doğa, arabalar, insanlar vb. Hizmet, Rusça istekleri desteklemiyor, ancak arayabileceğiniz etkileyici bir Rusça etiketler listesi var.

    Daha iyi

    Sadece seslerin verilmesinde ve daha fazlası değil. Ayarlarda istediğiniz formatı ve ses kalitesini ayarlayabilirsiniz. Bulunan tüm sesler indirilebilir. Model arama var.

    Buna ne için ihtiyacın var

    Bir tüfek atışının sesini, emen bir ağaçkakanın sesini veya Homer Simpson'ın ağlamasını hızlı bir şekilde bulmanız gerekiyorsa, bu hizmet tam size göre. Ve bunu yalnızca mevcut Rusça sorgulardan seçtik. İngilizce'de, spektrum daha da geniştir.

    eğer ciddiyse, özel servisözel bir kitle önerir. Ama senin için de kullanışlı olacak mı?

    Bu nedir

    Wolfram|Alpha hesaplamalı bir arama motorudur. Anahtar kelime içeren makalelere link vermek yerine kullanıcının isteğine hazır cevap verir. Örneğin, İngilizce olarak "New York ve San Francisco'nun nüfusunu karşılaştırın" arama formunu girerseniz, Wolfram|Alpha hemen karşılaştırmalı tabloları ve grafikleri görüntüler.

    Daha iyi

    Bu hizmet, gerçekleri bulmak ve verileri hesaplamak için diğerlerinden daha iyidir. Wolfram|Alpha, bilim, kültür ve eğlence dahil olmak üzere çeşitli alanlardan Web'de bulunan bilgileri toplar ve düzenler. Bu veritabanı bir arama sorgusuna hazır bir cevap içeriyorsa sistem bunu gösterir, yoksa hesaplar ve sonucu görüntüler. Bu durumda, kullanıcı yalnızca görür ve daha fazlasını görmez.

    Buna ne için ihtiyacın var

    Örneğin bir öğrenci, analist, gazeteci veya araştırmacıysanız, faaliyetlerinize ilişkin verileri bulmak ve hesaplamak için Wolfram|Alpha'yı kullanabilirsiniz. Hizmet tüm istekleri anlamıyor, ancak sürekli gelişiyor ve daha akıllı hale geliyor.

    Bu nedir

    Meta arama motoru Dogpile, Google, Yahoo ve diğer popüler arama motorlarından alınan sonuçların birleştirilmiş bir listesini görüntüler.

    Daha iyi

    Birincisi, Dogpile daha az reklam gösteriyor. İkincisi, hizmet bulmak ve görüntülemek için özel bir algoritma kullanır. En iyi skorlar farklı arama motorlarından Dogpile geliştiricilerine göre, sistemleri tüm İnternet'teki en eksiksiz sorunu oluşturuyor.

    Buna ne için ihtiyacın var

    Google'da veya başka bir standart arama motorunda bilgi bulamıyorsanız, Dogpile'ı kullanarak birkaç arama motorunda aynı anda arayın.

    Bu nedir

    BoardReader forumlar, Soru-Cevap hizmetleri ve diğer topluluklar için bir metin arama sistemidir.

    Daha iyi

    Hizmet, arama alanını sosyal sitelere daraltmanıza olanak tanır. Özel filtreler sayesinde dil, yayın tarihi ve site adı gibi kriterlerinize uyan gönderileri ve yorumları hızlı bir şekilde bulabilirsiniz.

    Buna ne için ihtiyacın var

    BoardReader, halkla ilişkiler uzmanları ve belirli konularda kitle iletişim araçlarının görüşüyle ​​ilgilenen diğer medya profesyonelleri için yararlı olabilir.

    Nihayet

    Alternatif arama motorlarının ömrü genellikle kısacıktır. Lifehacker, Yandex şirketinin Ukrayna şubesinin eski CEO'su Sergey Petrenko'ya bu tür projelerin uzun vadeli beklentilerini sordu.


    Sergey Petrenko

    Önceki CEO"Yandex.Ukrayna".

    Alternatif arama motorlarının kaderine gelince, basit: küçük bir izleyici kitlesine sahip çok niş projeler olmak, bu nedenle net ticari beklentiler olmadan veya tersine, yokluklarının tam netliği ile.

    Makaledeki örneklere bakarsanız, bu tür arama motorlarının ya dar ama talep gören bir nişte uzmanlaştığını ve belki de yalnızca şimdiye kadar Google veya Yandex radarlarında farkedilecek kadar büyümediğini görebilirsiniz. veya geleneksel aramada henüz uygulanamayan orijinal bir hipotezi sıralamada test ediyorlar.

    Örneğin, bir Tor araması aniden talep görürse, yani Google izleyicisinin en azından bir yüzdesi oradan sonuçlara ihtiyaç duyacaksa, o zaman elbette sıradan arama motorları nasıl yapılacağı sorununu çözmeye başlayacaktır. onları bulun ve kullanıcıya gösterin. Kitlenin davranışı, önemli sayıda sorguda kullanıcıların önemli bir bölümünün, kullanıcıya bağlı faktörleri hesaba katmadan daha alakalı sonuçlara, verilere sahip olduğunu gösteriyorsa, Yandex veya Google bu tür sonuçları vermeye başlayacaktır.

    Bu makale bağlamında "daha iyi olmak", "her şeyde daha iyi olmak" anlamına gelmez. Evet, birçok yönden kahramanlarımız Yandex'den (hatta Bing'den) uzaktır. Ancak bu hizmetlerin her biri, kullanıcıya arama endüstrisinin devlerinin sunamayacağı bir şey veriyor. Elbette benzer projeleri de biliyorsunuzdur. Bizimle paylaşın - tartışalım.

    Bir arama motoru, İnternet'teki belirli bilgilerin bir veritabanıdır. Birçok kullanıcı, bir arama motoruna bir sorgu girer girmez tüm İnternet'in anında tarandığına inanır, ancak durum hiç de böyle değildir. İnternet taraması sürekli gerçekleşir, birçok program, sitelerle ilgili veriler, belirli kriterlere göre tüm sitelerin ve tüm sayfalarının çeşitli listelere ve veritabanlarına dağıtıldığı bir veritabanına girilir. Yani bir tür veri dosyasıdır ve arama internette değil bu dosyada yapılır.

    Google, dünyanın en popüler arama motorudur.

    Arama motorunun yanı sıra Google, posta hizmeti, Google Chrome tarayıcısı, en büyük youtube video kitaplığı ve diğer birçok proje dahil olmak üzere birçok ek hizmet, yazılım ve donanım sunmaktadır. Google, büyük karlar getiren birçok projeyi güvenle satın alıyor. Hizmetlerin çoğu doğrudan bir kullanıcıya yönelik değil, İnternet üzerinden para kazanmaya yöneliktir ve Avrupalı ​​ve Amerikalı kullanıcıların çıkarlarına odaklanarak entegre edilmiştir.

    Posta, esas olarak posta hizmeti nedeniyle popüler olan bir arama motorudur.

    Anahtarı Mail Mail olan birçok ek hizmet vardır. şu an Mail, Odnoklassniki sosyal ağının sahibidir. kendi ağı"Benim dünyam", Para-posta hizmeti, ayarla çevrimiçi oyunlar, farklı adlara sahip üç neredeyse aynı tarayıcı. Tüm uygulama ve hizmetler çok fazla reklam içeriğine sahiptir. Sosyal ağ "Vkontakte" doğrudan geçişleri engeller Posta hizmetleri, tartışarak büyük miktar virüsler.

    Vikipedi.

    Wikipedia aranabilir bir referans sistemidir.

    Kâr amacı gütmeyen, özel bağışlarla var olan bir arama motorudur, bu nedenle sayfaları reklamla doldurmaz. Amacı, dünyanın tüm dillerinde eksiksiz bir referans ansiklopedisi oluşturmak olan çok dilli bir proje. Belirli bir yazarı yoktur, dünyanın her yerinden gönüllüler tarafından doldurulur ve yönetilir. Her kullanıcı bir makaleyi hem yazabilir hem de düzenleyebilir.

    Resmi sayfa- www.wikipedia.org.

    Youtube en büyük video kütüphanesidir.

    Öğelerle video barındırma sosyal ağ her kullanıcının bir video ekleyebileceği yer. Google Ink tarafından satın alındıkları andan itibaren YouTube için ayrı bir kayıt gerekli değildir, Google posta hizmetine kaydolmanız yeterlidir.

    Resmi sayfa youtube.com'dur.

    yahoo! dünyanın en önemli ikinci arama motorudur.

    Mevcut ek hizmetler, bunların en ünlüsü Yahoo e. Arama motorunun kalitesini artırmanın bir parçası olarak Yahoo, kullanıcılar ve sorguları hakkındaki verileri Microsoft'a iletir. Bu verilerden, kullanıcıların ilgi alanları hakkında bir fikir ve ayrıca reklam içeriği için bir pazar oluşturulur. Yahoo arama motoru, diğer şirketlerin emilimiyle de uğraşmaktadır, örneğin Yahoo, Altavista arama hizmetinin ve web sitesinin sahibidir. e-ticaret Alibaba.

    Resmi sayfa www.yahoo.com'dur.

    WDL bir dijital kütüphanedir.

    Kütüphane, kültürel değeri olan kitapları toplar. dijital form. Temel amaç, internetin kültürel içerik düzeyini artırmaktır. Kütüphaneye erişim ücretsizdir.

    Resmi sayfa www.wdl.org/ru/'dir.

    Bing, Microsoft'tan bir arama motorudur.

    Resmi web sitesi www.baidu.com'dur.

    Arama motorları Rusya

    Rambler, "Amerikan yanlısı" bir arama motorudur.

    Başlangıçta bir medya İnternet portalı olarak oluşturuldu. Diğer birçok arama motoru gibi, görsel arama hizmetleri, video dosyaları, haritalar, hava durumu tahmini, haberler bölümü ve çok daha fazlasına sahiptir. Yayıncılar ayrıca ücretsiz bir tarayıcı Rambler-Nichrome sunar.

    Resmi sayfa www.rambler.ru'dur.

    Nigma akıllı bir arama motorudur.

    Birçok filtre ve ayarın varlığı nedeniyle daha kullanışlı bir arama motoru. Arayüz, daha iyi sonuçlar almak için önerilen benzer değerleri aramaya dahil etmenize veya hariç tutmanıza olanak tanır. Ayrıca, bir arama sonucu alırken, diğer büyük arama motorlarından gelen bilgileri kullanmanıza olanak tanır.

    Resmi sayfa www.nigma.ru'dur.

    Aport - çevrimiçi mal kataloğu.

    Geçmişte arama motoru, ancak sonrasında gelişmelerin ve yeniliklerin durdurulması, hızla zemin kaybetti ve . İÇİNDE şu anda Aport Ticaret platformu 1500'den fazla şirketin ürünlerini sunan.

    Resmi sayfa www.aport.ru'dur.

    Sputnik ulusal bir arama motoru ve internet portalıdır.

    Rostelecom tarafından düzenlendi. Şu anda test aşamasındadır.

    Resmi web sitesi www.sputnik.ru'dur.

    Metabot gelişmekte olan bir arama motorudur.

    Metabot'un görevleri, diğer tüm arama motorları için bir arama motoru oluşturmak, tüm arama motorları listesinin verilerini dikkate alarak sonuçları yayınlamak için konumlar oluşturmaktır. Yani, arama motorları için bir arama motorudur.

    Resmi sayfa www.metabot.ru'dur.

    Arama motoru askıya alındı.

    Resmi sayfa www.turtle.ru'dur.

    KM - çok portal.

    Başlangıçta site, daha sonra bir arama motorunun tanıtıldığı bir çoklu portaldı. Arama hem site içinde hem de izlenen tüm Runet sitelerinde yapılabilir.

    Resmi sayfa www.km.ru'dur.

    Gogo - çalışmıyor, bir arama motoruna yönlendiriyor.

    Resmi sayfa www.gogo.ru'dur.

    Çok popüler olmayan Rus çoklu portalının iyileştirilmesi gerekiyor. Arama motoru haberler, TV, oyunlar, harita içerir.

    Resmi sayfa www.zoneru.org'dur.

    Arama motoru çalışmıyor, geliştiriciler arama motorunu kullanmanızı öneriyor.

    Uzun zamandır Rus İnternetinin ayrılmaz bir parçası haline geldiler. Arama motorları artık sadece bilgi bulmak için bir araç değil, aynı zamanda iş için cazip alanlar olan devasa ve karmaşık mekanizmalardır.

    Arama motorlarının çoğu kullanıcısı, arama motorlarının çalışma prensibi, kullanıcı isteklerini işleme şeması, bu sistemlerin nelerden oluştuğu ve nasıl çalıştıkları hakkında hiçbir zaman düşünmedi (veya düşünmedi, ancak bir cevap bulamadı) ...

    Bu ana sınıf, arama motorlarının nasıl çalıştığı sorusuna cevap vermek için tasarlanmıştır. Ancak burada belgelerin sıralamasını etkileyen faktörleri bulamazsınız. Ayrıca, güvenme detaylı açıklama Yandex algoritması. Yandex arama motorunun teknoloji ve geliştirme direktörü Ilya Segalovich'e göre, yalnızca Ilya Segalovich'in kendisi tarafından "işkence altında" tanınabilir ...

    2. Arama motorunun kavramı ve işlevleri

    Bir arama motoru, İnternet'te arama yapmak ve bir metin cümlesi (arama sorgusu) şeklinde belirtilen bir kullanıcının isteğine alaka sırasına göre bilgi kaynaklarına bağlantıların bir listesini yayınlayarak yanıt vermek için tasarlanmış bir yazılım ve donanım sistemidir. talep doğrultusunda). En büyük uluslararası arama motorları: Google, Yahoo , MSN . Rus İnternetinde bu Yandex, Rambler, Aport'tur.

    Örnek olarak Yandex arama motorunu kullanarak bir arama sorgusu kavramını daha ayrıntılı olarak ele alalım. Arama sorgusu, kullanıcı tarafından bulmak istediği şeye göre mümkün olduğunca kısa ve basit bir şekilde formüle edilmelidir. Diyelim ki Yandex'de nasıl araba seçileceği hakkında bilgi bulmak istiyoruz. Bunun için açıyoruz ana sayfa"Yandex" ve "bir araba nasıl seçilir" arama sorgusunun metnini girin. Ayrıca görevimiz, talebimiz üzerine sağlanan bağlantıları İnternet'teki bilgi kaynaklarına açmaktır. Ancak, ihtiyacımız olan bilgiyi bulamamak oldukça olasıdır. Böyle bir durumda, ya talebinizi yeniden ifade etmeniz gerekir ya da arama motoru veritabanında gerçekten talebimizle ilgili herhangi bir bilgi yoktur (bu, "Arkhangelsk'te araba nasıl seçilir" gibi çok "dar" sorgular ayarlarken olabilir. ”)

    Herhangi bir arama motorunun birincil amacı, tam olarak aradıkları bilgileri sunmaktır. Ve kullanıcılara sisteme "doğru" isteklerde bulunmayı öğretmek, örn. arama motorlarının çalışma prensiplerine uygun talepler mümkün değildir. Bu nedenle, geliştiriciler, kullanıcıların aradıkları bilgileri bulmalarını sağlayacak arama motorlarının bu tür algoritmalarını ve çalışma ilkelerini oluşturur.

    Bu, arama motorunun, kullanıcının bilgi ararken düşündüğü gibi "düşünmesi" gerektiği anlamına gelir. Bir kullanıcı bir arama motoruna istekte bulunduğunda, ihtiyacı olanı olabildiğince hızlı ve basit bir şekilde bulmak ister. Sonucu aldıktan sonra, birkaç temel parametrenin rehberliğinde sistemin performansını değerlendirir. Aradığını buldu mu? Bulunamazsa, aradığını bulmak için sorguyu kaç kez yeniden ifade etmesi gerekti? Ne kadar güncel bilgi bulabilirdi? Arama motoru sorguyu ne kadar hızlı işliyordu? Arama sonuçları ne kadar uygun sunuldu? İstenen sonuç birinci miydi yoksa yüzüncü mü? Ne kadar gereksiz çöp ile birlikte bulundu kullanışlı bilgi? Arama motoruna erişirken gerekli bilgiler bir hafta içinde mi yoksa bir ay içinde mi bulunacak?

    Tüm bu soruları yanıtlamak için arama motoru geliştiricileri, arama algoritmalarını ve ilkelerini sürekli olarak geliştiriyor, yeni işlevler ve yetenekler ekliyor ve sistemi hızlandırmak için mümkün olan her yolu deniyor.

    3. Arama motorunun temel özellikleri

    Arama motorlarının temel özelliklerini açıklayalım:

    • bütünlük

      Tamlık, bir arama motorunun temel özelliklerinden biridir ve istek üzerine bulunan belge sayısının İnternet'teki tatmin edici belgelerin toplam sayısına oranıdır. bu istek. Örneğin, İnternette "nasıl araba seçilir" ifadesini içeren 100 sayfa varsa ve bunlardan yalnızca 60 tanesi ilgili sorgu için bulunduysa, arama hatırlaması 0,6 olacaktır. Ne olduğu belli daha eksiksiz arama, İnternette mevcut olması koşuluyla, kullanıcının ihtiyaç duyduğu belgeyi bulamama olasılığı o kadar düşüktür.

    • Kesinlik

      Doğruluk, bir arama motorunun başka bir temel özelliğidir ve bulunan belgelerin kullanıcının sorgusuyla eşleşme derecesine göre belirlenir. Örneğin, "bir araba nasıl seçilir" sorgusu 100 belge içeriyorsa, bunların 50'si "nasıl bir araba seçilir" ifadesini içeriyorsa ve geri kalanı sadece bu kelimeleri içeriyorsa ("doğru radyo nasıl seçilir ve nasıl kurulur? bir araba”), arama doğruluğu 50/100 (=0,5) olarak kabul edilir. Arama ne kadar doğru olursa, kullanıcı ihtiyaç duyduğu belgeleri o kadar hızlı bulur, aralarında o kadar az çeşitli "çöp" bulunur, bulunan belgeler taleple o kadar az eşleşmez.

    • alaka

      Alaka düzeyi, belgelerin internette yayınlandığı andan arama motorunun dizin veri tabanına girilinceye kadar geçen süre ile karakterize edilen, aramanın eşit derecede önemli bir bileşenidir. Örneğin, ilginç bir haberin ertesi günü, çok sayıda kullanıcılar ilgili sorgularla arama motorlarına yöneldi. Nesnel olarak, bu konuyla ilgili haber bilgilerinin yayınlanmasından bu yana bir günden az bir süre geçti, ancak, büyük arama motorlarının sözde "hızlı tabanı" sayesinde ana belgeler zaten dizine eklenmiş ve aranabilir durumda. günde birkaç kez güncellenir.

    • arama hızı

      Arama hızı, yük toleransı ile yakından ilgilidir. Örneğin, OOO Rambler İnternet Holding'e göre bugün çalışma saatleri içinde Rambler arama motoruna saniyede yaklaşık 60 istek geliyor. Bu tür bir iş yükü, tek bir talebin işlem süresinin kısaltılmasını gerektirir. Burada, kullanıcının ve arama motorunun çıkarları örtüşür: ziyaretçi, sonuçları olabildiğince çabuk almak ister ve sonraki isteklerin hesaplanmasını yavaşlatmamak için arama motorunun isteği olabildiğince çabuk işlemesi gerekir.

    • görünürlük

    4. Kısa hikaye arama motoru geliştirme

    İnternetin gelişiminin ilk döneminde, kullanıcı sayısı azdı ve hacim mevcut bilgi nispeten küçük Çoğunlukla, yalnızca araştırma görevlilerinin internete erişimi vardı. O zamanlar internette bilgi arama görevi şimdi olduğu kadar alakalı değildi.

    Erişimi düzenlemenin ilk yollarından biri bilgi kaynakları ağ, konuya göre gruplandırılmış kaynaklara bağlantılar olan sitelerin açık dizinlerinin oluşturulmasıydı. Bu tür ilk proje, 1994 baharında açılan Yahoo.com'du. Dizindeki sitelerin sayısı önemli ölçüde arttıktan sonra arama özelliği eklendi. gerekli bilgi katalog ile. Tam anlamıyla, henüz bir arama motoru değildi, çünkü arama kapsamı tüm İnternet kaynaklarıyla değil, yalnızca dizinde bulunan kaynaklarla sınırlıydı.

    Bağlantı dizinleri geçmişte yaygın olarak kullanılıyordu, ancak günümüzde popülaritesini neredeyse tamamen kaybetti. Modern, devasa kataloglar bile İnternet'in yalnızca önemsiz bir kısmı hakkında bilgi içerdiğinden. En büyük ağ dizini DMOZ (Açık Dizin Projesi olarak da adlandırılır), 5 milyon kaynak hakkında bilgi içerirken, arama tabanı Google sistemleri 8 milyardan fazla belgeden oluşmaktadır.

    1995 yılında Lycos ve AltaVista arama motorları ortaya çıktı. İkincisi, uzun yıllardır internette bilgi arama alanında lider olmuştur.

    1997'de Sergey Brin ve Larry Page, Stanford Üniversitesi'ndeki bir araştırma projesinin parçası olarak Google arama motorunu yarattı. Google şu anda dünyanın en popüler arama motoru!

    Eylül 1997'de arama motoru resmi olarak duyuruldu. Yandex sistemi, Rusça konuşulan İnternette en popüler olanıdır.

    Şu anda üç ana arama motoru (uluslararası) vardır - Google, Yahoo ve kendi üsleri ve arama algoritmaları. Diğer arama motorlarının çoğu (çok sayıda vardır), şu veya bu şekilde listelenen üçünün sonuçlarını kullanır. Örneğin, AOL araması (search.aol.com) Google'ı kullanırken AltaVista, Lycos ve AllTheWeb Yahoo'yu kullanır.

    5. Arama motorunun bileşimi ve ilkeleri

    Rusya'da ana arama motoru Yandex'dir, ayrıca - Rambler.ru, Google.ru, Aport.ru, Mail.ru. Üstelik şu anda Mail.ru, Yandex arama motorunu ve veritabanını kullanıyor.

    Hemen hemen tüm büyük arama motorlarının diğerlerinden farklı olarak kendi yapıları vardır. Ancak, tüm arama motorlarında ortak olan ana bileşenleri ayırmak mümkündür. Yapıdaki farklılıklar ancak bu bileşenlerin etkileşim mekanizmalarının uygulanması şeklinde olabilir.

    indeksleme modülü

    İndeksleme modülü üç bölümden oluşur yardımcı programlar(robotlar):

    Örümcek (örümcek) - web sayfalarını indirmek için tasarlanmış bir program. "Örümcek" sayfayı indirir ve bu sayfadaki tüm dahili bağlantıları çıkarır. Her sayfanın html kodu indirilir. Robotlar sayfaları indirmek için kullanıyor HTTP protokolleri. "Örümcek" şu şekilde çalışır. Robot, sunucuya "get/path/document" isteğini ve diğer bazı HTTP istek komutlarını gönderir. Yanıt olarak robot, hizmet bilgilerini ve belgenin kendisini içeren bir metin akışı alır.

    • Sayfa URL'si
    • sayfanın indirildiği tarih
    • sunucu yanıtı http başlığı
    • sayfa gövdesi (html kodu)

    Paletli ("gezgin" örümcek) - sayfada bulunan tüm bağlantıları otomatik olarak takip eden bir program. Sayfada bulunan tüm bağlantıları seçer. Görevi, bağlantılara veya önceden tanımlanmış bir adres listesine dayanarak örümceğin bundan sonra nereye gitmesi gerektiğini belirlemektir. Tarayıcı, bulunan bağlantıları izleyerek, arama motorunun henüz bilmediği yeni belgeleri arar.

    Indexer (robot-indexer) - örümcekler tarafından indirilen web sayfalarını analiz eden bir program. Dizin oluşturucu, sayfayı bileşen parçalarına ayırır ve bunları kendi sözcüksel ve morfolojik algoritmalarını kullanarak analiz eder. Metin, başlıklar, bağlantılar, yapısal ve stil özellikleri, özel hizmet html etiketleri vb. sayfanın çeşitli öğeleri analiz edilir.

    Böylece indeksleme modülü, belirli bir kaynak kümesini bağlantılarla dolaşmanıza, karşılaşılan sayfaları indirmenize, alınan belgelerden yeni sayfalara bağlantılar çıkarmanıza ve tam analiz bu belgeler.

    Veri tabanı

    Veritabanı veya arama motoru dizini, dizin oluşturma modülü tarafından indirilen ve işlenen tüm belgelerin özel olarak dönüştürülmüş parametrelerini depolayan bir bilgi dizisi olan bir veri depolama sistemidir.

    arama sunucusu

    Arama sunucusu temel unsuru aramanın kalitesi ve hızı doğrudan işleyişinin altında yatan algoritmalara bağlı olduğundan, tüm sistem.

    Arama sunucusu şu şekilde çalışır:

    • Kullanıcıdan alınan istek morfolojik analize tabi tutulur. Veritabanında bulunan her belgenin bilgi ortamı oluşturulur (bu daha sonra formda görüntülenecektir, yani talebe karşılık gelir) metin bilgisi arama sonuçları sayfasında).
    • Alınan veriler, giriş parametreleri olarak özel bir sıralama modülüne iletilir. Veriler tüm belgeler için işlenir, sonuç olarak, her belge için, kullanıcı tarafından girilen sorgunun alaka düzeyini ve bu belgenin arama motoru dizininde saklanan çeşitli bileşenlerini karakterize eden kendi derecelendirmesi hesaplanır.
    • Kullanıcının seçimine bağlı olarak, bu derecelendirme ek koşullarla ayarlanabilir (örneğin, "gelişmiş arama").
    • Ardından, bir pasaj oluşturulur, yani bulunan her belge için bir başlık, sorguya en iyi uyan kısa bir açıklama ve belge tablosundan belgenin kendisine bir bağlantı çıkarılır ve bulunan kelimeler vurgulanır.
    • Alınan arama sonuçları, kullanıcıya arama sonuçlarını yayınlama sayfası olan SERP (Arama Motoru Sonuç Sayfası) biçiminde iletilir.

    Gördüğünüz gibi, tüm bu bileşenler birbiriyle yakından ilişkilidir ve etkileşim içinde çalışarak arama motoru için büyük miktarda kaynak gerektiren net, oldukça karmaşık bir mekanizma oluşturur.

    6. Sonuç

    Şimdi yukarıdakilerin hepsini özetleyelim.

    • Herhangi bir arama motorunun birincil amacı, tam olarak aradıkları bilgileri sunmaktır.
    • Arama motorlarının temel özellikleri:
      1. bütünlük
      2. Kesinlik
      3. alaka
      4. arama hızı
      5. görünürlük
    • İlk tam teşekküllü arama motoru, 1994 yılında piyasaya sürülen WebCrawler projesiydi.
    • Arama motoru aşağıdaki bileşenleri içerir:
      1. indeksleme modülü
      2. Veri tabanı
      3. arama sunucusu

    Ana sınıfımızın, arama motorlarının temel işlevlerini, özelliklerini ve çalışma ilkelerini daha iyi anlamak için PS kavramına daha aşina olmanızı sağlayacağını umuyoruz.

    En popüler web Bugünün hizmeti arama motorudur. Burada her şey anlaşılabilir, çünkü ilk İnternet kullanıcılarının temsilcilerinin ağdaki yeni öğeleri gözlemleyebildiği zamanlar çoktan geride kaldı.

    O kadar çok bilgi ortaya çıkıyor ve birikiyor ki, bir kişinin tam olarak ihtiyaç duyacağını bulması çok zor hale geldi. Sıradan bir kullanıcının nerede olduğunu anlamadığım bilgileri aramak zorunda kalsaydı, internette arama yapmanın nasıl olacağını bir düşünün. Tam olarak nerede olduğunu anlamıyorum çünkü manuel aramayla pek fazla bilgi bulamazsınız.

    Arama motoru, nedir bu?

    Kullanıcının gerekli bilgilere sahip olabilecek siteleri zaten bilmesi iyidir, ancak başka ne yapılabilir? Bir kişinin internette gerekli bilgileri bulmasında hayatını kolaylaştırmak için arama motorları veya basitçe arama motorları icat edildi. Arama motoru çok önemli işlev, bu olmadan İnternet, onu görmeye alıştığımızla aynı olmazdı - bu, ağda bilgi aramaktır.

    Arama sistemi- bu, özel bir web sitesidir veya başka bir deyişle, kullanıcılara istekleri üzerine belirli bir arama sorgusunu yanıtlayan sayfalara, sitelere köprü sağlayan bir sitedir.

    Biraz daha kesin olmak gerekirse, bir yazılım ve donanım işlevsel seti ve kullanıcılarla etkileşim için bir web arayüzü sayesinde gerçekleştirilen internette bilgi aramadır.

    Arama motoruyla insan etkileşimi için bir web arayüzü, yani görünür ve anlaşılır bir kabuk oluşturuldu. Arama motoru geliştiricilerinin bu yaklaşımı birçok kişi için aramayı kolaylaştırmaktadır. Kural olarak, arama motorları kullanılarak aranan İnternet'tir, ancak FTP sunucuları, belirli mal türleri için arama motorları da vardır. Dünya çapında Ağ veya haber bilgileri veya diğer arama hedefleri.

    Arama, yalnızca sitelerin metin içeriğinde değil, aynı zamanda bir kişinin arayabileceği diğer bilgi türlerinde de gerçekleştirilebilir: resimler, videolar, ses dosyaları vesaire.

    Bir arama motoru tarafından arama nasıl yapılır?

    İnternette arama yapmak, tıpkı web sitelerinde gezinmek gibi, bir İnternet tarayıcısı - tarayıcı yardımıyla mümkündür. Yalnızca kullanıcı sorgusunu arama çubuğuna ayarladıktan sonra, aramanın kendisi doğrudan gerçekleştirilir.

    Herhangi bir arama motoru içerir yazılım bölümü, tüm arama motorunun dayandığı, buna arama motoru denir - bu, bilgi arama yeteneği sağlayan bir yazılım paketidir. Bir arama motoruyla iletişime geçtikten, bir kişi tarafından bir arama sorgusu oluşturduktan ve bunu arama çubuğuna girdikten sonra, arama motoru, arama motoruna göre en alakalı olan arama sonuçlarının bir listesini içeren bir sayfa oluşturur.

    Arama alaka düzeyi - kullanıcının talebiyle en alakalı malzemeleri arayın ve diğerlerinin üzerinde daha doğru sonuçlar verecek şekilde arama sonuçları sayfasında bunlara köprülerin yerleştirilmesi. Sonuçların dağılımına site sıralaması denir.

    Peki, arama motoru materyallerini yayınlamak için nasıl hazırlar ve arama motoru bilgiyi nasıl arar? Ağda bilgi toplanması, her arama motoru için benzersiz bir robot veya başka bir şekilde, paletli veya örümcek gibi bir dizi başka eşanlamlıya sahip olan bir bot tarafından kolaylaştırılır ve arama sisteminin kendisinin çalışması bölünebilir. üç aşamaya ayrılır:

    Arama motoru çalışmasının ilk aşaması, sitelerin taranmasına atfedilebilir. küresel ağ ve üzerinde toplama kendi sunucuları web sayfalarının kopyaları. Bu, henüz işlenmemiş ve arama sonuçları için uygun olmayan büyük miktarda bilgi oluşturur.

    Arama motorunun çalışmasının ikinci aşaması, daha önce sitelerden ilk aşamada alınan bilgileri sıralamaya indirgenmiştir. En kısa sürede, kullanıcıların bir arama motorundan gerçekten bekledikleri çok yüksek kaliteli aramayı destekleyecek bu tür bir sıralama gerçekleştirilir. Aşama, indeksleme olarak adlandırılır, bu, sayfaların zaten yayın için hazırlandığı ve mevcut veritabanının bir indeks olarak kabul edileceği anlamına gelir.

    Müşterinizden bir istek aldıktan sonra, istekte belirtilen anahtar kelimelere veya anahtar kelimelere yakın arama sonuçlarını belirleyen üçüncü aşamadır. Bu, taleple en alakalı bilgilerin seçilmesine ve ardından yayınlanmasına katkıda bulunur. Çok fazla bilgi olduğu için arama motoru kendi algoritmalarına uygun olarak sıralama gerçekleştirir.
    En iyi arama motoru, kullanıcının isteğine en doğru şekilde cevap veren materyali sağlayabilen motordur. Ancak burada bile, sitelerini tanıtmakla ilgilenen kişilerden etkilenen sonuçlar olabilir, bu tür siteler her zaman olmasa da, genellikle arama sonuçlarında görünür, ancak uzun sürmez.

    Birçok bölgede dünya liderleri şimdiden belirlenmiş olsa da, arama motorları kaliteli aramalarını geliştirmeye devam ediyor. Sağlayabilecekleri daha iyi arama, Daha fazla insan onu kullanacaklar.

    Arama motoru nasıl kullanılır?

    Arama motoru nedir ve nasıl çalıştığı zaten belli, ama nasıl doğru kullanılır? Çoğu sitenin her zaman bir arama çubuğu vardır ve yanında bir Bul veya Ara düğmesi bulunur. Arama çubuğuna bir sorgu girilir, ardından arama düğmesine basmanız veya çoğu zaman olduğu gibi klavyedeki Enter tuşuna basmanız gerekir ve saniyeler içinde sorgunun sonucunu formda alırsınız. bir liste.

    Ancak bir arama sorgusuna doğru yanıtı almak her zaman ilk seferinde mümkün değildir. İstediğiniz şeyi aramanın acı vermemesi için, doğru bir arama sorgusu oluşturmalı ve aşağıda açıklanan önerileri izlemelisiniz.

    Arama sorgusunu doğru şekilde oluşturun

    Aşağıda, arama motorunu kullanmak için bazı ipuçları verilmiştir. Bir arama motorunda bilgi ararken bazı püf noktaları ve kurallara uymak, elde etme fırsatı sağlayacaktır. İstenen sonuçÇok daha hızlı. Bu yönergeleri izleyin:

    1. Kelimelerin doğru yazımı, istenen kelimelerle maksimum eşleşme sayısını sağlar. bilgi nesnesi(Modern arama motorları yazım hatalarının nasıl düzeltileceğini zaten öğrenmiş olsa da, bu tavsiye ihmal edilmemelidir).
    2. Bir sorguda eşanlamlılar kullanılarak daha geniş bir arama aralığı kapsanabilir.
    3. Bazen bir sorgu metnindeki bir kelimeyi değiştirmek daha büyük bir sonuç getirebilir, bu nedenle sorguyu yeniden formüle edin.
    4. Sorguya özgüllük getirin, aramanın ana özünü belirlemesi gereken ifadelerin tam oluşumlarını kullanın.
    5. Anahtar kelimelerle denemeler yapın. kullanım anahtar kelimeler ve ifadeler ana noktayı belirlemeye yardımcı olabilir ve arama motoru daha alakalı bir sonuç döndürür.

    Peki arama motoru nedir - bu, ilgilendiğiniz bilgileri bulma ve genellikle tamamen ücretsiz kullanma, bir şeyler öğrenme, bir şeyler anlama veya kendiniz için doğru sonucu çıkarma fırsatından başka bir şey değildir. Birçoğu artık onsuz hayatlarını hayal edemiyor. sesli arama, metnin yazılması gerekmeyen, sadece isteğinizi söylemeniz yeterlidir ve buradaki giriş cihazı bir mikrofondur. Bütün bunlar, İnternet'teki arama teknolojilerinin sürekli gelişimine ve bunlara duyulan ihtiyacın kanıtıdır.

    Beklendiği gibi, Google dünya sıralamasında ilk sırada yer aldı. Hesaplar %70'in üzerinde arama sorguları dünyanın her yerinden insanlardan. Ayrıca, tüm google.com trafiğinin üçte biri ABD vatandaşlarından geliyor. Ayrıca Google, dünyanın en çok ziyaret edilen web sitesidir. Google arama motorunu günlük ortalama kullanım süresi 9 dakikadır.

    Google arama motorunun avantajı, ekstra elemanlar Sayfada. Yalnızca arama çubuğu ve şirket logosu. Yonga popüler ve yerel tatillere adanmış animasyonlu resimler ve tarayıcı oyunlarıdır.

    2. Bin

    Bing- Microsoft'tan arama motoru 2009 yılından bu yana tarihine liderlik ediyor. O zamandan beri, Windows çalıştıran akıllı telefonların zorunlu bir özelliği haline geldi. Bing ayrıca minimalizm ile de ayırt edilir - başlığa ek olarak hepsinin bir listesi Microsoft ürünleri, sayfa yalnızca şunları içerir: Arama dizisi ve sistemin adı. Bing en çok ABD'de (%31), Çin'de (%18) ve Almanya'da (%6) popülerdir.

    3 Yahoo!

    Üçüncülük, en eski arama motorlarından biri olan Yahoo'ya verildi. Kullanıcıların büyük bir kısmı da ABD'de yaşamaktadır (%24). Dünyanın geri kalanının kasıtlı olarak arama robotlarının yardımından kaçındığı izlenimi ediniliyor ... Arama motoru ayrıca Hindistan, Endonezya, Tayvan ve Birleşik Krallık'ta da popülerdir. Arama çubuğuna ek olarak, Yahoo! bölgeniz için bir hava tahmini ve bir haber akışı şeklinde dünya trendleri sunar.

    4. Baidu

    Rusya'da ün kazanmış bir Çinli arama motoru. Agresif politika ve Rusçaya tercüme eksikliği nedeniyle veya İngilizce dilleri, bu arama motorunun uzantıları virüs olarak algılanmaktadır. Tamamen kaldırmak ve hiyeroglifli açılır pencerelerden kurtulmak çok zordur. Ancak, bu site dünyada dördüncü katılım ile. İzleyicilerinin %92'si Çin vatandaşı.

    5. AOL

    AOL, adı America Online olan bir Amerikan arama motorudur. Popülaritesi, popülaritesinden çok daha düşük. önceki sistemler. Şafağı 90'lı ve 00'lı yıllardaydı. AOL izleyicilerinin yaklaşık %70'i Amerika Birleşik Devletleri'ndendir.

    6 Ask.com

    Geçmişi 1995 yılına dayanan bu arama motoru, oldukça sıradışı arayüz. Tüm istekleri soru olarak algılar ve kurallara uygun cevaplar sunar. Arama Sonuçları. Bu biraz Answer.Mail hizmetini anımsatıyor. Ancak amatörlerin yanıtları değil, tam teşekküllü makaleler konuya giriyor. Geçen yıl boyunca site, en popüler İnternet kaynaklarının dünya sıralamasında yaklaşık 50 konum kaybetti ve bugün yalnızca 104. sırada yer alıyor.

    7. Heyecan

    Bu arama motoru dikkat çekici değil ve diğer birçok siteye benziyor. Kullanıcılara pek çok hizmet sunar (Haberler, Mail, Hava Durumu, Seyahat vb.) Sitenin arayüzü de 90'ların web'ini çağrıştırır ve o zamandan beri çok az değiştiği varsayılabilir.

    8. ÖrdekDuckGo

    Geliştiriciler hemen bu arama motorunun faaliyetlerinizi takip etmezçevrimiçi. Günümüzde, bu, bir arama motoru seçerken ağır bir argümandır. Sitenin tasarımı modern bir şekilde yapılmış, parlak renkler kullanılmış ve komik Resimler. Diğer arama motorlarından farklı olarak "ördek arama motoru" Rusça'ya çevrilmiştir. Geçen yıl boyunca, site Mart 2017'de yaklaşık 400 konum kazandı. Alexa popülerlik sıralamasında 504. sıradadır.

    9 WolframAlfa

    Bu aramanın ayırt edici bir özelliği, belirli bilgilerle ilgili sorgular için tasarlanmış çeşitli yardımcı hizmetlerdir. Yani, sayıda sosyal ağlardaki gönderilere veya sarı basın makalelerine bağlantılar görmeyeceksiniz. teklif edileceksin somut rakamlar ve doğrulanmış gerçekler tek bir belge şeklinde. Bu tarayıcı okul çocukları ve öğrenciler için idealdir.

    10.Yandex

    Rusya ve BDT ülkelerinde en popüler arama motoru. Ayrıca, sitenin izleyicilerinin yaklaşık %3'ü Almanya'da ikamet etmektedir. Site, tüm durumlar için çok sayıda hizmetle dikkat çekiyor (müzik, radyo, program toplu taşıma, emlak, tercüman vb.) Kaynak ayrıca geniş bir bireysel web sitesi tasarımı seçeneği sunar. widget'ları özelleştirme. Yandex, geçen yıl 11 sıra kaybederek popülerlik açısından dünyada 31. sırada yer alıyor.