Yandex je pokrenuo novu "pametnu" pretragu. Kako ga koristiti? Yandex pokrenuo novu verziju tražilice Što je novo u tražilici Yandex

Yandex ponovno zadovoljava korisnike inovacijama za poboljšanje kvalitete pretraživanja informacija. Danas su promjene utjecale na isječke - pojavio se gumb "Pročitaj više" i razgovor s tvrtkom. Pogledajmo pobliže ova ažuriranja.

Desktop verzija Yandex pretraživanja ima novi gumb "Pročitaj više", uz njegovu pomoć korisnik može vidjeti prošireni isječak stranice. Kada kliknete gumb, pojavljuje se tekst objašnjenja povezan sa zahtjevom.

Prije je ova funkcija bila dostupna samo za mobilne uređaje, a sada je kontinuirano uvedena u funkcionalnost desktop verzije rezultata pretraživanja.

U nedavnoj prošlosti Yandexov isječak prikazivao je ograničenu količinu informacija - 240 znakova s razmacima, otprilike 3 retka. Često korisnik nije imao dovoljno tih informacija, pa je postojala potreba za odlaskom na stranicu u potrazi za informacijama od interesa.

Sada, s dodatkom ovog gumba, proces traženja informacija za korisnika može se ubrzati nekoliko puta.

Pogled na novi Yandex isječak

Kako je Yandexov isječak izgledao prije:

Sada Yandexov isječak u sklopljenom stanju izgleda ovako

Ova vrsta isječka pojavljuje se u mobilnoj verziji

Odgovarajući izgled u rezultatima mobilnog pretraživanja.

Prednosti i mane Yandex bogatog isječka

Na temelju tih informacija, korisnik može donijeti informiraniji izbor o korisnosti izvora. A za vlasnika web-mjesta, prošireni isječak prilika je za dobivanje više ciljanog prometa, poboljšanje čimbenika ponašanja - na primjer, smanjenje stope napuštanja početne stranice i povećanje prometa konverzije.

Međutim, implementacija ove funkcije može imati negativan utjecaj na promet pretraživanja stranice, jer će ovaj opis biti sasvim dovoljan da korisnik dobije informacije koje traži bez odlaska na stranicu.

Što se tiče duljine proširenog isječka, Yandex stručnjaci kažu sljedeće:

“Princip je sljedeći: prošireni isječak ne može biti više od 3 puta duži od trenutnog.”. Odnosno, maksimalna duljina isječka u ovom trenutku može biti do 9 redaka ili 650-700 znakova.

"Što se tiče mjesta odakle dolaze prošireni opisi, ovdje vrijede ista pravila kao i za obične isječke", objašnjavaju stručnjaci Yandexa. Tražilica generira isječak u skladu sa zahtjevom korisnika, a ako informacije iz meta oznake opisa nisu dovoljne, Yandex će preuzeti informacije sa stranice web mjesta.

Više o pravilima za Yandex isječke možete pročitati u ovom članku.

Budite oprezni, postoji mogućnost da će prošireni isječak sadržavati servisne informacije: tekst s gumba za paginaciju, filtre, sortiranje itd., pa ga zatvorite u kodu s oznakama.

Jivosite chat u Yandex rezultatima pretraživanja

Chat se pojavio i u isječku Yandexa. Yandex i Jivosite dodali su chat na stranicu rezultata pretraživanja. Počevši od 26. travnja 2018. korisnici mogu kontaktirati podršku za web mjesto koje ima instaliran Jivosite chat bez odlaska na web mjesto.

Nakon povezivanja na chat moći ćete:

omogućiti ili onemogućiti chat u pretraživanju;
dodati automatski odgovor;
dodati savjete;
dodaj ikonu;
odrediti radno vrijeme organizacije i ograničiti broj stranica na kojima će se chat prikazati.

Upute za dodavanje chata na vašu web stranicu predstavljene su na službenoj web stranici usluge Jivosite.

Vrsta chata u rezultatima pretraživanja

Kako izgleda isječak "Chat with a company" u verziji za stolno računalo:

Imajte na umu da desktop i mobilna verzija imaju različite ikone za pokretanje chata.

Nakon klika na gumb "Razgovaraj s tvrtkom", obrazac za komunikaciju s podrškom stranice pojavljuje se izravno na stranici rezultata pretraživanja.

U mobilnoj verziji pretraživanja, prozor za chat otvara se na vrhu trenutnog prozora, ali ne u novoj kartici.

Zanimljiva značajka chata je da sprema povijest dopisivanja između ovlaštenog korisnika i podrške stranice na drugom kraju Jivositea.

Nakon slanja pisma, korisnik ima priliku minimizirati chat i nastaviti tražiti informacije od interesa:

Nakon što podrška stranice odgovori korisniku, s desne strane pojavit će se obavijest o novoj poruci:

Prednosti i mane chata

Ovaj isječak vam omogućuje da komunikaciju između korisnika i organizacije učinite dostupnijom. Korisnik će moći obaviti kupnju ili postaviti pitanje koje ga zanima bez posjete stranici.

Loša strana je da ako operater nije na mreži, a klijent je poslao poruku, operater će ovu poruku primiti samo sljedeći put kada korisnik bude na mreži.

Još jedan nedostatak je što chat na stranici rezultata pretraživanja nije sinkroniziran s chatom na samoj stranici. Zamislimo situaciju: prije nekoliko dana korisnik je napisao podršku stranici izravno iz rezultata pretraživanja, a tjedan dana kasnije odlučio je otići na stranicu i razjasniti informacije o svom pitanju na samoj stranici. Kao rezultat toga, operater možda neće razumjeti što se događa ili o kojem se problemu raspravlja. Neugodna situacija, zar ne? Klijent će morati potrošiti vrijeme na ponovno objašnjavanje pitanja ili će, ne želeći duplirati zahtjev, potpuno prekinuti razgovor. Trenutačno nema rješenja za ovu situaciju, nadajmo se da će u budućnosti stručnjaci Yandexa zajedno s Jivositeom pronaći izlaz.

Zaključak

Yandex ne stoji mirno i stalno smišlja nešto zanimljivo. Ovaj put su dodane korisne funkcije, isječci u Yandexu su dobili novi izgled i nove mogućnosti. To će pomoći u poboljšanju kvalitete informacija u rezultatima pretraživanja.

Ukoliko nemate vremena, uvijek nas možete kontaktirati za pomoć oko instalacije ovog alata.

Yandex je pokrenuo novu verziju pretraživanja. Temelji se na algoritmu pretraživanja Korolev. Koristeći neuronsku mrežu, algoritam uspoređuje značenje upita i web stranica - to omogućuje Yandexu da točnije odgovori na složene upite. Statistika pretraživanja i ocjene milijuna ljudi koriste se za obuku nove verzije pretraživanja. Dakle, ne samo programeri, već i svi korisnici Yandexa doprinose razvoju pretraživanja.

Riječi i značenja

Prije nego što govorimo o sadašnjosti i budućnosti pretraživanja, prisjetimo se njegove prošlosti. Prve tražilice pojavile su se sredinom 1990-ih, kada je internet bio vrlo malen – postojale su tisuće stranica. Da bi osoba pronašla ono što joj je potrebno, bilo je dovoljno napraviti popis web stranica koje sadrže riječi iz upita za pretraživanje. Nije bilo govora o složenom rangiranju – odnosno slaganju stranica prema stupnju podudarnosti s upitom. Vjerovalo se da što se češće riječi iz upita pojavljuju u dokumentu, to bolje pristaje.

Internet je brzo rastao i bili su potrebni dodatni kriteriji odabira. Tražilice su počele uzimati u obzir poveznice na dokumente, naučile su odrediti regiju iz koje dolazi zahtjev i počele su paziti na ponašanje korisnika.

U nekom je trenutku bilo toliko faktora rangiranja - znakova koji se mogu koristiti za određivanje koliko dobro stranica odgovara na upit - da je postalo jasno da ih je nemoguće sve zapisati u obliku uputa. Bolje je naučiti stroj da sam donosi odluke: koje znakove koristiti i kako ih kombinirati. Yandex je za te svrhe smislio Matrixnet. Ovo je metoda strojnog učenja koja gradi našu formulu rangiranja.

Pretraživanje se, međutim, još uvijek oslanja na riječi. Prije upotrebe složene formule za rangiranje, tražilice stvaraju popis "pre-podudarnih" web stranica - onih koje sadrže riječi iz upita. Mi ljudi razumijemo da se isto značenje može izraziti različitim riječima. Web stranica možda ne sadrži sve riječi u upitu, ali svejedno na njega daje vrlo dobar odgovor. Međutim, prilično je teško to objasniti stroju.

Yandex je napravio prvi korak prema pretrazi po značenju prošle godine kada je kompanija predstavila algoritam pretraživanja Palekh. Temelji se na neuronskoj mreži. Neuronske mreže pokazuju izvrsne rezultate u zadacima s kojima su se ljudi tradicionalno nosili bolje od strojeva: recimo, prepoznavanje govora ili objekata na slikama.

Pokretanjem Palekha, tvrtka je naučila neuronsku mrežu pretvarati upite za pretraživanje i naslove web stranica u grupe brojeva - semantičke vektore. Važno svojstvo takvih vektora je da se mogu međusobno uspoređivati: što je veća sličnost, to su upit i zaglavlje bliži jedno drugome po značenju.

Kako radi Korolev algoritam

Korolev algoritam za pretraživanje uspoređuje semantičke vektore upita za pretraživanje i cijele web stranice - a ne samo njihove naslove. To nam omogućuje da dosegnemo novu razinu razumijevanja značenja. Zamislite da ste prvi put čuli za roman Lava Tolstoja Rat i mir. Naravno, iz naslova možete izvući značenje - na primjer, pretpostavite da u knjizi ima mnogo scena bitaka. Ali da biste saznali sve zamršenosti radnje i dali iscrpne odgovore na pitanja o romanu, morat ćete ga pročitati u cijelosti.

Kao iu slučaju Palekha, tekstovi web stranica se pretvaraju u semantičke vektore neuronskom mrežom. Ova operacija zahtijeva mnogo računalnih resursa. Usporedite: trebat će vam nekoliko sekundi da pročitate naslov knjige, ali trebat će vam sati, dani ili čak tjedni da je pročitate od korice do korice. Stoga Korolev izračunava vektore stranica ne u stvarnom vremenu, već unaprijed, u fazi indeksiranja. Kada osoba postavi upit, algoritam uspoređuje vektor upita s vektorima stranice koji su mu već poznati.

Ova shema vam omogućuje da počnete birati web stranice koje odgovaraju vašem upitu za pretraživanje u ranim fazama rangiranja. U Palekhu je semantička analiza jedna od završnih faza: kroz nju prolazi samo 150 dokumenata. U Korolev-u se proizvodi za 200 tisuća dokumenata - dakle, više od tisuću puta više. Osim toga, novi algoritam ne samo da uspoređuje tekst web stranice s upitom za pretraživanje, već također obraća pozornost na druge upite koji dovode ljude na tu stranicu. Na taj način možete uspostaviti dodatne semantičke veze.

Ljudi podučavaju strojeve

Yandex vjeruje da će korištenje strojnog učenja, a posebno neuronskih mreža, prije ili kasnije omogućiti učenje pretraživanja da operira značenjem na ljudskoj razini. Ali to se ne može učiniti bez pomoći ljudi. Da bi stroj shvatio kako riješiti određeni problem, potrebno mu je pokazati ogroman broj primjera: pozitivnih i negativnih. Takve primjere navode korisnici Yandexa.

Neuronska mreža koju koristi Korolev algoritam trenira se na anonimiziranoj statistici pretraživanja. Sustavi za prikupljanje statistike uzimaju u obzir koje stranice korisnici posjećuju za određene upite i koliko vremena tamo provode. Ako osoba otvori web stranicu i visi na njoj dulje vrijeme, vjerojatno je pronašla ono što je tražila – odnosno stranica dobro odgovara na njegov zahtjev. Ovo je pozitivan primjer. Mnogo je lakše pronaći negativne primjere: samo uzmite zahtjev i bilo koju nasumično odabranu web stranicu.

Matrixnet, koji gradi formulu za rangiranje, također treba pomoć ljudi. Kako bi pretraživanje raslo, ljudi moraju neprestano ocjenjivati njegovu izvedbu. Nekada su za dodjelu ocjena bili odgovorni samo zaposlenici Yandexa, takozvani ocjenjivači. Ali što više ocjena, to bolje - pa smo odlučili uključiti sve u ovo i pokrenuli uslugu Yandex.Toloka. Sada je tamo registrirano više od milijun korisnika: analiziraju kvalitetu pretraživanja i sudjeluju u poboljšanju drugih usluga Yandexa. Toloka zadaci se plaćaju - iznos koji se može zaraditi naveden je pored zadatka. Tijekom više od dvije godine postojanja usluge govornici su dali oko dvije milijarde ocjena.

Suvremeno pretraživanje temelji se na složenim algoritmima. Algoritme su izmislili programeri, a poučavaju ih milijuni korisnika Yandexa. Svaki zahtjev je anonimni signal koji pomaže stroju da bolje razumije ljude. Stoga Yandex neće pogriješiti ako kaže: nova pretraga je pretraga koju smo napravili zajedno.

Ovaj tjedan, 22. kolovoza, Yandex pokrenuo novu verziju pretraživanja s Korolevovim algoritmom. Temelji se na neuronskoj mreži koja mu omogućuje usporedbu značenja zahtjeva i web stranice te mnogo točnije odgovaranje na složene i dvosmislene zahtjeve. Za treniranje nove verzije pretraživanja koriste se statistike pretraživanja i ocjene milijuna ljudi: ispada da ne samo programeri, već svi korisnici općenito, doprinose razvoju sustava.
Predstavljanje “Koroljova” održano je, simbolično, u moskovskom planetariju. Na pozornici su nastupili Andrey Styskin, voditelj Yandex.Searcha, Alexander Safronov, voditelj Yandex.Search Relevance Servicea i Olga Megorskaya, voditeljica odjela za obradu podataka Yandex.Searcha.

Od Matrixneta do neuronskih mreža

Tražilice su se pojavile sredinom 90-ih godina prošlog stoljeća, kada je internet bio vrlo malen - svega nekoliko tisuća stranica. U početku su tražilice jednostavno sastavljale popis stranica koje sadrže navedene riječi bez ikakvih problema, rangirajući ih prema stupnju usklađenosti s upitom. Što se češće riječi iz upita pojavljuju u dokumentu, to bolje. Jasno je da s trenutnim stanjem globalne mreže to više neće funkcionirati.

Yandex je osmislio Matrixnet za obradu zahtjeva - metodu strojnog učenja pomoću koje je izgrađena autorova formula za rangiranje. Međutim, potraga se i dalje oslanjala na riječi. Ali što je s upitima koje korisnici formuliraju alegorijski ili asocijativno? Tada tražena web stranica ne mora striktno sadržavati sve riječi iz upita. Ali kako to objasniti stroju? Kad bi nas barem shvatila kao osobu...

Na kraju su znanstvenici došli do nečega na sjecištu tehnologije i biologije - umjetne neuronske mreže (ANN). Prema tekstu Wikipedije, ovo je "matematički model, kao i njegova softverska ili hardverska izvedba, izgrađena na principu organizacije i funkcioniranja bioloških neuronskih mreža - mreža živčanih stanica živog organizma." Neuronske mreže sposobne su obrađivati informacije poput nas i, što je najvažnije, učiti i usavršavati vještine poput živih bića. Zapravo, oni su temelj punopravne umjetne inteligencije, čiji je izgled pitanje vremena.

Prošle godine Yandex je predstavio algoritam pretraživanja Palekh temeljen na neuronskoj mreži. Pokazao je izvrsne rezultate u rješavanju problema koje obično mogu učiniti samo ljudi: izvrsno je prepoznao govor i predmete na slikama. "Palekh" je naučio pretvarati upite za pretraživanje i naslove web stranica u skupine brojeva - semantičke vektore. Njihovo važno svojstvo je da se vektori mogu međusobno uspoređivati: što je veća sličnost, to su upit i zaglavlje bliži po značenju.

"Koroljov." koji razumije

Sljedeća faza u razvoju tražilice temeljene na neuronskim mrežama bio je Korolev algoritam, koji analizira ne samo naslov, već cijelu stranicu! Broj stranica koje pretraga uspoređuje po značenju s upitom narastao je sa 150 dokumenata na 200 tisuća. Između ostalog, “Korolev” je počeo uzimati u obzir značenje drugih zahtjeva kojima ljudi idu na stranicu koju traže.

Neuronska mreža uči poput djeteta. Da bi to svladala, trebao joj je ogroman broj primjera. Zapravo, svi korisnici usluge su na ovaj ili onaj način bili uključeni u spontanu obuku "Koroljova": korištena je statistika pretraživanja i ocjene milijuna ljudi. Yandex postupno uči točnije prepoznavati semantičke veze, poput: [slika na kojoj se nebo vrti] - radi se o Van Goghovoj slici, [lijena mačka
iz Mongolije] - manul.

Pretraživanje je vrlo složen sustav. Tisuće inženjera rade kako bi osigurali da razumije ljude i pomaže u rješavanju njihovih problema. U Korolev smo spojili inteligenciju stroja i napore milijuna ljudi. Naši korisnici rade s nama na poboljšanju pretraživanja postavljajući pitanja i pomažući u obuci naših algoritama.
Andrej Stiskin, voditelj Yandex Searcha.

Uz analizu dnevnih rutina, potrebne su evaluacije kvalitete odgovora za uvježbavanje tražilice. Što je sustav složeniji, potrebno je više procjena. Ako je prethodno procjenu kvalitete pretraživanja provodila relativno mala grupa stručnjaka za procjenu, članova Yandex tima, sada je bilo potrebno ozbiljno povećati volumen. Ovako se pojavila usluga Yandex.Toloki(čišćenje je oblik uzajamne pomoći koji su nekada prakticirali seljani). Svaki entuzijast zainteresiran za malu nagradu i, naravno, osjećaj pripadnosti nečemu važnom može obavljati jednostavne zadatke. Sada ima više od milijun takvih govornika, a broj ocjena koje su dali premašio je 2 milijarde.

“Moderna pretraga temelji se na složenim algoritmima. Algoritme su izmislili programeri, a poučavaju ih milijuni korisnika Yandexa. Svaki zahtjev je anonimni signal koji pomaže stroju da bolje razumije ljude. Stoga nećemo pogriješiti ako kažemo: nova pretraga je pretraga koju smo proveli zajedno”, stoji u zapisu na Yandex blogu.

Tijekom više od dvije godine povijesti Yandex.Toloka identificiran je najproduktivniji i najmarljiviji sudionik. Bio je to Ilya Mikhalenko iz Čeljabinska. Tip je došao na prezentaciju "Koroljova" u Moskvi kako bi primio zasluženu nagradu iz ruku tima tražilice.

Nova potraga na djelu

Što u praksi znači poboljšanje rada našeg Yandexa? Sada s njim možete razgovarati gotovo kao s pametnim i obrazovanim prijateljem. (Čak i glasom.) Na primjer, što ćete učiniti ako se trebate sjetiti naziva filma iz kojeg se sjećate nekog odlomka, a iz glave su vam iskliznula imena glumaca i redatelja? Možete se obratiti prijateljima ili zatražiti pomoć na nekom tematskom forumu. Ili možete pitati "Korolev"!

Pretraživanje slika značajno je poboljšano. S njima u pravilu uvijek postoji nekakav “pakao”: tražilica ili nepromišljeno prikazuje sve slike čiji naslovi koriste riječi iz upita, ili uzima u obzir tekst članka koji slika ilustrira. Ako tražite nešto što bi zadovoljilo nejasne potrebe duše, pripremite se na razočaranje. "Korolev" analizira upravo ono što je prikazano na slici, i stoga može ugoditi ne-trivijalnim pristupom.

Kao primjer testiranja dat je ne tako očit zahtjev - [mačka u svemiru]. Psi su često bili u orbiti, ali oni brkati i prugasti nisu postali disciplinirani osvajači svemira. Sa sigurnošću se zna samo za jedan pokušaj: 1963. Francuzi su u suborbitalni let lansirali mačku Felicette. Romantično, ali kratkovidno, - čim su znanstvenici otvorili otvor sletne kapsule, bilo je tako. Svečano fotografiranje nije održano.

Na zahtjev, tražilica vraća ne samo životinje u svemirskim odijelima i nadrealne photoshoppere, već i fotografiju mačke u perilici rublja, koja izgleda prilično slično otvoru svemirskog broda. Ali to nije navedeno u opisu.

Za svečano puštanje u rad nove tražilice, na pozornicu se popeo cijeli Yandex.Search tim. Malo odbrojavanje i... Idemo! Sada svatko može iskusiti mogućnosti pronicljivog "Koroljova". Glavno je da njegove trenutne mogućnosti nisu statične, već su u stalnom razvoju.

Za kraj večeri organizatori su pripremili nešto sasvim neočekivano - komunikacijsku sesiju s pravim astronautima iz orbite. Osobno su odgovarali na neke popularne upite korisnika tražilice o svemiru te odgovarali na pitanja prisutnih.

Neuronska mreža analizira ne samo naslov, već i cijelu stranicu, dok tražilica određuje njezinu bit u fazi indeksiranja

MOSKVA, 22. kolovoza. /TASS/. Yandex je pokrenuo novu verziju pretraživanja, koja se temelji na podudaranju značenja upita i web stranice, izvijestila je tvrtka. Nova verzija radi na algoritmu "Korolev", koji pomoću neuronske mreže određuje što točno korisniku treba. Neuronska mreža analizira ne samo naslov, već i cijelu stranicu, dok Yandex određuje suštinu stranice unaprijed, u fazi indeksiranja.

Još jedna značajka "Kraljice" je da također uzima u obzir značenje drugih zahtjeva za koje ljudi prelaze na nju. “Da bi neuronska mreža procijenila semantičku blizinu upita i dokumenta, treba joj ogroman broj primjera. Takve primjere pruža neosobna statistika pretraživanja: na koje stranice ljudi idu na temelju upita i koliko vremena tamo provode. Dakle, ako je osoba otišla na stranicu i gledala je neko vrijeme, najvjerojatnije je po značenju bliska zahtjevu. Koristeći statistiku pretraživanja milijuna ljudi, Yandex uči razumjeti semantičke veze. Na primjer, razumjet će da se upit "slika gdje se nebo vrti" odnosi na sliku Van Gogha, a upit "lijena mačka iz Mongolije" o Pallasovoj mački", stoji u priopćenju tvrtke.

Prošle godine Yandex je već lansirao sustav temeljen na neuronskim mrežama - Palekh. Prethodni je sustav indeksirao 150 stranica; u Koroljevu je broj stranica koje pretraživanje uspoređuje po značenju s upitom narastao na 200 tisuća.

Novi algoritam dobio je ime po utemeljitelju ruske kozmonautike Sergeju Koroljovu.

“Danas pokrećemo novi algoritam rangiranja za Queens. Zašto smo odabrali ovo ime? Sergej Pavlovič Koroljov ispunio je san čovječanstva o letu u svemir. Za nas u Yandexu, današnje lansiranje jednako je važan tehnološki iskorak prema snu o pretraživanju koje razumije korisnike”, rekao je Alexander Safronov, voditelj službe za lingvističku relevantnost u Yandexu, na predstavljanju nove verzije pretraživanja.

Pomoć publike

Za osposobljavanje tražilice potrebne su procjene kvalitete odgovora. Prethodno je Yandex ocjenjivao kvalitetu pretraživanja uz pomoć svojih evaluatora. Nova pretraga uzet će u obzir ocjene koje su dali korisnici usluge Yandex.Toloka, distribuirane mreže procjenitelja. Usluga omogućuje svakome izvršavanje zadataka i primanje nagrada za njih trenutno ima više od milijun registriranih korisnika. Svatko se može registrirati na platformi.

Yandex je najveća tražilica u Rusiji. Udio tvrtke na ruskom tržištu pretraživanja (uključujući pretraživanje na mobilnim uređajima) u drugom kvartalu 2017. u prosjeku je iznosio 54,3%, u prvom kvartalu ove godine - 54,7% (prema analitičkoj službi Yandex.Radar). Prema Liveinternet.ru, u lipnju ove godine Yandexov udio pretraživanja bio je 51,3%.