Shazam - co je to za program? "Shazam" online pro počítač bez stahování

Překlad

V restauraci začala hrát téměř zapomenutá písnička. Poslouchal jsi to v dávné minulosti. Kolik dojemných vzpomínek dokážou vyvolat akordy a slova... Zoufale si chcete tuto píseň poslechnout znovu, ale její název vám úplně vypadl z hlavy! Jak být? Naštěstí v našem fantastickém high-tech světě existuje odpověď na tuto otázku.

V kapse máte chytrý telefon, na kterém je nainstalován program pro rozpoznávání hudebních děl. Tento program je váš zachránce. Abyste zjistili název písně, nemusíte chodit z rohu do rohu a snažit se vylovit drahocenný řádek ze své vlastní paměti. A není pravda, že to vyjde. Program, pokud jej necháte „poslouchat“ hudbu, vám okamžitě sdělí název skladby. Poté můžete znovu a znovu poslouchat zvuky drahé vašemu srdci. Dokud se s vámi nesjednotí, nebo dokud vás to všechno neomrzí.

Za rozšířené používání vzorkovací frekvence 44100 Hz vděčíme především korporaci Sony. V mé době zvukové stopy, takto zakódované, bylo vhodné kombinovat s videem ve standardech PAL (25 snímků za sekundu) a NTSC (30 snímků za sekundu) a pracovat s nimi pomocí stávajícího vybavení. Velmi důležité je také to, aby tato frekvence postačovala pro kvalitní přenos zvuku v rozsahu až 20 000 Hz. Digitální zvukové zařízení, používající tuto vzorkovací frekvenci, byl v kvalitě zcela konzistentní s analogovým vybavením z dob, kdy se utvářely standardy digitální zvuk. Ve výsledku se tak při volbě vzorkovací frekvence zvuku při nahrávání s největší pravděpodobností zastavíte na 44100 Hz.

Záznam: Audio Capture

Nahrávání vzorkovaného zvukového signálu je poměrně jednoduchý úkol. Moderní zvukové karty obsahují vestavěné analogově-digitální převodníky. Stačí tedy vybrat programovací jazyk, najít vhodnou knihovnu pro práci se zvukem, určit vzorkovací frekvenci, počet kanálů (obvykle jeden nebo dva, pro monofonní, resp. stereofonní zvuk), vybrat počet bitů v jeden vzorek (často se používá například 16 bitů) . Poté je třeba otevřít datový řádek ze zvukové karty, stejně jako otevření jakéhokoli vstupního proudu, a zapsat jeho obsah do bajtového pole. V Javě se to dělá takto:

Private AudioFormat getFormat() ( float sampleRate = 44100; int sampleSizeInBits = 16; int channel = 1; //Monaurální audio booleovský podepsaný = true; //Příznak označuje, zda jsou použita čísla se znaménkem nebo bez znaménka booleovský bigEndian = true; / /Flag označuje zda použít pořadí bajtů big-endian nebo little-endian return new AudioFormat(sampleRate, sampleSizeInBits, channels, sign, bigEndian); ) final AudioFormat format = getFormat(); //Vyplňte objekt třídy AudioFormat parametry DataLine.Info info = new DataLine.Info(TargetDataLine.class, format); final TargetDataLine line = (TargetDataLine) AudioSystem.getLine(info); line.open(format); line.start();
Nyní stačí načíst data z objektu třídy TargetDataLine. V příkladu je použit příznak běhu; jedná se o globální proměnnou, kterou může ovlivnit jiné vlákno. Například proměnná, jako je tato, nám umožní zastavit zachycování zvuku ze streamu uživatelské rozhraní pomocí tlačítka "Stop".

OutputStream out = new ByteArrayOutputStream(); běžící = pravda; try ( while (běh) ( int count = line.read(buffer, 0, buffer.length); if (count > 0) ( out.write(buffer, 0, count); ) ) out.close(); ) catch (IOException e) ( System.err.println("Problémy s I/O: " + e); System.exit(-1); )

Časová a frekvenční oblast

Naše pole obsahuje digitální reprezentaci zvukový signál v časové oblasti. To znamená, že máme informace o tom, jak se amplituda signálu měnila v průběhu času.

V 19. století učinil Jean Baptiste Joseph Fourier výjimečný objev. Spočívá v tom, že jakýkoli signál v časové oblasti je ekvivalentní součtu určitého počtu (možná i nekonečného) jednoduchých sinusových signálů za předpokladu, že každá sinusoida má určitou frekvenci, amplitudu a fázi. Soubor sinusoid, které tvoří původní signál, se nazývá Fourierova řada.

Jinými slovy, můžete reprezentovat téměř jakýkoli signál rozložený v čase pouhým zadáním sady frekvencí, amplitud a fází odpovídajících každé ze sinusoid, které tvoří tento signál. Tato reprezentace signálů se nazývá soubor frekvenčních intervalů. V jistém smyslu jsou informace o frekvenčním intervalu jako otisk prstu nebo signální signatura rozvíjená v průběhu času, což nám poskytuje statický pohled na dynamická data.

Signály se rozvinuly v čase a jejich frekvenční charakteristiky

Zde je návod, jak vypadá animovaná reprezentace Fourierovy řady pro obdélníkovou vlnu 1 Hz. Ukazuje také aproximaci původního signálu na základě sady sinusoid. Horní graf ukazuje signál v amplitudově-časové doméně, spodní graf ukazuje jeho znázornění ve formě amplituda-frekvenční.

Fourierova transformace v akci. Zdroj: René Schwarz

Analýza frekvenčních charakteristik signálů značně zjednodušuje řešení mnoha problémů. Je velmi výhodné provozovat takové charakteristiky v oblasti digitálního zpracování signálu. Umožňují studovat spektrum signálu (jeho frekvenční charakteristiky), určit, které frekvence jsou v tomto signálu přítomny a které ne. Poté můžete filtrovat, zvýraznit nebo zeslabit určité frekvence nebo jednoduše rozpoznat zvuk určité výšky mezi dostupnou sadou frekvencí.

Diskrétní Fourierova transformace

Musíme tedy najít způsob, jak získat frekvenční charakteristiky signálů rozložených v čase. K tomu nám pomůže diskrétní Fourierova transformace (DFT, Discrete Fourier Transform). DFT je matematická metoda Fourierova analýza pro diskrétní signály. Lze jej použít k transformaci konečného souboru vzorků signálu odebraných ve stejných časových intervalech na seznam koeficientů konečné kombinace komplexních sinusoid seřazených podle frekvence za předpokladu, že tyto sinusoidy byly vzorkovány na stejné frekvenci.

Jeden z nejpopulárnějších numerických algoritmů pro výpočet DFT se nazývá rychlá Fourierova transformace (FFT, Fast Fourier Transformation). Ve skutečnosti je FFT reprezentována celou sadou algoritmů. Mezi nimi se nejčastěji používají varianty algoritmu Cooley-Tukey. Tento algoritmus je založen na principu „rozděl a panuj“. Při výpočtech se využívá rekurzivní dekompozice původního DFT na malé části. Přímý výpočet DFT pro určitý soubor dat n vyžaduje O(n 2) operace a použití algoritmu Cooley-Tukey vám umožní vyřešit stejný problém v O(n log n) operace.

Není těžké najít vhodnou knihovnu, která implementuje FFT algoritmus. Zde je několik takových knihoven pro různé jazyky:

Veřejné statické Komplexní fft(Komplex x) ( int N = x.délka; // fft sudých prvků Komplexní sudý = nový Komplexní; for (int k = 0; k< N / 2; k++) { even[k] = x; } Complex q = fft(even); // fft нечетных элементов Complex odd = even; // повторное использование массива for (int k = 0; k < N / 2; k++) { odd[k] = x; } Complex r = fft(odd); // комбинируем Complex y = new Complex[N]; for (int k = 0; k < N / 2; k++) { double kth = -2 * k * Math.PI / N; Complex wk = new Complex(Math.cos(kth), Math.sin(kth)); y[k] = q[k].plus(wk.times(r[k])); y = q[k].minus(wk.times(r[k])); } return y; }
Zde je příklad signálu před a po FFT analýze.

Signál před a po FFT analýze

Rozpoznávání hudby: podpisy písní

Jedním z nepříjemných vedlejších účinků FFT je, že jakmile provedeme analýzu, ztratíme časové informace. (I když se tomu teoreticky lze vyhnout, v praxi to bude vyžadovat obrovské množství výpočetní výkon.) Například u tříminutové skladby můžeme vidět zvukové frekvence a jejich amplitudy, ale nevíme, kde přesně se v práci tyto frekvence vyskytují. A tohle je nejdůležitější charakteristika, což dělá z hudebního díla to, čím je! Musíme nějak zjistit přesné časy, kdy se jednotlivé frekvence objeví.

Proto použijeme něco jako posuvné okno nebo blok dat a transformujeme pouze tu část signálu, která do tohoto „okna“ spadne. Velikost každého bloku lze určit pomocí různých přístupů. Pokud například nahráváme dvoukanálový zvuk s velikostí vzorku 16 bitů a vzorkovací frekvencí 44 100 Hz, jedna sekunda takového zvuku zabere 176 KB paměti (44 100 vzorků * 2 byty * 2 kanály). Pokud nastavíme velikost posuvného okna na 4 KB, pak každou sekundu budeme potřebovat analyzovat 44 bloků dat. To je docela vysoké rozlišení pro podrobnou analýzu složení.

Vraťme se k programování.

Byte audio = out.toByteArray() int totalSize = audio.length int sampledChunkSize = totalSize/chunkSize; Komplexní výsledek = ComplexMatrix; for(int j = 0;i< sampledChunkSize; j++) { Complex complexArray; for(int i = 0; i < chunkSize; i++) { complexArray[i] = Complex(audio[(j*chunkSize)+i], 0); } result[j] = FFT.fft(complexArray); }
Ve vnitřní smyčce ukládáme data v časové oblasti (vzorky zvuku) do komplexních čísel s imaginární částí rovnou 0. Ve vnější smyčce procházíme všechny datové bloky a pro každý z nich spouštíme FFT analýzu.

Jakmile máme informace o frekvenčních charakteristikách signálu, můžeme začít generovat digitální podpis hudebního díla. Toto je nejdůležitější část celého procesu rozpoznávání hudby, který Shazam implementuje. Hlavním problémem je zde vybrat z obrovského množství frekvencí přesně ty, které jsou nejdůležitější. Čistě intuitivně věnujeme pozornost frekvencím s maximálními amplitudami (obvykle nazývanými vrcholy).

V jedné skladbě se však rozsah „silných“ frekvencí může lišit, řekněme, od tónu C kontraoktávy (32,70 Hz) po tón C páté oktávy (4186,01 Hz). To je obrovský interval. Proto místo analýzy celého frekvenčního rozsahu najednou můžeme vybrat několik menších intervalů. Výběr lze provést na základě frekvencí, které jsou typicky přítomné v důležitých hudebních složkách, a analyzovat individuálně. Můžete například použít intervaly, které tento programátor použil pro implementaci algoritmu Shazam. Jmenovitě se jedná o 30 Hz - 40 Hz, 40 Hz - 80 Hz a 80 Hz - 120 Hz pro nízké zvuky (například baskytara). Pro střední a vyšší zvuky se používají frekvence 120 Hz - 180 Hz a 180 Hz - 300 Hz (to zahrnuje vokály a většinu ostatních nástrojů).

Nyní, když jsme se rozhodli pro intervaly, můžeme jednoduše najít frekvence s nejvíce vysoké úrovně. Tyto informace tvoří signaturu pro konkrétní analyzovaný datový blok a jsou zase součástí signatury celé skladby.

Public final int RANGE = new int ( 40, 80, 120, 180, 300 ); // Funkce pro určení, jaký rozsah je frekvence ve veřejném int getIndex(int freq) ( int i = 0; while (RANGE[i]< freq) i++; return i; } // Результат – это комплексная матрица, полученная на предыдущем шаге for (int t = 0; t < result.length; t++) { for (int freq = 40; freq < 300 ; freq++) { // Получим силу сигнала: double mag = Math.log(results[t].abs() + 1); // Выясним, в каком мы диапазоне: int index = getIndex(freq); // Сохраним самое высокое значение силы сигнала и соответствующую частоту: if (mag >highscores[t]) (body[t] = frekv; ) ) // vytvořte hash tag long h = hash(body[t], body[t], body[t], body[t]); ) private static final int FUZ_FACTOR = 2; soukromý dlouhý hash (dlouhý p1, dlouhý p2, dlouhý p3, dlouhý p4) ( return (p4 - (p4 % FUZ_FACTOR)) * 100000000 + (p3 - (p3 % FUZ_FACTOR)) * 100000 + (p2 - (p2 % FUZ_FACTOR) ) * 100 + (p1 - (p1 % FUZ_FACTOR)); )
Všimněte si, že musíme počítat s tím, že nahrávání neprobíhalo za ideálních podmínek (tedy ne ve zvukotěsné místnosti). V důsledku toho je nutné zajistit přítomnost v záznamu cizí hluk a možné zkreslení nahraného zvuku v závislosti na vlastnostech místnosti. Tento problém je třeba brát velmi vážně, skutečné systémy Vyplatí se implementovat nastavení pro analýzu možných zkreslení a cizích zvuků (fuzz faktor) v závislosti na podmínkách, za kterých se nahrávání provádí.

Pro zjednodušení vyhledávání hudebních skladeb se jejich podpisy používají jako klíče v hashovací tabulce. Klíče odpovídají času, kdy se v díle objevila množina frekvencí, pro kterou byl nalezen podpis, a identifikátoru samotného díla (například název skladby a jméno interpreta). Zde je příklad, jak mohou takové záznamy vypadat v databázi.

Pokud tímto způsobem zpracováváte určitou knihovnu hudební nahrávky, bude možné vybudovat databázi s kompletními signaturami každého díla.

Hledejte shody

Abyste zjistili, jaká skladba právě hraje v restauraci, musíte nahrát zvuk pomocí telefonu a spustit jej výše popsaným procesem výpočtu podpisů. Poté můžete v databázi vyhledat vypočítané hash tagy.

Ale ne všechno je tak jednoduché. Faktem je, že mnoho fragmentů různých děl má stejné hash tagy. Například se může ukázat, že některá část písně A zní úplně stejně jako část písně E. A to není překvapivé. Hudebníci a skladatelé si od sebe neustále „půjčují“ úspěšné hudební postavy.

Pokaždé, když je nalezen odpovídající hash tag, počet možných shod se snižuje, ale je pravděpodobné, že tato informace sama o sobě nám neumožní zúžit vyhledávání natolik, abychom se spokojili s jedinou správnou skladbou. Proto musíme zkontrolovat ještě jednu věc v algoritmu rozpoznávání hudby. Totiž, mluvíme o časových razítkách.

Fragment písně, který byl nahrán v restauraci, mohl být odkudkoli v písni, takže prostě nemůžeme přímo porovnávat relativní časy v nahraném fragmentu s tím, co je v databázi.

Pokud je však nalezeno více shod, lze analyzovat relativní načasování shod a zlepšit tak spolehlivost vyhledávání.

Když se například podíváme na tabulku výše, zjistíme, že hash tag 30 51 99 121 195 patří skladbě A i skladbě E. Pokud o vteřinu později zkontrolujeme hash tag 34 57 95 111 200, zjistíme další shoda s písní A, navíc v takovém případě budeme vědět, že jak hash tagy, tak jejich rozložení v čase se shodují.

// Třída, která popisuje konkrétní okamžik v pracovní soukromé třídě DataPoint ( private int time; private int songId; public DataPoint(int songId, int time) ( this.songId = songId; this.time = time; ) public int getTime () ( návratový čas; ) public int getSongId() ( return songId; ) )
Nechat i1 A i2– to jsou časová razítka v nahrané skladbě, j1 A j2– časová razítka ve skladbě z databáze. Můžeme říci, že existují dvě náhody, s přihlédnutím ke koincidenci časového rozdílu, pokud je splněna následující podmínka:

RecordedHash(i1) = SongInDBHash(j1) AND RecordedHash(i2) = SongInDBHash(j2) AND abs(i1 - i2) = abs (j1 - j2)
Díky tomu se nemusíte starat o to, do které části skladby nahrávka patří: začátek, střed nebo úplný konec.

A konečně je nepravděpodobné, že by se každý zpracovaný fragment písně nahraný ve volné přírodě shodoval s podobným fragmentem z databáze postavené na základě studiových nahrávek. Záznam, ze kterého chceme zjistit název díla, bude obsahovat hodně šumu, což povede k určitým nesrovnalostem ve srovnání. Takže místo toho, abychom se snažili ze seznamu shod eliminovat všechny kromě jediného správného složení, na konci procedury porovnávání databáze seřadíme záznamy, které měly shody. Budeme řadit sestupně. Čím více shod je, tím pravděpodobnější je to, co jsme našli. požadované složení. V souladu s tím bude na vrcholu seznamu.

Zde je přehled celého postupu rozpoznávání hudby. Pojďme si to projít od začátku do konce.

Přehled postupu rozpoznávání hudby

Vše začíná originálním zvukem. Poté jej zachytí, najdou frekvenční charakteristiky, vypočítají hash tagy a porovnají je s těmi, které jsou uloženy v hudební databázi.

V takových systémech mohou být databáze jednoduše obrovské, takže je důležité používat řešení, která lze škálovat. Není potřeba speciální propojení databázových tabulek, datový model je velmi jednoduchý, takže nějaká ta NoSQL databáze se zde docela hodí.

Shazam!

Programy, jako je ten, o kterém jsme zde mluvili, jsou vhodné pro hledání podobných míst v hudebních dílech. Nyní, když rozumíte tomu, jak Shazam funguje, můžete vidět, že algoritmy rozpoznávání hudby jsou užitečné nejen pro vybavování názvů zapomenutých skladeb z minulosti v rádiích taxi.

Můžete je například použít k hledání hudebních plagiátů nebo je použít k nalezení umělců, kteří inspirovali některé z průkopníků v blues, jazzu, rockové hudbě, pop music nebo jiném žánru.

Možná by bylo dobrým experimentem naplnit databázi klasiky – díly Bacha, Beethovena, Vivaldiho, Wagnera, Chopina a Mozarta a hledat v jejich dílech podobnosti. Je tedy docela možné zjistit, že ani Bob Dylan, Elvis Presley a Robert Johnson nebyli proti tomu, aby si něco půjčovali od ostatních!

Ale můžeme je za to vinit? Jsem si jistý, že ne. Hudba je přece jen zvuková vlna, kterou člověk slyší, pamatuje si a opakuje si ji v hlavě. Tam se vyvíjí a mění – dokud není nahráno ve studiu a vypuštěno do volné přírody, kde může inspirovat dalšího hudebního génia.

Oh, pojďte pracovat s námi? :)

Myslím, že se na mě chystají házet rajčata a křičet "Ano, každý ví o Shazam!", a ani se neurazím - je to pravda, mnoho lidí o něm ví! A pro ty, kteří ještě nevědí, proč a k čemu je Shazam potřeba, je určen tento článek. No pro ty, kteří si rádi přečtou dobrý text a naučí se něco nového =)

Proč a co je Shazam potřeba?

Shazam eliminuje potřebu zběsile se ptát ostatních na název nebo se učit nazpaměť části textu neznámé, ale neuvěřitelně cool písně. To samozřejmě nejsou všechny funkce, ale hlavním účelem je přesně toto: identifikovat skladbu porovnáním nahraného fragmentu s daty na serveru.

Jak pracuje?

Zcela podřízeni Zákonu podlosti, než budete chtít zjistit, co hraje tak příjemně, skladba se již chýlí ke konci. S pochopením tohoto stavu se vývojáři snažili zkrátit interval mezi otevřením aplikace a začátkem rozpoznávání co nejkratší. Spuštění procesu je otázkou několika sekund a pouhých dvou klepnutí. Poté je fragment nahrán a odeslán na server, a pokud je píseň rozpoznána, Shazam vám poskytne všechny dostupné informace o ní i o jejím interpretovi.

Co může dělat?

Možnosti aplikace jsou poměrně velké. Špičkou ledovce je rozpoznání skladeb a jejich uložení do kategorie Moje značky. Řazení probíhá podle data; seznam zobrazuje jméno interpreta, skladbu, datum nahrávky a obal (pokud je k dispozici v databázi Shazam).

Klepnutím na rozpoznanou skladbu se dostanete na velmi rozsáhlou stránku, která vám umožní:

Shazam také ví, jak se připoutat účet na Facebooku, čímž se tvoří Seznam přátel- seznam lidí, které poznáte vy a vaši přátelé sociální síť písně.

Poslední sekce, často ignorovaná uživateli (a marně), je volána Objevit a umožňuje vám prohledávat zvukovou databázi Shazam, sledovat světové a evropské žebříčky a číst servisní blog.

Nastavení Programy jsou velmi intuitivní a jednoduché. Teoreticky do této sekce možná nikdy nevstoupíte.

Možná použití

Za více než rok používání jsem vyvinul několik scénářů použití programu:

identifikaci přehrávané skladby
sestavení seznamu skladeb (alb, interpretů), které stojí za pozornost a poslech (stává se, že i když skladbu znám, ale když se ocitnu u počítače, nevzpomenu si, co jsem chtěl poslouchat)
vyhledávání informací o konkrétním interpretovi, sledování videoklipů
hledat nové umělce v žebříčcích

Konečně

Shazam je opravdu dobrý v rozpoznávání skladeb, i když do nahrávky zasahují četné cizí zvuky. Ale stojí za to věnovat pozornost skutečnosti, že buď velmi nezná ruskojazyčný repertoár, nebo není vůbec obeznámena. Můžete jej používat i bez připojení k internetu – zaznamenaný fragment lze později rozpoznat. Můj poslední argument ve prospěch Shazamu je, že je zdarma (ale s reklamní banner). To je extrémně užitečná pomůcka zaujalo čestné místo na první obrazovce mého iPhone a vůbec toho nelituji.

Použití na zdraví!

P.S. Existují také placené verze: Shazam Encore(LyricPlay, hudební doporučení, podpora last.fm a Pandora) a Shazam Red(pomáháme bojovat proti viru imunitní nedostatečnosti v Africe)

	Shazam Cena: zdarma Vývojář: Shazam Entertainment Ltd. Revidovaná verze: 4.7.4 Redakční skóre: ★★★★★

	Shazam Encore Cena: 5,99 $ Vývojář: Shazam Entertainment Ltd. Revidovaná verze: 4.7.5 Redakční skóre: ★★★★★

	Shazam pro iPad Cena: zdarma Vývojář: Shazam Entertainment Ltd. Revidovaná verze: 2.5.0 Redakční skóre: ★★★★★

Každým rokem vychází více a více hudby, ale málokdo z ní neosloví nikoho. Je velmi obtížné sledovat trendy, pokud to neděláte 24 hodin, a poměrně často slyšíme různá místa zajímavé skladby, ale jak víte, jaká hudba hraje?

Dříve byla situace taková, že se po měsících či letech objevila písnička, která se mi líbila a už byla zapomenuta, nebo bylo možné ze zdroje zjistit autora skladby. Každopádně proces zaplňování audiotéky byl velmi zdlouhavý a místy bolestivý, ale dnes je tu Shazam.

Shazam - co je to za program?

Shazam vám pomůže najít skladbu, která se vám líbí, na základě její části, přesněji 10sekundového úryvku. Díky speciálním algoritmům se před vámi objeví jméno umělce a jeho kompozice. Díky jednoduché manipulaci můžete získat vše nezbytné informace Tady a teď.

Program pro rozpoznávání hudby funguje pro Android, iPhone a obecně jakékoli další platformy, kde je vestavěný reproduktor a síťový přístup. V prostředí aplikace nejste absolutně omezeni, za mnoho let práce se stalo nejen multiplatformním, ale přidalo i mnoho dalších funkcí.

Zpočátku Shazam fungoval podle následujícího schématu: zavoláte na číslo a přehrajete úryvek písně, poté obdržíte SMS s názvem písně; tato služba byla placená. Od té chvíle proteklo pod mostem hodně vody a tento moment rozpoznávací program Shazam hudba se stal známým po celém světě a dokonce získal svůj vlastní výraz „shazam“ - tak uživatelé nazývají proces hledání zvuku.

Nyní aplikace umí nejen najít hudbu, ale navíc vám ukáže: odkaz na oficiální obchod platformy pro stahování audia, pokud je k dispozici obrázek, který obsahuje oficiální obal alba. Pokud je klip nahrán, obdržíte na něj odkaz. Navíc byly zavedeny funkce sociálních sítí, kde můžete komunikovat s přáteli, prohlížet si jejich vyhledávací kanál a prohlížet si hodnocení nejoblíbenějších skladeb na světě. Program má samozřejmě historii vyhledávání a můžete si ji prohlédnout, pokud jste zapomněli název melodie.

Shazam se také umí synchronizovat s dalšími službami, jako je Spotify nebo Rdio. Schopnost vyhledávat podle textů písní.

Shazam, jak používat?

Přibližný princip fungování je následující: program zaznamená 10 sekund. dráha. Poté jej nahraje na společný centrální server, kde pomocí výkonného robota probíhá vyhledávání v určitých bodech. Pravděpodobnost nalezení složení je velmi vysoká, i když ne 100%. Databáze služeb již obsahuje přes 40 milionů skladeb.

Pro úspěšné používání aplikace musíte mít přístup k internetu, jinak bude postup také proveden, ale podle jiného principu. Segment bude zaznamenán, ale proces rozpoznávání bude k dispozici, když získáte přístup k síti a jednoduše stisknete příslušné tlačítko.

Služba Shazam je v zemích SNS zdarma a neexistuje žádná placená verze. Obecně existuje komerční varianta a její jedinou výhodou je absence reklamy. Bohužel, ale jako mnozí aplikace zdarma, Shazam vydělává peníze prostřednictvím reklamy.

Používání programu je velmi jednoduché a přístupné i těm nejnešťastnějším uživatelům; musíte:

Stáhněte si samotnou aplikaci, najdete ji v oficiálním obchodě a je zdarma, pro Android https://play.google.com/store/apps/details?id=com.shazam.android&hl=ru;
Spusťte program;
Klikněte na symbol Shazam, kulaté tlačítko uprostřed;

Přeneste svůj smartphone, tablet nebo notebook ke zdroji hudby;

Po 10 sekundovém záznamu obdržíte informace, které hledáte.

Stojí za zvážení, že program je docela chytrý a dokáže odfiltrovat šum a rušení, pokud jsou v malém množství. Pokud se však vyskytne velká hladina hluku třetích stran, melodii nenajdete, budete ji muset pokud možno odstranit nebo změnit polohu.

Služba funguje nejlépe se známými skladbami a anglicky mluvícími interprety, ale docela dobře identifikuje i ruské písně.

Po uspokojivém výsledku dostanete maximum informací o interpretovi i samotném díle, vývojáři nezapomněli ani na texty. Budou zde také odkazy na další zdroje, jako je Wikipedie, které popisují historii života/díla hudebníka a někdy i zajímavé okolnosti související s psaním písně.

Existují i další služby s podobnou funkcionalitou, ale se Shazamem se to dá jen velmi těžko srovnávat, dnes má firma kapitál přes 1 miliardu dolarů. Vzhledem k rozsahu korporace je zřejmé, že pravděpodobnost úspěchu ve vyhledávání je mnohem vyšší.

Všechny prezentované vlastnosti a možnosti programu z něj dělají neocenitelného pomocníka, který mnohonásobně usnadní proces doplňování vaší zvukové knihovny. Poslouchejte jen ty nejlepší písně se Shazam!

Pokud máte stále dotazy na téma „Co je Shazam? Základní funkce a použití programu“, pak se jich můžete zeptat v komentářích

if(function_exists("the_ratings")) ( the_ratings(); ) ?>

Jak Shazam funguje? Otázka, která zajímá mnoho uživatelů. Jaký je vlastně princip fungování této služby?

Jedná se o program, který vám umožní rozpoznat hudební skladby. Chcete-li jej spustit, musíte kliknout na tlačítko v okně aplikace, které se objeví. Spustí skener, který odešle data na server k rozpoznání.

To znamená, že princip fungování služby Shazam je následující:

- původně byla vytvořena databáze s hudebními otisky prstů,
- každý uživatel si může kliknutím na tlačítko v programu „označit“ skladbu, která ho zajímá. Úsek, který hledáte, musí trvat alespoň 10 sekund,

aplikace jej nasměruje na službu, kde probíhá proces vyhledávání,
pokud byla nalezena melodie, na displeji se okamžitě zobrazí informace - název, interpret, žánr, ale pokud nebyly nalezeny žádné shody, je odesláno upozornění na chybu.

To jsou základní principy služby.

Aby Shazam fungoval efektivněji, můžete zařízení přiblížit ke zdroji hudby.

Další podrobnosti o „otiscích prstů“

Co jsou to "otisky prstů"? Když uživatel „označí“ skladbu, která ho zajímá, program pro ni vygeneruje desetisekundový „otisk prstu“ – zvukový vzorek.

Mnoho skladeb je uloženo v databázi Shazam a informace jsou pravidelně aktualizovány. Ve všech vzorcích se rozlišují tři hlavní ukazatele - frekvence, časová náročnost. Když člověk začne hledat melodii, skener ji vygeneruje do „otisku prstu“, který se skládá z frekvence, času, intenzity.

Skladba se tak promění v časově-frekvenční graf, tzv. spektrogram, jehož body musí odpovídat jednomu ze vzorků v databázi. Takhle funguje Shazam!

Servisní rozhraní

Program je navržen v modré barvě. Rozhraní služby je velmi jednoduché. Po spuštění aplikace se na obrazovce mobilního telefonu objeví okno programu se singlem velké tlačítko. Kliknutím na něj se spustí proces skenování kompozice a na obrazovce se objeví animace připomínající načítání.

Po naskenování melodie se informace o ní objeví v samostatném okně, v jehož spodní části jsou další informace o skladbě.

Nabídka ukládá vaši historii vyhledávání, kterou si můžete kdykoli prohlédnout.

Již jsme přišli na to, jak Shazam funguje, ale tento program má další výhody:

Pokud Shazam nefunguje správně, existuje několik způsobů, jak situaci napravit. Pokud je tedy nutné rozpoznat skladbu, objeví se na displeji mobilního telefonu zpráva – „Bohužel jsme skladbu nemohli rozpoznat! Ujistěte se, že máte telefon blízko zdroje zvuku.

Dnes je těžké tomu uvěřit, ale před dvěma desetiletími bylo získávání informací pomocí mobilního telefonu poněkud obtížnější než nyní. Nebylo Obchod s aplikacemi ke stažení jakékoli aplikace za půl minuty, žádná Siri, která nastaví budík a připomene vám, abyste zavolali rodičům, žádné „Okay, Google“, připravená odpovědět na jakoukoli otázku.

V té době, abyste mohli podat žádost, museli jste (kdo si pamatuje?) „poslat zprávu na krátké číslo” (například 411 je kód adresáře adres ve Spojených státech). Abyste při diskusi zaujali oponenta svými znalostmi, museli jste poslat SMS s textem GOOGL na číslo 46645 (ano, i s tím začal Google).

V (zpět) roce 1999 byl krátký kód 2580 jen jedním z mnoha, ale tento kód měl zvláštní poslání: s jeho pomocí byly prováděny magické transformace. Volba čísel také není náhodná: tvoří svislou čáru na klávesnici telefonu a právě tato čísla se stala klíčem k hudebnímu impériu Shazam.

Shazam původně sídlil v Londýně a kdokoli ve Spojeném království, kdo slyšel neznámou píseň, mohl vytočit číslo 2580 a nahrát 30 sekund zvuku. Poté hovor automaticky skončil a uživatel obdržel SMS s názvem skladby a interpretem a někdy (pokud byla skladba dostupná v databázi Shazam) hypertextovým odkazem pro stažení vyzváněcího tónu.

Zakladatelé Shazamu

Pro zakladatele startupu – Chrise Bartona, Philipa Ingelbrechta, Averyho Wanga a Dhiraje Mukherjeeho – byl tento proces čirou magií. Navzdory skutečnosti, že zpočátku uživatelé znali pouze čísla 2580, služba se od samého počátku nazývala Shazam. A pokud pro fanoušky komiksů bylo toto slovo spojeno s Captain Marvel a pro fanoušky basketbalu se Shaquillem O’Nealem ve filmu Kazaam, pro zakladatele startupu to znamenalo okamžitě kouzlo.

Proč Shazam?

Na Pioneer's Festival ve Vídni v roce 2013 Barton řekl: „Slovo Shazam ve slovníku skutečně existuje. Toto je zvolání, které znamená „když kouzlíš krásné věci“. Například, kdybych se potřeboval teleportovat na festival ze San Francisca a byl jsem tu okamžitě, řekl bych „Shazam! Tady jsem ve Vídni!

„Rozhodli jsme se, že význam slova Shazam je dokonalý pro popis magického procesu rozpoznávání hudby. A (překvapivě) i dnes, po mnoha letech, zůstává základem celé řady Shazam. Společnost se snaží ukázat tento magický proces na obrazovce smartphonu každého uživatele.“

Každý, kdo někdy používal Shazam, bude pravděpodobně souhlasit s tímto tvrzením, protože ačkoli technologie od volání krátkého kódu ušla dlouhou cestu, podstata zůstává stejná. Uživatelé chytrých telefonů a počítačů si mohou stáhnout aplikaci, otevřít ji a nahrát skladbu nebo televizní pořad (nebo namířit fotoaparát na obrázek časopisu) a — SHAZAM! - informace se objeví okamžitě.

V zákulisí kouzelnické show však aplikace vytvoří komplexní zvukový nebo vizuální otisk obsahu a porovná jej s databází více než 15 miliard skladeb a obrázků pro zápas. Všechno vypadá kouzelně, ale Shazam používá k rozpoznání zvukového obsahu složitý algoritmus a řadu technologií.

„Před spuštěním Shazamu jsme čelili mnoha překážkám,“ říká Chris Barton. „A tím hlavním bylo vytvoření rozsáhlého (a skutečně fungujícího) algoritmu, který dokáže identifikovat skladbu i v hlučném prostředí. Pak o tom bylo potřeba říct širokému spektru uživatelů. Další překážkou je shromáždit a přepsat dostatek hudby, aby služba fungovala; vytvořte si svůj vlastní mini-Google, svůj vlastní vyhledávač a vlastní shluk paralelně pracujících počítačů, desítky počítačů, které by se na nich ukládaly pevné disky akustické otisky prstů každé skladby."

Pomoc přišel od profesora elektrotechniky na Stanfordské univerzitě Julia Smithe, který byl známý vytvářením algoritmů pro syntezátory Yamaha. Smith se rychle stal poradcem Shazama a představil tým svému tehdejšímu postgraduálnímu studentovi Averymu Wangovi, jedinému ze zakladatelů, který ve společnosti stále pracuje — slouží jako hlavní vědecký poradce.

Když byl algoritmus vytvořen a služba začala fungovat, přišel čas na plnohodnotný program. Shazam, který se stal jednou z prvních aplikací pro App Store v roce 2008, se o pět let později umístil v TOP 10 aplikací na světě.

Zpočátku uživatelé služby platili za volání na krátké číslo, pokud Shazam dokázal identifikovat požadovanou skladbu. Aplikace dnes v rámci sharewarového provozního modelu dělá divy. Základní verzi si lze stáhnout a jejího velkého bratra, Shazam Encore, lze zakoupit v USA a získat exkluzivní informace o televizních pořadech (např. členové obsazení, odkaz na oficiální webovou stránku, celebrity, hudba použitá v pořadu, zdroje Twitteru, podrobnosti o IMDB a mnohem více). A nyní, když je aplikace k dispozici pro použití na chytrých hodinkách, lze k informacím o jakékoli skladbě přistupovat pouhým dotykem zápěstí.