Smf tarafından desteklenen dizin php konusunu alır. Ders üç. En iyi bazları kendi başımıza topluyoruz. Rusça dilini desteklemeyen modları yüklerken sorunları çözme
Botmaster Labs tarafından düzenlendi, planlanmadı. Zaman yok, yeni moda bir trend olarak yarışma için videoya ihtiyaç var, ancak her şeyi iyi ekran görüntüleriyle (IMHO'm) açıklamak daha kolay olsa da ve gerçekten hiçbir şey çekmek istemiyorum. Çok az karlı konu kaldı, aptal spam artık hiç kural değil, burada düşünmeniz gerekiyor ve eski olanlar onu güzel bir ambalajın içine koyup biraz pudralamaya çalışırsa kimse konuyu çekmeyecek. :) Ama bu bizimle ilgili değil. Genel olarak, bu 3 "değil", bence, temelde çoğu potansiyel katılımcı için yarışmaya katılımın önündeki engeller haline geldi. Üç arabadan birinin tamiri gibi: ucuz, kaliteli, hızlı - hizmette aynı anda yalnızca 2 koşulu yerine getirebilirler. otur ve sana yakın olanı seç. :) Yarışmada da durum aynı: Vaktim var video çekerim ama konu yok veya video çekerim konu var ama hiç zamanım yok veya var boş zaman ve küçük bir konu var ama video korkutuyor. Ancak 2 koşulun aynı anda karşılanması iyidir. Tamam, şarkı sözlerini bırakalım. kendime devam edeceğim. Plan yapmadım, o yüzden yarışmaya katılacağım, hatta hangi maddeye oy vereceğimi seçtim. Ne istersen söyle ama Doz yazılımı çok iyi biliyor ve onu çok mantıklı bir şekilde nasıl kullanacağını biliyor. Ama bugün yarışmada entrikanın ortaya çıktığını öğrendim. Görünüşe göre oy kullanamayacağım, ancak yalnızca yazılımı 2011'de satın alan ve yarışma onlar için tasarlanmış yeni başlayanlar yapabilir. Biraz şaşırdım ama sahibi bir beyefendi. Yarışma bir reklam kampanyasıdır ve Alexander bunu nasıl yürüteceğini daha iyi bilir. Genel olarak, o zaman bir makale yayınlamaya karar verdim, bunu kimin için, aslında tüm kollektif çiftlik için yapmanın imkansız olduğu açık olduğunda yazmak biraz daha kolay.
Uzun giriş bitti, şimdi konuya gelelim.
Yeni başlayan biri, Xrumer + Hrefer kompleksi olan böyle bir süper biçerdöver edindiğinde neye ihtiyaç duyar? Bu doğru, bunun üzerinde nasıl çalışılacağını öğrenin ve spam sayfaları göndermeye başlayarak para kazanabileceğiniz yanılsamasını bir kenara bırakın. Öyle düşünüyorsanız, paranızı hemen hayır kurumlarına bağışlayın. Kompleksin araçlarını nasıl kullanacağınızı öğrenmeniz, tercihen kendiniz için keskinleştirmeniz gerekir. "Daha fazlasını al - daha fazlasını at" zamanı geride kaldı. Nicelik yerini niteliğe bırakır. Bu yüzden üssü kendimiz toplayacağız, nasıl yapılacağını öğrenmeyin - trenin gerisinde kalacaksınız. Elbette Khrefer bu konuda bize yardımcı olacaktır. Kaynaklarınızı Google'da tanıtmayı planlıyorsanız, Google aracılığıyla bağış yapan siteleri de aramamız gerekir. Bence bu anlaşılır ve mantıklı. Ancak Google, bakır dağın metresi olarak servetini herkese vermiyor. Bir yaklaşıma ihtiyacı var. Hemen söylemek isterim ki, halk arasında bulduğunuz işaretlere göre bir şeyler toplayacağınızı ummayın. Bu yüzden değersiz oldukları için halkın içinde bulunurlar. Konuyu daha fazla geliştirmeyeceğim. Sonucu görmek için nasıl doğru bir şekilde monte edeceğinizi söylemek daha iyidir, gerisini kendiniz sonuçlandırırsınız, asıl mesele prensibi anlamaktır. Genel olarak forumların işaretlerine göre değil, ihtiyacımız olan belirli motorların işaretlerine göre doğru olana göre toplamak gerekir. Bu, yeni başlayanların ana hatasıdır - belirli bir şeye konsantre olmak değil, her şeyi bir bütün olarak ele almaya çalışmak. Yine de, aşağı yukarı normal bir tabanı ayrıştırmak istiyorsanız, sorgularda işleçleri kullanmayı reddedin. "inurl:", "site:", "title" vb. Google, sizin gibi arama yapanları anında yasaklar. Bu nedenle, Chrumer'in şu anda çalışmakta olduğu motorları dikkatle inceliyoruz:
php-Fusion tarafından desteklenmektedir
Chrumer 7.07 sürümünde, program birkaç yeni motorla eğitilmiştir:
forumi.biz, forumb.biz, 1forum.biz, 7forum.biz, vb.
phpBB-fr.com, Solaris phpBB teması
Ve sürekli yeni şeyler öğrenme süreci devam ediyor.
Genel olarak, Khrefer tarafından ayrıştırma için doğru sorguları hazırlamamız gerekir. Örnek olarak forum dizhok'u ele alalım. SMF Forumları. Ve ayrıştırmak için parçalara ayırmaya başlayacağız. Sevgili Google'ımız bu konuda bize yardımcı olacaktır. Bir Google Sorgusu Girme SMF Forumları- konuyla ilgili çok fazla çöp var, 13. sayfaya geri dönün ve herhangi bir bağlantıyı seçin. Bununla karşılaştım: http://www.volcanohost.com/forum/index.php?topic=11.0 . Hadi açalım ve keşfedelim. Bu motordaki diğer sayfaları aramaya uygulanabilecek sayfada karakteristik bir şey bulmamız gerekiyor. Altbilgide aşağıdaki yazıyı görüyoruz SMF 1.1.14 tarafından desteklenmektedir, alıntı yapıp Google'a giriyoruz, bize bu istek için yaklaşık 59 milyon seçenek bildiğini gösteriyor. Bağlantıları gözden geçiriyoruz, bu anahtar kelimeye birkaç seçenek daha ekliyoruz, örneğin, "SMF 1.1.14 tarafından desteklenmektedir" kavak veya SMF 1.1.14 Viagra tarafından desteklenmektedir. Talebin şık olduğuna, yalnızca forumların verilmesine ve sizin için neredeyse hiç çöp olmadığına ikna olduk.
Ayrıca yukarıda da söylediğim gibi nicelikle değil nitelikle ilgileniyoruz. Devam etmek. Aynı forumdan altbilgiden başka bir cümle alıyoruz: , ayrıca alıntı yapın ve Google'a iletin. Yanıt olarak, 13 milyondan fazla sonuç bildiğini ortaya koyuyor. Yine, çıktıyı gözden geçiriyoruz, ek kelimeler ekliyoruz ve çıktıyı onlarla kontrol ediyoruz. İsteğin mükemmel olduğundan ve neredeyse hiç çöp olmadığından emin oluyoruz. Genel olarak, zaten 2 demir isteği var. İlk forumun şimdilik kendi haline bırakılmasını ve diğer forumlardan talep toplamaya devam edilmesini öneriyorum. Neyse ki, Google istek üzerine açıktır 2006-2008 Basit Makineler LLC. Sorundan örneğin şu forumları alıyoruz: http://www.snowlinks.ru/forum/index.php?topic=1062.0 ve http://litputnik.ru/forum/index.php?action=printpage; topic=380.0 alt bilgilerinde onlardan şu istekleri alıyoruz: "Powered by SMF 1.1.7" ve "Powered by SMF 1.1.10" (Khrefer isteklerini her zaman tırnak içinde iletmenizi tavsiye ederim, çünkü önce kaliteye ihtiyacımız var Tümü). Sanırım ne yaptığımız açık, sonunda SMF motorundaki forumları aramak için belirli bir sorgu veritabanına sahip olacağız (örnek olarak seçildi, diğer motorlarla benzer).
Bunun gibi bir şey görünecek:
SMF 1.1.2 tarafından desteklenmektedir
SMF 1.1.3 tarafından desteklenmektedir
SMF 1.1 RC2 tarafından desteklenmektedir
SMF 1.1.4 tarafından desteklenmektedir
SMF 1.1.8 tarafından desteklenmektedir
SMF 1.1.7 tarafından desteklenmektedir
"2006-2008, Basit Makineler LLC"
Ve hepsi bu değil. Motorların sürümlerini toplarken, bazı SMF forumlarının altbilgisinde "2001-2006, Lewis Media" uzantısını buluyoruz. Bu talebi kontrol ediyoruz, bu da bizi tamamen tatmin ediyor. Benzer bir sorgu buluyoruz: "2001-2005, Lewis Media". Alt bilgileri daha fazla çalıştırdığımızda şu talebi buluyoruz: "SMFone design by A.M.A, ported to SMF 1.1". Şuna bakın - harika. Ve benzeri. Yarım saatlik çalışma ve motorla ilgili harika bir sorgu veritabanınız var ve bu sorgular için Google, içlerinde operatör kullandığınızdan çok daha az yasaklayacak. Ve aynı zamanda, veritabanınız "index.php?topic=" gibi sorguları kullandığınızdan çok daha temiz olacaktır, çünkü burada Google yalnızca ihtiyacımız olan forumları değil, aynı zamanda mümkün olduğu yerlerde kalan birçok kaynağı da verecektir. forum konusuna bir bağlantı bırakın. Tartışabilirsin, derler ki, bunun nesi yanlış? Diğerleri bir bağlantı bıraktı, böylece yapabiliriz. Ancak! Bağlantılar yalnızca Hrumer tarafından değil, diğer programlar tarafından da bırakılabilir. ayrıca, belirli bir kaynakta, sözde son derece uzmanlaşmış yazılımda yorum bırakmak için özel olarak keskinleştirilebilirler ve bu tür bağlantılar elle bırakılabilir. Tekrar ediyorum, bizim için önemli olan hurdanın niceliği değil niteliğidir, nasılsa doğru taleplerle tabanını toplayacağız. Bu yöntemin avantajı, pratik olarak yapılandırmanıza gerek kalmayacak olmasıdır. elek filtresi
, basitçe kapatılabilir, çünkü Google pratik olarak size çöp vermez.
İlk aşamada Chrefer'ı doğru kullanmayı öğrenmenin çok önemli olduğunu düşünüyorum çünkü bunu öğrendikten sonra, durum nasıl değişirse değişsin Chrumer'ı her zaman kullanabilirsiniz. Korumalar daha karmaşık hale geliyor ve bazı motor türlerinde koruma güçlendirildiyse ve Khrumer şu anda bununla baş edemiyorsa, bu bağlantıları toplamak için kaynakları boşa harcamanın ve ardından Khrumer ile üzerinde çalışmanın bir anlamı yok. Sonucu neyin verdiğine odaklanmak daha iyidir. Aynı zamanda, Botmaster Labs ekibi Chrumer'a yeni bir şey öğrettiyse, yeni bir hastayı hızla inceleyebilir ve hasta hala sıcakken Chrumer'ın tabanını hazırlayabilirsiniz. Vakit nakittir, üssü satın aldığınızda kaynak artık alakalı olmayabilir. birisi tarafından toplanır. Ek olarak, kendiniz için doğru üs koleksiyonu, Khrumer'in "beyaz" kullanımını büyük ölçüde genişletir. Ve istesek de istemesek de her şey tam olarak burada hareket ediyor ama beyazlama ya da beyazlama süreci devam ediyor. Geçmişe gidebileceğiniz her şey için siyah çarşaflar.
Hrefer ile çalışmanın zaten teknik olan diğer tüm yönleri yardımda görüntülenebilir ve bunlar üzerinde durmanın bir anlamı yoktur, tüm hedefler-puanlar-saniyeler her araba için ampirik olarak ayrı ayrı belirlenir.
Bonus olarak, buraya Çinli arama motoru Baidu'yu ayrıştırmak için bir şablon göndereceğim, geçen gün bana soruldu, bu yüzden arada yaptım, kelime oyunu için özür dilerim. :)
Ana bilgisayar adı=http://www.baidu.com
Sorgu=s?wd=
LinkMaskesi=
Toplam Sayfa=100
Sonraki Sayfa=
SonrakiSayfa2=
CaptchaURL=
CaptchaImage=
CaptchaField=
Ayrıştırmayı test etmeye çalıştım, yasak yoktu, Khrefer kaynakları hızlı bir şekilde topladı, tüm ayrıştırma istekleri Google'ınkine benziyordu, ancak çok sayıda Çin kaynağı vardı ve yüksek PR ile ve ayrıca birçok yer vardı Avrupalıların ayak basmadığı yerlere. Çince isteklerle ayrıştırmak daha iyidir. Google Çeviri bu konuda yardımcı olacak, Rusça bir anahtar kelime listesi yazıp Çince'ye çevirecektir. içindeki gerçek kelimeler"Chrefer'in sözleri Çince'de bir araya getirilemez, yeniden kodlanmaları gerekir.
Çince yerine:
伟哥 - viagra
吉他 - gitar
其他 - dinlenme
保险公司 - sigorta
Değiştirmek için bu kodları Words dosyasına koyun:
%E4%BC%9F%E5%93%A5
%E5%90%89%E4%BB%96
%E5%85%B6%E4%BB%96
%E4%BF%9D%E9%99%A9%E5%85%AC%E5%8F%B8
Sigorta için bir site tanıtıyorsanız, profilinize tematik (!) bir bağlantı göndererek, hatta istek üzerine bir Çin forumu bulundu " forum SMF" 保险公司çok iyi olacak
Sonuç olarak, Khrefer'lerin kötü olduğundan veya ayrıştırılmadığından şikayet eden insanları asla anlamadığımı söylemek isterim, hep bunu söylemek istemişimdir, sadece onları nasıl pişireceğinizi bilmiyorsunuz. Tek bir ayrıştırıcı, yönlendirenden daha iyi değildir, sadece doğru olması gerekir. Hrefer bir araba: iyi, sağlam, Alman yapımı, ancak bir kişi onu kontrol ediyor ve her şey ne kadar akıllıca kullanıldığına bağlı, arabayı aynı anda sağa ve sola gitmeye zorlayamazsınız.
Ayrı bir konu, 3 yıl önce bir önceki yarışma için bir kez üslerin temizliğidir. Oradan, her şey hala alakalı, ancak şimdi 200'ü kontrol etmeyi reddedebilirsiniz, tamam, bu süreci gerçekten beğenmedim, hatalar çok büyüktü, çok fazla gereksiz filtrelendi. Şimdi bu, Chrumer'ın çalışması sırasında neredeyse otomatik olarak yapılabilir, ancak bu süreç "200 OK" kontrolünün tam bir benzeri değildir. Genel olarak, şu noktaya kadar: Kısa bir süre önce, Khrumer'de harika bir fırsat ortaya çıktı - projenin yürütüldüğü sırada kaynaklardan bilgi çalmak. Bu gibi görünüyor. Çalışma sırasında işlenecek bir şablonda sürüyorsunuz ve şablona göre toplanan bilgiler Günlükler klasöründeki xgrabbed.txt dosyasına girilecek. Bu işlevi her şey için kullanabilirsiniz, fantezi uçuşu çok büyük. Bağlantıları "süresi dolmuş" çalışma tabanından kaldırmak için bu işlevi haftada bir kullanıyorum. Üssü bu tür kaynaklardan temizlemek için forumların her gün öldüğü bir sır değil ve "Otomatik Kapma" aracı bu durumda bize yardımcı olacaktır.
Ne de olsa, genellikle http://www.laptopace.com/index.php yazarak, bu etki alanının zaten örneğin goudyadya olduğunu görüyoruz, ancak orada forum yok. Yani bu cürufu tabandan atmak için soyacağız. :) Sayfanın kaynak kodunu açıyoruz ve orada şu girişi görüyoruz:
Artık goudaddi'deki tüm "ölüler" bizim tarafımızdan ismen bilinecek.
Veritabanını farklı "süresi dolmuş" alanlardan temizlemek istiyorsanız, "Otomatik Yakalama" aracı için küçük bir seçim: