Index php tematska grupa powered by smf. Treća lekcija
U organizaciji Botmaster Labs, nije planirano. Nemam vremena, video je potreban za takmičenje, kao novopečeni trend, mada se sve može lakše objasniti dobrim screenshotovima (moj IMHO), a ne želim baš ništa da snimam. Ostalo je jako malo profitabilnih tema, glupi spam vise ne vlada, ovde treba misliti i niko nece da puca teme, osim ako ne probate da zastarele ubacite u lep omot i malo napudrate. :) Ali ovo nije o nama. Generalno, ova 3 „ne treba“, mislim, u osnovi su za većinu potencijalnih učesnika postala barijera za učešće u takmičenju. To je kao da popravite automobil od tri: jeftino, kvalitetno, brzo - usluga može ispuniti samo 2 uslova istovremeno. sedi i biraj šta ti je bliže. :) Tako je i sa konkurencijom: imam vremena, znam da napravim video, ali nema teme, ili znam da napravim video, postoji tema, ali nemam vremena na sve, ili imam slobodnog vremena i postoji mala tema, ali video je strasan. Ali ovo je dobro ako su istovremeno ispunjena 2 uslova. Pa, ok, odbacimo stihove. Nastaviću do sebe. Nisam planirao, što znači da sam učestvovao na konkursu, čak sam birao za koji članak ću glasati. Šta god da kažete, Doz jako dobro poznaje softver i zna kako ga vrlo inteligentno koristiti. Ali danas sam saznao da se u konkurenciji pojavila intriga. Ispostavilo se da ja neću moći da glasam, a to će moći da urade samo novopridošlice koji su kupili softver 2011. godine, a takmičenje je za njih osmišljeno. Bio sam malo iznenađen, ali vlasnik je džentlmen. Takmičenje je reklamna kampanja i Aleksandar bolje zna kako da je izvede. Uglavnom, odlučio sam da objavim članak, nešto je lakše napisati kada je jasno za koga, za cijeli kolektiv, to je, zapravo, nemoguće učiniti.
Dugi uvod je završen, sada na stvar.
Šta je potrebno početniku kada je kupio ovakav superkombajn, a to je kompleks Xrumer + Hrefer? Tako je, naučite kako raditi na tome i odbacite iluziju da možete zaraditi novac tako što ćete početi slati neželjenu poštu. Ako tako mislite, bolje je odmah donirati svoj novac u dobrotvorne svrhe. Morate naučiti kako koristiti alate kompleksa, po mogućnosti izoštravajući ga za sebe. Vrijeme „uzmi više – baci dalje“ je prošlo. Količina ustupa mjesto kvaliteti. To znači da ćemo sami sastaviti bazu, ako ne naučite kako to učiniti, zaostat ćete za vlakom. Naravno, Khrefer će nam pomoći u tome. Ako planirate promovirati svoje resurse na Google-u, onda trebamo tražiti i donatorske stranice putem Google-a. Mislim da je ovo razumljivo i logično. Ali Google, poput gospodarice bakrene planine, ne poklanja svoje bogatstvo svima. Potreban vam je pristup tome. Odmah bih rekao da se nemojte nadati da ćete na osnovu znakova koje nađete u javnosti moći nešto prikupiti. Razlog zašto su dostupni javnosti je taj što su bezvrijedni. Neću dalje razvijati temu. Bolje je da vam kažem kako ga pravilno sastaviti tako da možete vidjeti rezultat, ostalo možete sami riješiti, glavna stvar je razumjeti princip. Moramo prikupiti prave na osnovu karakteristika specifičnih motora koji su nam potrebni, a ne na osnovu karakteristika foruma općenito. Ovo je glavna greška početnika - ne koncentriranje na određenu stvar, već pokušaj da se sve pokrije u cijelosti. Takođe, ako želite da raščlanite više ili manje normalnu bazu podataka, prestanite da koristite operatore u upitima. Nema "inurl:", "site:", "title" itd. Google će trenutno zabraniti pretraživače poput vas. Stoga pažljivo proučavamo motore s kojima Khrumer trenutno radi:
Pokreće php-Fusion
U verziji Khrumer 7.07, program je obučen na nekoliko novih motora:
forumi.biz, forumb.biz, 1forum.biz, 7forum.biz, itd.
phpBB-fr.com, Solaris phpBB tema
A proces učenja novih stvari je kontinuiran.
Općenito, moramo pripremiti ispravne upite za raščlanjivanje od strane Hrefera. Uzmimo forum dizhok kao primjer. SMF Forumi. I počnimo da ga rastavljamo na dijelove za raščlanjivanje. U tome će nam pomoći naš voljeni Google. Unesite upit u Google SMF Forumi- ima dosta đubreta u rezultatima pretrage, premotavamo na neku 13. stranicu i biramo bilo koji link. Naišao sam na ovo: http://www.volcanohost.com/forum/index.php?topic=11.0. Hajde da ga otvorimo i proučimo. Moramo pronaći nešto karakteristično na stranici što se može primijeniti na pretragu drugih stranica na ovom motoru. U podnožju primjećujemo sljedeći natpis Pokreće SMF 1.1.14, citirajte ga i unesite u Google, to nam pokazuje prema ovaj zahtjev on zna oko 59 miliona opcija. Brzo pregledamo linkove, dodamo još nekoliko opcija ovoj ključnoj riječi, na primjer, "Powered by SMF 1.1.14" topola ili "Powered by SMF 1.1.14" viagra. Vodimo računa o tome da zahtjev bude odličan, rezultati su samo forumi i skoro da nema smeća.
Osim toga, ne zanima nas kvantitet, već kvalitet, kao što sam već rekao. Nastavi. Sa istog foruma preuzimamo još jednu frazu iz podnožja: , također ga citiramo i dostavljamo Googleu. Kao odgovor, otkriva da zna više od 13 miliona rezultata. Opet, brzo pregledavamo rezultate, dodajemo dodatne riječi i s njima provjeravamo rezultate. Vodimo računa o tome da zahtjev bude odličan i da skoro da nema smeća. Generalno, već postoje 2 željezna zahtjeva. Predlažem da za sada ostavite prvi forum na miru i da nastavite sa prikupljanjem zahtjeva sa drugih foruma. Srećom, Google je otvoren na zahtjev. 2006-2008, Simple Machines LLC. Uzimamo iz rezultata pretrage, na primjer, ove forume: http://www.snowlinks.ru/forum/index.php?topic=1062.0 i http://litputnik.ru/forum/index.php?action=printpage ;topic=380.0 u podnožjima od njih preuzimamo sljedeće upite: “Powered by SMF 1.1.7” i “Powered by SMF 1.1.10” (Uvijek preporučujem da upite za Hrefer unosite pod navodnike, jer nam je potreban kvalitet prije svega sve). Mislim da je jasno šta radimo, na kraju ćemo imati određenu bazu upita za pretraživanje foruma na SMF engine-u (izabrana je kao primjer, isto je i sa ostalim motorima).
To će izgledati otprilike ovako:
"Pokreće SMF 1.1.2"
"Pokreće SMF 1.1.3"
"Pokreće SMF 1.1 RC2"
"Pokreće SMF 1.1.4"
"Pokreće SMF 1.1.8"
"Pokreće SMF 1.1.7"
"2006-2008, Simple Machines LLC"
I to nije sve. Dok prikupljamo verzije motora, na nekim SMF forumima nalazimo natpis “2001-2006, Lewis Media” u podnožju. Provjeravamo ovaj zahtjev, on nas također u potpunosti zadovoljava. Nalazimo sličan zahtjev: "2001-2005, Lewis Media". Gledajući dalje kroz podnožje nalazimo sljedeći zahtjev: “SMFone dizajn od A.M.A, portiran na SMF 1.1”. Provjeravamo - odlično. I tako dalje. Pola sata rada i imate divnu bazu upita za motor, a Google će vam za ove upite banovati mnogo rjeđe nego ako u njima koristite operatere. A u isto vrijeme, vaša baza podataka će biti mnogo čistija nego ako koristite upite poput “index.php?topic=", jer ovdje će Google dati ne samo forume koji su nam potrebni, već i mnoge ljevičarske resurse gdje je to bilo moguće ostavite link do teme foruma. Možete se buniti, šta je loše u tome? Drugi su ostavili link, pa možemo i mi. Ali! Linkove može ostaviti ne samo Khrumer, već i drugi programi. Štaviše, mogu biti posebno skrojeni za ostavljanje komentara na određenom resursu, takozvani visokospecijalizovani softver, plus takvi linkovi se mogu ostaviti ručno. Opet, ponavljam, nije nam važna količina smeća, već kvalitet koji ćemo prikupiti sa pravim zahtjevima. Plus ovu metodu također u činjenici da praktički nećete morati konfigurirati u Hreferu sito -filter
, možete ga jednostavno isključiti, jer vam Google praktično neće dati smeće.
Mislim da je naučiti pravilno koristiti Khrumer u početnoj fazi vrlo važno, jer kada jednom ovo naučite, uvijek možete pronaći upotrebu Khrumera, bez obzira na to kako se situacija mijenja. Zaštite postaju sve složenije, a ako je na nekim tipovima motora zaštita pojačana i Khrumer se trenutno ne može nositi s tim, onda nema smisla trošiti sredstva na prikupljanje ovih linkova, a zatim raditi na njima s Khroomerom, to bolje je koncentrisati snage na ono što daje rezultate. A u isto vrijeme, ako je tim Botmaster Labsa naučio Khroomera nečemu novom, možete brzo secirati novog pacijenta i pripremiti bazu za Khroomer dok je pacijent još topao. Vrijeme je novac možda više nije relevantan kada kupite bazu. neko prikupio. Osim toga, pravilno prikupljanje baza za sebe značajno proširuje "bijelu" upotrebu Khrumera. I upravo tu se sve kreće, htjeli mi to ili ne, a proces izbjeljivanja ili sijedenja je u toku. Crni čaršavi postaju stvar prošlosti na svaki mogući način.
Svi ostali tehnički aspekti rada sa Hreferom se mogu vidjeti u pomoći i nema smisla zadržavati se na njima.
Kao bonus, postaviću ovde šablon za raščlanjivanje kineskog pretraživača Baidu, neki dan su me pitali za to, pa sam to uradio opušteno, izvinite na igri reči. :)
Hostname=http://www.baidu.com
Query=s?wd=
LinksMask=
Ukupno stranica=100
NextPage=
NextPage2=
CaptchaURL=
CaptchaImage=
CaptchaField=
Pokušao sam da ih testiram da ih raščlanim, nije bilo zabrane, Khrefer je brzo prikupljao resurse, svi upiti za raščlanjivanje su bili slični Googleovim, ali bilo je puno kineskih resursa, sa visokim PR-om, a osim toga, bilo je mnogo mjesta na kojima nema Evropljanin je ikada kročio. Bolje je analizirati kineske upite. Google translate će vam pomoći u tome, ukucajte listu ključnih riječi na ruskom i prevedite je na kineski. Istina u " Riječi„Reči se ne mogu dodavati na kineskom, već ih treba kodirati.
Umjesto kineskog:
伟哥 - Viagra
吉他 - gitara
其他 - odmor
保险公司 - osiguranje
Stavite ove zamjenske kodove u Words datoteku:
%E4%BC%9F%E5%93%A5
%E5%90%89%E4%BB%96
%E5%85%B6%E4%BB%96
%E4%BF%9D%E9%99%A9%E5%85%AC%E5%8F%B8
Ako promovirate web stranicu osiguranja, onda postavljanjem linka u svoj profil na tematski (!) čak i kineski forum pronađen na zahtjev " SMF forum" 保险公司 biće veoma dobro.
U zaključku, htio bih reći da nikad nisam razumio ljude koji su se žalili da su Khrefers skuvani loše ili loše, kao odgovor na ovo, uvijek sam htio reći, jednostavno ne znate kako ih kuhati; Nijedan parser ne može prikupiti rezultate bolje od reference, samo zahtjevi moraju biti tačni. Hrefer je auto: dobar, solidan, nemacki, ali ga vozi covek i sve zavisi od toga koliko je dobro vozen ne mozes naterati auto da vozi i desno i levo;
Posebna tema je čišćenje baza podataka, to sam jednom radio prije 3 godine za prethodno takmičenje. Uglavnom je tamo sve još uvijek relevantno, ali sada možete odbiti provjeru za 200 OK, stvarno mi se nije sviđao ovaj proces, bilo je jako velikih grešaka, dosta nepotrebnih stvari je filtrirano. Sada se to može učiniti gotovo automatski tokom rada Khrumera, iako ovaj proces nije potpuni analog provjere za "200 OK". U svakom slučaju, do tačke: nedavno se u Khrumeru pojavila divna prilika - otimati informacije iz resursa u vrijeme vođenja projekta. To izgleda ovako. Unesite predložak koji će biti obrađen tokom rada, a informacije prikupljene iz šablona će biti unesene u xgrabbed.txt datoteku u folderu Dnevnici. Ovu funkciju možete koristiti za bilo šta, polet mašte je ogroman. Koristim ovu funkciju jednom sedmično da uklonim veze iz moje radne baze podataka sa "isteklim rokom trajanja". Nije tajna da forumi izumiru svakim danom kako bi našu bazu podataka očistili od takvih resursa, a alat „Autograbbing“ pomoći će nam u ovom slučaju.
Uostalom, morate priznati da kada često kucamo, na primjer, http://www.laptopace.com/index.php, vidimo da je ovaj domen već, na primjer, dobar tip koji prodaje novac, ali nema forum tamo. Dakle, da bismo izbacili ovu šljaku iz baze, pljačkaćemo. :) Otvorite izvorni kod stranice i tamo pogledajte ovaj unos:
Sada će nam svi "mrtvi" iz Goudaddyja biti poznati po imenu.
Evo malog izbora alata za automatsko hvatanje, ako želite da obrišete bazu podataka različitih domena koje su istekle: