Automatinis forumo variklio aptikimas. Pirmieji žingsniai optimizuojant paieškos sistemoms Simple Machines Forumas: autorių teisių ir išorinių nuorodų pašalinimas Svarbesnė rodyklė php tema powered by smf

Jei kas nors nežinotų, Simple Machines Forum – trumpiau SMF –, kaip teigiama oficialioje svetainėje, yra nemokamas profesionalaus lygio paketas, leidžiantis per kelias minutes susitvarkyti savo internetinę bendruomenę. apie šį variklį galite pažiūrėti čia. Aš pats sukūriau jame savo forumą (beje, eikite į FreeForum.biz).

Nesvarbu, kiek ar mažai šlamšto pasirodo jūsų forume. Svarbu, kad savo brangų laiką praleistumėte saikingai. Papildinio, kuris atliks visą darbą už jus, nustatymas užtrunka kelias minutes ir iš viso sutaupysite dienų ir mėnesių, o tai padidins minutes, kurias turėtumėte praleisti ištrindami pranešimus ir naikindami vartotojus.

Pastebėsiu, kad pats bandžiau kovoti su spameriais – blokavau prieigą per IP ir net potinklius. Tai tikrai veikė, išfiltravo daug šiukšlių, bet nepaisant to, kartą per vieną ar dvi dienas kas nors pravažiuodavo. O uždraustų IP duomenų bazės papildymas užtruko nemažai. Maniau, kad turi būti geresnis būdas, ir iš tikrųjų buvo!

1. Stop Spammer diegimas ir konfigūravimas

Per dvi veikimo savaites šis įskiepis užblokavo 2202 netikrus vartotojus. Kiekvienas iš jų paliks bent vieną žinutę. Šlamšto siuntėjai nerodo jokių lėtėjimo ženklų, todėl kasdien skirčiau laiko savo forumo valymui.

Vietoj to, kas kelias dienas einu į vartotojų valdymo puslapį ir matau kažką panašaus:

Pereinu į skiltį „Laukiama patvirtinimo“ (tai rasti šiukšlių siuntėjai, kuriems atimama galimybė palikti žinutes, kol administratorius patvirtins jų paskyras). Pažymiu žymimąjį laukelį „Pasirinkti viską“ ir ištrinu juos vienu paspaudimu:

Tai viskas, visos šiukšlių paskyros nueina užmarštyje. Grįžkime prie mūsų vartotojų sąrašo:

Matyti, kad sąrašas pastebimai išretėjo, bet kas tie kiti? Atrenkame visus ir vienu mygtuku siunčiame patikrinti:

Atsiranda vienas „raudonas“, iškart jį ištriname. Jei turite laisvo laiko, galite užsiimti kitais. Jei neturite laiko, nieko nedarykite su naujais vartotojais - dauguma jų vėlesnių patikrinimų metu „paraudo“. Jei turite laiko, galite nueiti į jų profilius ir pasižiūrėti – jei paraše yra nuoroda, jie iškart bus uždrausti, tai netikros šiukšlių siuntėjų paskyros, kurios niekada nepaliks nei vienos naudingos žinutės.

Aš jums pasakiau, kaip naudoti šį stebuklingą papildinį, o dabar aš jums pasakysiu, kaip jį įdiegti.

Atsisiųskite du failus: language_full.zip (tai yra kalbos paketas, skirtas įskiepiui išversti) ir StopSpammer_v2_3_9.zip (skaičius gali skirtis, nes atnaujinamos versijos). Išpakuokite StopSpammer_v2_3_9.zip archyvo turinį į kokį nors aplanką. Išpakuokite language_full.zip archyvą į tą patį aplanką ir sutikite pakeisti failus. Dabar supakuokite mūsų aplanką į ZIP archyvą.

Administratoriaus skydelyje tęskite paketų diegimą. Priešais užrašą „Atsisiųsti paketą“ yra mygtukas, skirtas pasirinkti failą kompiuteryje. Pasirinkite mūsų naują archyvą (kur pakeitėme kalbos failą), įkelkite jį į forumą ir suaktyvinkite paketą.

Viskas!

Papildoma įskiepio konfigūracija atliekama administratoriaus skydelyje: eikite į

Vartotojai → Registracija → Nustatymai

Čia galite palikti numatytąsias reikšmes. Taip pat yra laukas „Jūsų API raktas“. Be šio rakto negalėsite pranešti apie naujus el. pašto siuntėjus (tačiau papildinys veiks ir filtruos žinomus nepageidaujamo e. pašto siuntėjus). Jei norite gauti savo API raktą, eikite į www.stopforumspam.com ir užsiregistruokite, tada įveskite raktą čia. Jei dar negavote rakto, palikite lauką tuščią. Tada bus naudojamas numatytasis klavišas.

2. Anti-Spam saitų įdiegimas ir konfigūravimas

SEO religijos šalininkai (apie mano požiūrį į SEO nistus galite pasiskaityti kitame) yra tvirtai įsitikinę, kad didindami nuorodų į savo svetainę skaičių, jie ją „reklamuoja“ (kažkodėl kyla mintis ​kurti įdomų ir kokybišką turinį niekam neįdomu, neateina į galvą). Jis būtų siurblys, bet būtų būdų iš jo išpešti pinigų. Taigi kai kurie „piliečiai“ teikia svetaines „paleisti“ per forumus. Jie sukuria daugybę paskyrų skirtinguose forumuose ir įterpia atgalines nuorodas į parašus ir kitus galimus laukus. Nepaisant to, kad net „SEO eksperimentuotojai“ jau eksperimentiškai įrodė, kad šios nuorodos yra nenaudingos, kai kurie įspėja, kad už tai galite gauti draudimą paieškos sistemoms, pavyzdžiui, „Yandex“ tiesiog ignoruoja nuorodas VISUOSE forumuose ir svetainėse, kur bet kas. gali palikti nuorodas. Google irgi turi panašius algoritmus - nuorodų ignoravimas komentaruose ir t.t. Bet įstatymas parašytas ne siurbėliams... Todėl mes, forumų savininkai, turime atsižvelgti į faktus, kad "šaunūs SEO optimizatoriai" liepia "bėgti" “ savo šlykščių kūrinių už tūkstantį rublių.

„Stop Spammer“ papildinys daug ką išfiltruos. Bet mes galime jam padėti! Galite labai domėtis savo forume skelbti nuorodas iš šiukšlių siuntėjų. Kaip tik tam skirtos Anti-Spam nuorodos. Šis papildinys (konkrečius skaičius gali būti pakeistas nustatymuose) atlieka šiuos veiksmus:

  • tie, kurie, pavyzdžiui, turi mažiau nei penkias žinutes, išvis negali palikti nuorodų
  • tie, kurie, pavyzdžiui, turi mažiau nei 15 pranešimų, negali palikti aktyvių nuorodų, http:// pašalinamas iš nuorodų ir apskritai šios nuorodos tampa nubolorodomis (newbielink)
  • tie, kurie, pavyzdžiui, turi mažiau nei 50 pranešimų, gali palikti aktyvias nuorodas, tačiau visoms nuorodoms suteikiamas atributas nofollow.
  • Na, o tie, kurie turi daugiau nei 50 įrašų, gali įterpti dažniausiai pasitaikančias aktyvias nuorodas, kurios perkelia svetainės svorį į nukreipiamą puslapį.

Patikėkite manimi, būsimi SEO specialistai labai atidžiai žiūri, kokia forma jų nuoroda patenka į svetainę. Jie greitai praras susidomėjimą jūsų forumu, jei negalės lengvai ten patalpinti savo šlykščių nuorodų į savo šlykščias svetaines.

Taip, beje, minėtos taisyklės veikia ir tokiose srityse kaip parašai.

Norėdami įdiegti šį papildinį, eikite į oficialų jo puslapį. Atsisiųskite anti_spam_links_v1.0.1.zip archyvą (skaičius gali skirtis). Vėlgi, forumo administratorius, eikite į įdiegti paketus (kaip padarėte su ankstesniu paketu) ir įdiekite jį. Šiam paketui nėra kalbos failo, todėl nereikia išpakuoti archyvo ar nieko su juo daryti.

Norėdami sukonfigūruoti papildinį, eikite į skyrių

Konfigūracija → Modifikacijų nustatymas... → Modifikacijų nustatymas

Jei norite, nurodykite, kiek pranešimų turi turėti vartotojas, kad pagerintų savo galimybes.

Išvada

Šie du papildiniai labai palengvins jūsų, forumo savininko, gyvenimą ir sutaupys daug laiko. Tačiau karts nuo karto prasibrauna šiukšlių siuntėjai ir bent kartą per savaitę reikia „išretinti“ vartotojus ir ištrinti nepageidaujamus laiškus. Todėl neapleisk savo žiniatinklio išteklių!

Visi žino, kad aš tiesiog negaliu gyventi be Joomla, bet, mano nuomone, nėra gero komponentų forumo. Štai kodėl aš dirbu su forumo varikliais. Viena iš naujų, kurią neseniai pradėjau naudoti, yra Pradėkime naują SMF kategoriją su, tikiuosi, naudingų dalykų. Pradedame nuo mažo, o pradedantiesiems tai labai naudinga.

Pirmieji žingsniai optimizuojant paieškos sistemas Simple Machines Forum: autorių teisių ir išorinių nuorodų pašalinimas

Leiskite man iš karto padaryti išlygą, kad dirbu tik su smf 2 ir šis straipsnis bus konkrečiai susijęs su šia nemokamo forumo variklio versija.

Taigi, nuolatiniai skaitytojai žino, kaip aš nemėgstu dėti „10“ išorinių nuorodų į oficialias variklių svetaines, įskaitant forumus. Štai kodėl pirmiausia pašaliname autorių teises ir net 4, atkreipkite dėmesį į 4 išorines formos nuorodas “ SMF 2.0.2 | Paprastos mašinos | SMF © 2011 | XHTML"! Norėdami tai padaryti, prisijunkite prie svetainės per FTP forumą/Temas/ jūsų temos pavadinimas/ ir redaguoti failą index.template.php. Natūralu, kad pačioje apačioje yra kodas (apie 330 eilutę), rodantis išorines nuorodas, kurios mums taip nepatinka. Todėl ištriname: "

  • ", theme_copyright(), "
  • "Ir"
  • ", $txt["xhtml"], "
  • ". Viskas taip paprasta ir lengva. Kituose leidiniuose tikėkitės naujos medžiagos apie SMF/ forumų reklamavimą ir optimizavimą

    Iš karto pradėkime nuo pagrindinio scenarijaus kodo:

    #!/usr/bin/perl

    # what-forum.pl scenarijus
    # (c) 2010 m. Aleksandras Aleksejevas, http://site/

    naudoti griežtai;

    # komentuotos eilutės – dėl griežtumo
    # jei užduotis yra rinkti variklio statistiką, palikite ją tokią, kokia yra
    # jei sudarysi forumų sąrašą – atšauki komentarą

    mano $duomenys ;
    $duomenys .= $_while (<> ) ;

    # patikrinkite, kiek buvo Powered by phpBB be nuorodos poraštėje
    spausdinti „phpbb \n"
    if ($duomenys =~ /]+href="[^"]*http:\/\/(?:www\.)?phpbb\.com\/?[^>]*>phpBB/i arba
    # $data =~ /viewforum\.php\?[^""]*f=\d+/i arba
    $duomenys =~ /phpBB\-SEO/i arba
    $duomenys =~ /) ;
    spausdinti „ipb \n"
    if ($duomenys =~ /]+href="[^"]*http:\/\/(?:www\.)?invision(?:board|power)\.com\/?[^"]*"[^>]*> [^<]*IP\.Board/i arba
    $duomenys =~ /]+href="[^"]*http:\/\/(?:www\.)?invisionboard\.com\/?[^>]*>Invision Power Board/i arba
    $duomenys =~ /

    /i arba
    $duomenys =~ /index\.php\?[^""]*showforum=\d+/i) ;
    spausdinti "vbulletin \n"
    if ($duomenys =~ /Pagalba:?[^<]+vBulletin[^<]+(?:Version)?/i arba
    $duomenys =~ /) ;
    spausdinti „smf \n"
    if ($duomenys =~ /]+href="[^"]*http:\/\/(?:www\.)?simplemachines\.org\/?[^>]*>Pagalba SMF/i arba
    $duomenys =~ /index\.php\?[^""]*board=\d+\.0/i) ;
    spausdinti "punbb \n"
    if ($duomenys =~ /]+href="[^"]*http:\/\/(?:(?:www\.)?punbb\.org|punbb\.informer\.com)\/?"[^>]*> PunBB/i) ; #arba
    # $duomenys =~ /viewforum\.php\?[^""]*id=\d+/i);
    spausdinti "fluxbb \n"
    # if($duomenys =~ /viewtopic\.php\?id=\d+/i arba
    if ( $duomenys =~ /]+href="http:\/\/(?:www\.)fluxbb\.org\/?"[^>]*>FluxBB/i) ;
    spausdinti "exbb \n"
    if ($duomenys =~ /]+href="[^"]*http:\/\/(?:www\.)?exbb\.org\/?[^>]*>ExBB/i) ; # arba
    # $duomenys =~ /forums\.php\?[^""]*forumas=\d+/i);
    spausdinti "yabb \n"
    if ($duomenys =~ /]+href="[^"]*http:\/\/(?:www\.)?yabbforum\.com\/?[^>]*>YaBB/i arba
    $duomenys =~ /YaBB\.pl\?[^""]*num=\d+/i ) ;
    spausdinti "dleforum \n"
    if ($duomenys =~ /\(Parengė DLE forumas\)<\/title>/i arba
    $duomenys =~ /]+href="[^"]+(?:http:\/\/(?:www\.)?dle\-files\.ru|act=copyright)[^"]*">DLE forumas<\/a>/i) ;
    spausdinti "ikonboard \n"
    if ($duomenys =~ /]+href="[^"]*http:\/\/(?:www\.)?ikonboard\.com\/?[^"]*"[^>]*>Ikonboard/i arba
    $duomenys =~ /
    if ($duomenys =~ /
    # if($duomenys =~ /forums\.php\?fid=\d+/i arba
    # $duomenys =~ /topic\.php\?fid=\d+/i arba
    if ($duomenys =~ /]+href="http:\/\/(?:www\.)?flashbb\.net\/?"[^>]*>FlashBB/i) ;
    spausdinti "Stokesit \n"
    # if($duomenys =~ /forumas\.php\?f=\d+/i arba
    if ($duomenys =~ /]+href="http:\/\/(?:www\.)?stokesit\.com\.au\/?"[^>]*>[^\/]*Stokes IT/i) ;
    spausdinti "podiumas \n"
    # if($duomenys =~ /tema\.php\?t=\d+/i arba
    if ($duomenys =~ /]+href=[""]?http:\/\/(?:www\.)?sopebox\.com\/?[""]?[^>]*>Podiumas/i) ;
    spausdinti "usebb \n"
    # if($duomenys =~ /forumas\.php\?id=\d+/i arba
    if ($duomenys =~ /]+href="http:\/\/(?:www\.)?usebb\.net\/?"[^>]*>UseBB/i) ;
    spausdinti „wrforum \n"
    # if($duomenys =~ /index\.php\?fid=\d+/i arba
    if ($duomenys =~ /]+href="http:\/\/(?:www\.)?wr\-script\.ru\/?"[^>]*>WR\-Forum/i) ;
    spausdinti "dar vienas forumas \n"
    if ($duomenys =~ /dar vienas forumas\.net/i arba
    $duomenys =~ /default\.aspx\?g=posts&t=\d+/i) ;

    Šį ir kitus šiame archyve paminėtus scenarijus rasite.

    Scenarijus kuris-forumas.pl tiria HTML puslapio kodą, ar jame nėra forumo variklio parašų. Apibrėždami „WordPress“ ir „Joomla“ naudojome panašią techniką, tačiau yra keletas skirtumų. Pirma, pats scenarijus neįkelia puslapio kodo, o nuskaito jį iš stdin arba failo, perduodamo kaip argumentas. Tai leidžia vieną kartą atsisiųsti puslapį, pavyzdžiui, naudojant wget, o tada paleisti jį per kelis analizatorius, jei turime daugiau nei vieną. Antra, šiame scenarijuje parašo buvimas yra 100% variklio ženklas. Praėjusį kartą parašo buvimas tik padidino atitinkamo variklio svorį ir „laimėjo“ didžiausio svorio variklis. Nusprendžiau, kad šiuo atveju toks požiūris tik be reikalo apsunkins kodą.

    Norėdamas išbandyti scenarijų, atlikau keletą tyrimų. Sudariau kelių tūkstančių forumų sąrašą ir kiekvieną iš jų paleidau pagal savo scenarijų, taip nustatydamas programos atsakymų procentą ir įvairių variklių populiarumą.

    Norėdami gauti forumų sąrašą, naudojau „Google“ analizatorių. Tokios užklausos buvo išsiųstos į paieškos sistemą

    site:forumas.*.ru
    site:talk.*.ru
    site:board.*.ru
    site:smf.*.ru
    site:phpbb.*.ru
    ....

    ir taip toliau. Visą užklausų generatoriaus kodą rasite faile gen-forumsearch-urls.pl. Be zone.ru, taip pat buvo naudojami .su .ua .kz ir .by. Praėjusį kartą atlikti tokį tyrimą buvo sunku, nes „WordPress“ ir „Joomla“ svetainėse nėra tokių parašų URL. Tokiuose kataloguose kaip cmsmagazine.ru/catalogue/ nepateikiamas pakankamas imties dydis. Kas yra 600 Drupal svetainių?

    Prisipažinsiu, eksperimento rezultatai mane nuvylė. Iš 12 590 tirtų vietų variklis buvo sėkmingai identifikuotas tik 7 083, tai yra tik 56% atvejų. Gal neatsižvelgiau į kažkokį variklį? Ar tikrai buvo tiesa, kad pusėje forumų buvo įdiegta „Bitrix“? O gal turėjau daugiau laiko skirti parašų paieškai? Apskritai čia reikalingi papildomi tyrimai.

    Tarp 56 % sėkmingai nustatytų variklių populiariausi, kaip ir tikėtasi, buvo IPB (31 %), phpBB (26,6 %) ir vBulletin (26,5 %).

    Po jų su dideliu atsilikimu seka SMF (5,8 %) ir DLEForum (5,3 %). Mano mėgstamiausias punBB buvo tik 6 vietoje (1,64%). Nerekomenduočiau labai tikėti šiais skaičiais (jie sako, kad kas trečias „RuNet“ forumas veikia IPB), tačiau, žinoma, galima padaryti tam tikras išvadas.

    Pavyzdžiui, jei ketinate sukurti svetainę forumo variklyje ir planuojate modifikuoti forumą, tarkime, mokėti vartotojams po 0,01 USD už kiekvieną pranešimą su automatiniu lėšų išėmimu kartą per savaitę, tuomet turėtumėte pasirinkti vieną iš trijų populiariausių variklių. Kuo forumas populiaresnis, tuo didesnė tikimybė rasti jį gerai išmanantį programuotoją.

    Jei variklyje nesitikima didelių pokyčių, gali būti prasminga pasirinkti mažiau populiarų variklį, pavyzdžiui, SMF arba punBB. Tai sumažins įsilaužėlių atakų skaičių jūsų forume ir automatiškai į jį siunčiamo šlamšto kiekį.

    Scenarijai, skirti ieškoti / identifikuoti forumus, taip pat gali rasti daug praktinių pritaikymų. Pirmas dalykas, kuris man atėjo į galvą, buvo surūšiuoti nustatytus forumus pagal TIC ir paskelbti pirmuose šimtuose pranešimų su nuorodomis į vieną iš mano svetainių. Tačiau šimtai forumo dofollow nuorodų niekaip nepaveikė TCI (praėjo 2 atnaujinimai), todėl čia geriau nešvaistyti laiko, nebent jums neįdomūs perėjimai.

    Akivaizdu, kad minėtas scenarijų naudojimas toli gražu nėra vienintelis. Manau, kad jūs galite lengvai suprasti, kaip dar galite juos panaudoti.

    mob_info