януари 26

Свободно за индексиране огледално копие на сайта на правителството

Schtrack! в действие: огледално копие на сайта на правителството, свободен за индексиране…
Schtrack! в действие: огледално копие на сайта на правителството, свободен за индексиране…

Моят допълнителен принос в кампанията „SEO срещу правителството“ е огледалното копие на правителствение сайт, което вече може да се обхожда безпроблемно от паяците на търсещите машини. Сайтът така или иначе е счупен на повече от едно място, и е пълен провал, но пък това да може да се индексира от Гугъл е една малка победа на научно-техническия прогрес ;) Чудя се, колко време ще им трябва да оправят robots.txt, дали ще смогнат преди изборите ;)

Както и да е, сайтът е http://government.bg.kaloyan.info/, и страниците в огледалното копие се попълват когато се посети съответния линк от сайта: например като посетите началната страница на копието ще се изтегли началната страница на оригинала. Дал съм време за живот на огледалните копия от 12 часа, така че ако информацията не се опреснява често, няма страшно – не е бъг ;) Връзките със „cgi-bin“ в тях са леееко променени, за да се заобиколи недостатък от хостинга (изключване на ScriptAlias „cgi-bin“ или каквато и да е тъм магия), така че и това не е бъг ;)

Скриптът, Schtrack!,  който прави възможно функционирането на огледалното копие, ми се върти в главата някъде от 2004, обаче все нямам време или повод, за да го направя. Е, ето сега се появи добър повод, и резултата е налице. На който му се занимава, може да намери кода на приложението тук (а самото приложение тук), и да си го ползвате за каквото си искате (в рамките на GPL, разбира се).

1 февруари 2009: Една седмица по-късно вече има стотина страници индексирани от огледалото на правителствения сайт, което може да се отбележи като някакъв относителен успех, особено като се има предвид некадърните адреси на сайта (под некадърни разбирайте такива, които не прилагат най-добрите практики, а точно обратното – супер антични). Друг успех е променения robots.txt, който вече позволява индексиране в дълбочина. Хайде да видим колко други неща ще се променият до преди изборите ;)

5 коментара

  1. Линкът за „пълен провал“ е неправилен и не помагаш в момента. Понеже наистина са пълен провал, правилният адрес на сайта е с www отпред.

    Comment by growchie — януари 27 @ 00:27

  2. Благодаря за напомнянето за изпуснатото www.
    Няма полза от линкове в коментарите, понеше WP им слага rel=nofollow, което ме подсеща да си сложа плъгина, който изключва това.

    Comment by Kaloyan — януари 27 @ 11:23

  3. Огледалното копие на правителствения сайт е вече в първа страница от резултатите при търсене на „РЕПУБЛИКА БЪЛГАРИЯ МИНИСТЕРСКИ СЪВЕТ“ ;)

    Comment by Kaloyan — януари 27 @ 13:30

  4. Правителството отвори сайта си за индексиране. Някакъв резултат, все пак.

    Comment by Yunuz — януари 27 @ 22:47

  5. Ами браво! Само че толкова ли е сложно да се пусне, че 2 дена им отне да го направят ;)

    Comment by Kaloyan — януари 28 @ 09:32

RSS feed for comments on this post.

Sorry, the comment form is closed at this time.