Introducere in optimizarea paginilor web - SEO
Scris de Agkelos
SEO - Search Engine Optimization
Dupa cum va dati seama, deja e plin webul de site-uri. Sunt o gramada in toate domeniile si ariile de activitate. Intrati pe google, yahoo,msn sau orice motor de cautare care va place si cautati ceva. Orice.Foarte probabil gasiti cateva mii sau sute de mii de rezultate. Multe
dintre ele sunt inutile, altele contin informatii pretioase care nu le puteti gasi in alt loc. Poate ca aveti un site care ati vrea sa apara in google cand cautati unele cuvinte… cert este ca atunci cand intrati pe google si cautati ceva sigur aveti o gramada de rezultate si in majoritatea cazurilor pe primele locuri sunt de obicei aceleasi site-uri. Se intampla uneori ca site-urile din top sa nu fie tocmai cele mai potrivite pentru cuvintele care le-ati cautat dar totusi apar in top. Posibil ca site-ul care apare in top sa fie al concurentei si atunci din nou va puneti intrebarea: “Cu ce-s astia mai destepti decat mine?”. Ei bine, incer sa fac un mic tutorial care sa explice de ce unele site-uri sunt in top si altele nu
SEO sau “Search Engine Optimization” este o ramura a dezvoltarii site-urilor web care se ocupa de promovarea site-urilor si de “asigurarea” unui loc de frunte in diverse motoare de cautare.Pentru a ajunge cu un site in top trebuie sa intelegem cum functioneaza motoarele de cautare, care este algoritmul lor si pe ce criterii considera ca un site este mai bun decat un altul care are la baza aceeasi tema.
Pentru ca un site sa fie vazut bine de un motor de cautare trebuie sa facem pe plac motoarelor de cautare. Mai jos incerc sa pun pe scurt cateva idei importante dupa care se ghideaza motoarele de cautare cand indexeaza site-urile si cand le da o nota (rank) care
urmeaza sa decida pozitia site-ului in raspunsul returnat ca urmare a unei cereri facute de un utilizator.
1. Continutul site-ului
Pentru ca un site sa fie bine vazut de un motor de cautre trebuie sa aiba un continut care sa poata fi indexat. Ce inseamna continut care poate fi indexat ? Text si imagini. Textele si imaginile sunt singurele informatii care sunt indexate de motoarele de cautare.
Imaginile facand parte dintr-o categorie aparte vor fi discutate doar la cerere in schimb textul e important. Ce putem face cu textul ?
Cum putem sa ne folosim de informatia in format text pentru a ne ridica in ochii unui motor de cautare ? Crawlerele motoarelor de cautare parseaza pagina ocazional si face o sinteza in care sunt luate inconsiderare urmatoarele atribute:
a) raportul text/cod
b) cuvintele care se repeta
c) cuvintele care ies in evidenta (bold, italic underline)
d) headerele
Pentru a optimiza un site la primul pas trebuie sa avem in minte faptul ca pe site trebuie sa apara informatie… multa… Ce putem face pentru ca site-ul sa ofere informatie multa ? avem 2 alternative. Prima ar fi sa punem o gramada de informatie pe site. De fapt, e singurul lucru care il putem face. Sa punem o gramada de informatie relevanta. Bun, v-ati chinuit si ati strans documentatie dar pe o pagina tot nu ati reusit sa adunati mai mult de o pagina de text. Se mai poate face ceva ? Bineinteles. Pentru a avea un raport text/cod bun, putem reduce codul paginii. Cum putem face asta ? In primul rand prin eliminarea tabelelor din pagini. Faceti tot site-ul folosind div-uri si pagini de stiluri (CSS - Cascade Style Sheet ) externe. Daca folositi fisiere css externe iar site-ul va fi facut in intregime folosind div-uri si cod de formatare puteti fi siguri ca veti obtine un raport text/cod foarte bun, adica veti fi vazut de motorul de cautare ca avand o pagina importanta cu relevanta mare.
Al doilea pas, b, se refera la cuvintele care se repeta. Motoarele de cautare folosesc tot felul de algoritmi mai mult sau mai putin inteligenti de determinare a relevantei textului. O metoda de deducere a relevantei este repetarea cuvintelor. De exemplu, daca pe o pagina din site apare de 10 ori cuvantul Linux, e clar ca pe pagina respectiva se vorbeste despre Linux deci dupa indexarea paginii de catre motorul de cautare pagina va fi afisata cand in campul text al motorului de cautare se introduce Linux pentru ca in “mintea” lui, motorul de cautare stie ca Linux este un cuvant foarte des folosit in pagina deci sigur are o legatura destul de solida cu subiectul paginii.
Al treilea pas, c, se refera la cuvintele care sunt concepute pentru a iesi in evidenta. Motoarele de cautare sunt facute in asa fel incat sa se comporte ca un utilizator. Daca utilizatorul vede un text boldat sau subliniat considera cuvantul respectiv sau fraza respectiva ca avand o importanta deosebita fata de cuvintele sau frazele inconjuratoare.
Deci, daca vreti ca pe o pagina sa iasa in evidenta cuvantul UNIX, il scrieti folosind instructiunile <strong> … </strong> sau <b> … </b>.Crawlerul motorului de cautare, cand “vede” un cuvant ingrosat il adauga in lista cuvintelor cheie corespunzatoare paginii indexate.
Al patrulea pas, d, se refera la headere. probabil v-ati intrebat “La ce sunt bune instructiunile <h1>, <h2> … <h6> ? Oricum imi formatez textul cu <p></p> si cu stiluri…” Raspunsul e: instructiunile de header sunt bune pentru motoarele de cautare. Initial instructiunile astea au fost folosite pentru formatarea textului dar amatorii tind sa le ignore pentru ca au un stil predefinit care nu e pe placul tututor. Cel mai bine e sa le redefiniti stilul folosind CSS si supra-scriind atributele instructiunilor pentru a corespunde nevoilor care le aveti. Astfel puteti folosi instructiunile de header fara a va strica designul paginii si motoarele de cautare vor lua textul aparut intre <hX> si </hX> ca fiind foarte important, adaugandu-se la lista de cuvinte cheie aferente paginii.
2. Al doilea punct important este modul in care sunt tratate linkurile si imaginile. Pentru ca o imagine sa fie bine vazuta de un crawler trebuie pusa intr-un mod cat
mai exact. De exemplu, instructiunea <img> are un atribut numit alt care se refera la textul alternativ si este folosita pentru a usura navigarea pe site a nevazatorilor. Persoanele cu probleme de vedere folosesc softuri speciale care citesc imaginea care in mod normal este afisata pe monitor si redau textul scris in fereastra activa folosind casti sau boxe. Pentru ca un crawler poate fi considerat un “utilizator” care nu poate vedea/interpreta imaginea este important ca atributul alt sa fie pus pentru fiecare imagine din site impreuna cu textul alternativ corespunzator, astfel crawlerul fiind capabil sa indexeze imaginea ca fiind in tema textului pus ca text alternativ pentru imagine. Ca exemplu concret, daca avem o imagine care prezinta un notebook o putem adauga folosind instructiunea img in felul urmator: <img src=”notebook.jpg”alt=”Image cu un notebook”/>. Instructiunea aceasta va afisa pe monitor imaginea notebook.jpg iar in cazul in care pagina este parsata de un crawler, informatia din atributul alt va fi considerata descriere a imaginii si textul va fi trecut in cuvintele cheie corespunzatoare paginii vizitate.
Pentru linkuri este din nou o alta poveste. Peste tot, in orice site se gasesc linkuri. Linkurile sunt folosite pentru a naviga de pe o pagina pe alta sau pentru a face referire catre resurse externe. Dupa cum banuiti si linkurile pot fi optimizate pentru a oferi mai multainformatie motoarelor de cautare. Un link se declara in html de forma: <a href=”pagina.php”>Link catre pagina</a>. Ce inseamna asta ?
Prin asta spunem browserului/crawlerului ca se face referire catre pagina.php. Bineinteles, nu e doar atat. Linkul care apare va avea textul “Link catre pagina” ceea ce ii va spune crawlerului care urmeaza sa indexeze pagina ca pe pagina care urmeaza se discuta despre “Link catre pagina”. Stupid, nu ? Ca sa oferim o importanta mai mare paginii catre care se face referire trebuie sa punem un text care sa reprezinte cat mai bine continutul care urmeaza a fi vazut in locatia respectiva. Adica, sa facem un link de forma:
<a href=”pagina.php”>Optimizarea siteurilor</a>. In cazul acesta crawlerul va stii ca pe pagina urmatoare se discuta despre optimizarea siteurilor. Pentru un randament mai bun este important ca toate linkurile sa aiba si atributul title care face exact
acelasi lucru ca si textul despre care vorbeam mai sus doar ca ofera o “greutate” mai mare paginii catre care se face referire. Adica daca facem linkul de forma:
<a href=”pagina.php” title=”optimizarea site-urilor web”>optimizare</a>
crawlerul va stii ca pe pagina care urmeaza se discuta despre optimizare si va trece automat cuvintele folosite atat in title cat si textul pentru link in lista cuvintelor cheie aferente paginii.
3. Orice site care se respecta e format din mai multe pagini. Unul dintre mofturile crawlerelor este ca fiecare pagina din site sa aiba identitate proprie. Ce inseamna identitate proprie ? Sa aiba titlul propriu, descriere proprie, cuvinte cheie proprii, nume propriu si, bineinteles, continut unic. Titlul unei pagini se da cu ajutorul instructiunii title. De exemplu daca avem pagina produse.html in care se discuta despre placi video, vom folosi instructiunea title de forma <title>Placi video</title> pentru a specifica titlul paginii.
Titlul impreuna cu numele paginii au o greutate foarte mare in cazul crawlerelor. Astea doua determina subiectul paginii si e important sa fie unice pentru ca acestea ne spun despre ce se intampla si ce se discuta in pagina.
Ce se poate retine de aici ? Faptul ca site-urile care sunt facute de forma index.php?pagina=pagina_care_trebuie_afisata sunt foarte proaste din punct de vedere al optimizarii. Bun, sunt proaste ca SEO dar sunt mai sigure pentru ca se poate determina o politica de securitate pentru intreg site-ul care va fi inclusa in prima pagina.
O solutie ar fi rescrierea paginilor folosind mod_rewrite din apache care ne permite sa “derutam” crawlerul sau vizitatorii sa creada ca urmaresc o pagina pe cand de fapt ceea ce se afiseaza este continutul altei pagini. Adica putem cu ajutorul mod_rewrite sa apelam produse.html iar rezultatul afisat va fi cel al paginii index.php?pagina=produse totul fiind intr-un mod transparent atat pentru utilizator cat si pentru crawler.
Descrierea paginii se pune cu ajutorul instructiunilor meta si se face de forma:
<meta name=”description” content=”Descrierea paginii” />. Majoritatea
crawlerelor actuale tind sa ignore instructiunile meta dar pentru siguranta este bine ca pe fiecare pagina sa existe o instructiune meta cu atributul name=”description” si atributul content sa ofere o descriere unica a paginii.
Aceeasi importanta o are un alt atribut care poate fi asociat unei instructiuni meta si anume atributul pentru cuvinte cheie care, din nou, trebuiesc sa fie unice pentru fiecare pagina in parte. Instructiunea se foloseste de forma:
<meta name=”keywords” content=”cuvinte,cheie,separate,de,virgula” />
4. Al patrulea element si probabil cel mai important este numarul de IBL-uri (InBound Links) adica numarul de linkuri de pe diferite site-uri care fac referire catre pagina optimizata. Cu cat sunt mai multe referiri la pagina respectiva cu atat crawlerele considera ca pagina este mai importanta. Este exact ca in viata de zi cu zi… cu cat se vorbeste mai des despre un actor cu atat se considera ca actorul respectiv este mai popular deci va trebui sa-l recomandati cand cineva vrea sa urmareasca un film bun. In cazul paginilor daca sunt multe pagini care fac referire catre pagina in cauza se considera ca pagina este importanta iar cand cineva cauta ceva folosind unul sau mai multe cuvinte cheie asociate cu pagina, printre rezultate (probabil printre primele) se va gasi si pagina in cauza.
De asemenea trebuie mentinut un raport favorbail de linkuri interne si linkuri externe. Adica intotdeauna trebuie avut grija ca linkurile care duc catre site-ul optimizat sa fie mai multe decat cele care duc din site catre alte resurse externe.
5. Ultimul punct prezentat este spam-ul. Ca peste tot se pot folosi diferite trucuri pentru ca o pagina sa fie considerata mai importanta decat altele fara a oferi o relevanta. Multi folosesc spamul ca o metoda de crestere a rank-ului in cadrul unui motor de cautare. Partea proasta pentru spameri (si partea buna pentru utilizatori) este ca spammerii cand sunt prinsi sunt pedepsiti de majoritatea motoarelor de cautare prin deindexare, adica prin eliminarea siteului din indexul motorului de cautare ceea ce face ca tot spamul sa fie inutil si afacerea aproape anonima pe internet.
Cam asta ar fi o scurta introducere in optimizarea paginilor din cadrul site-urilor web. Nu e un tutorial cu pretentii, este doar o prezentare succinta a unor fapte si recomandari care va pot ridica site-ul dar, bineinteles, fara a putea fi folosit ca o garantie.
Daca aplicati tot ce am spus mai sus nu aveti garantia ca siteul vostru va fi printre primele returnate in cazul unor cuvinte cheie dar in schimb puteti fi siguri ca ati parcurs deja mai mult de 20% din drumul care trebuie parcurs de un SEO-ist in promovarea unui site.
Astept intrebari si nelamuriri pe forum.
Bafta !
Categoria: SEO
