segunda-feira, 27 de dezembro de 2010

Sistemas de busca

Webmasters e responsáveis dos portais de conteúdo começaram a otimizar seus sites para os sistemas de busca em meados de -1990s, porque os primeiros motores de busca estavam iniciando a indexação do conteúdo na World Wide Web. No início, os webmasters precisavam enviar o endereço do site aos vários sistemas de busca existentes na Rede, para que programas como spiders, pudessem "mapear" o site e armazenar as informações coletadas. O padrão e suporte das Máquinas de Busca era mapear uma página da web inteira e selecionar as chamadas palavras relacionadas na busca; então uma página com muitas palavras diferentes ampliavam a combinação de resultados, e uma página da web contendo uma relação de palavras como um dicionário teria como resultado um grande número de combinações, consequentemente limitando os resultados somente a nomes únicos. Os sistemas de busca então classificavam a informação por tópicos, muitas vezes exibindo como resultado das buscas páginas já expiradas, não existentes ou de conteúdo diferente ao que estava armazenado. Como o número crescente de documentos online, e vários webmasters trabalhando para aumentar o valor nos resultados em busca orgânica, os sistemas de buscas mais populares começaram a classificar as páginas de resultados mais relevantes em primeiro. Isto era o início de um atrito entre Sistemas de Busca e webmasters que continua até hoje.

Os primeiros motores de busca eram orientados pelos próprios webmasters. Na ocasião, as versões existentes dos algoritmos utilizados nos sistemas de busca confiaram aos webmasters e provedores de conteúdo a responsabilidade no fornecimento das informações na forma de Categorias e o uso das Meta-Tag para palavras-chave meta tags ou sistemas de busca que usavam arquivos de índice como ALIWEB, fornecendo assim um guia para o índice de cada página. Quando alguns webmasters começaram a abusar no uso das Meta-Tags, fazendo com que as informações de Meta-Tags das páginas não correspondessem ao conteúdo, os motores de busca abandonaram esta forma de obter informações através de Meta-Tags e desenvolveram um sistema de ranking mais complexo utilizando algoritmos, elevando a filtragem das palavras e elevando o número limitado para palavras (antidicionário) e são mais diversas, incluindo:

- Texto dentro do Tag de título
- Nome de Domínio
- URL (de Universal Resource Locator): em português significa (Localizador Uniforme de Recursos) diretórios e nomes de arquivos
- HTML tags: cabeçalhos, negrito e textos com ênfase
- Keyword density: Densidade das palavras
- Proximidade das Palavras-Chave
- Alt attributes: Atributo em texto alternativo para imagens
- Textos dentro da Tag NOFRAMES

Pringle, também definiu um número de atributos dentro da codificação HTML de uma página que freqüentemente eram manipulados por provedores de conteúdo na Internet tentando melhorar a própria classificação em motores de busca. Devido a fatores que estão praticamente sob o controle exclusivo dos responsáveis por um site, os motores de busca continuaram a sofrer abusos e tentativas de classificações manipuladas. Para fornecer melhores resultados a seus usuários, os sistemas de busca tiveram que se adaptar e assegurar que as páginas de resultados mostrem sempre os resultados mais relevantes durante uma procura, em lugar de páginas inúteis cheias de palavras-chave e termos criados inescrupulosamente por webmasters na tentativa de usá-las como iscas para exibirem webpages sem link ou conteúdo. Estes fatos levaram ao nascimento de um novo tipo de motor de busca.

Sistemas de Busca Orgânica

Google foi iniciado por dois estudantes Ph.D. da Universidade de Stanford, Sergey Brin e Larry Page, e trouxe um novo conceito para avaliar páginas da web. Este conceito, chamado PageRank™, foi importante para o início da criação dos algoritmos do Google.

O PageRank™ trabalha principalmente com o fator link e usa a lógica deste sistema de ligação entre páginas como se tivesse o valor de um voto para a página em questão. O fato de uma página ser referenciada através de um link funciona de forma a validar a existência do site e dar um valor mais "digno" ao voto. O valor de cada link de referência varia diretamente baseado no PageRank da página que faz referência ao link e funciona de forma inversa no número de links de saídas de uma página.

Com ajuda de PageRank™, o Google provou ser muito eficiente em oferecer resultados relevantes nas páginas de resultados e tornou-se o sistema de busca mais bem sucedido e popular.

Pelo motivo do sistema PageRank™ fazer a avaliação de websites através de fatores externos ou fora do controle de pessoas em particular, o Google sentiu que desta maneira poderia ser mais difícil de manipular a relevância de uma página.

No entanto, webmasters já tinham desenvolvido ferramentas para manipulação de links e esquemas para influenciar o sistema de busca Inktomi. Estes métodos provaram ser igualmente aplicáveis aos algoritmos do Google. Muitos sites focalizaram suas ações em trocar, comprar, e vender links numa escala imensa. A confiança do PageRank no sistema de link como um voto de confiança para um valor da página foi subvertido quando muitos webmasters procuraram vender links para gerar tráfego, influenciando dessa forma o Google, independentemente dos links serem realmente útil aos visitantes humanos do site.

Para complicar a situação, o suporte de busca omitia o mapeamento de uma página web inteira para procurar as chamadas palavras-relacionadas nas páginas web, e uma página web contendo uma listagem do tipo dicionário ainda combinaria quase todas as buscas (exceto nomes especiais) alcançando um link-rank mais alto. Páginas de dicionários e links para esquemas podem distorcer severamente os resultados de uma página de resultados.

Já era tempo para o Google - e outros motores de procura - olharem para algo mais distante sobre os fatores fora de controle humano. Havia outras razões para desenvolver algoritmos mais inteligentes.

A Internet estava alcançando uma grande parcela de usuários "leigos", que geralmente não conheciam técnicas avançadas de pesquisa que os ajudassem a encontrar a informação que eles estavam buscando e, além disso, o volume e complexidade dos dados indexados haviam tido um enorme crescimento em relação aos primórdios da Internet.

Surgimento do termo SEO (Search Engine Optimization)

Existem três "propostas" para o surgimento do termo SEO. A primeira foi relatada em 1997 no livro Net Results, onde Bob Heyman juntamente com Leland Harden, definiram verbalmente o termo após melhorarem o posicionamento de um website de um cliente.

A segunda vertente, e mais concreta que a primeira, é um post referenciado por Danny Sullivan, indicando um post SPAM feito na Usenet em 26 de Julho de 1997, onde o termo Search Engine Optimization aparece.

Por fim, a terceira vertente, que é mais concreta e antiga, sugere que o termo é uma criação da Multimedia Marketing Group (MMG), empresa online de John Audette, que possuía páginas no início de 1997 que já mencionavam o termo Search Engine Optimization.

Nenhum comentário: