Página anterior Voltar ao início do trabalhoPágina seguinte 

Busca inteligente na internet Modulo I" y "Módulo II - Aperfeiçoando a primeira busca (página 2)

Prof. Dr. José Palazzo Moreira de Oliveira
  • Como realizar uma pesquisa de qualidade sobre os dados distribuídos em inúmeros serviços disponíveis na Internet?

Em particular vamos dar atenção à Web. A busca manual de uma página sobre um tópico específico na Web é praticamente impossível pois implica no conhecimento do conteúdo dos inúmeros servidores. Isto quer dizer que para acessar um determinado conteúdo você deve conhecer o endereço do servidor e da página desejada (URL) que mantém aquela informação. Por exemplo, para saber as novidades sobre o instituto de Informática da UFRGS você precisa saber o endereço do servidor Web que mantém as páginas do Instituto; neste caso o endereço é http://www.inf.ufrgs.br.

Como o número de servidores Web é imenso e está crescendo cada vez mais e é impossível:

  • Criar manualmente um índice global com todos os sites disponíveis na Web.

Assim é necessário:

  • Identificar de forma automatizada os endereços na Web essenciais para atender as necessidades de informação dos usuários.

 

5. A Web como fonte de informações

Como fazer isto? Utilizando os serviços de busca. Serviços de busca são mecanismos de recuperação e indexação de páginas Web. Estes mecanismos geram grandes bancos de dados sobre os quais podem ser executadas as consultas.

Se você utiliza o MS Internet Explorer pode realizar uma busca diretamente da barra de endereços. Imagine que você deseja se informar sobre os sanduíches com pão e uma fatia de carne assada denominados "hamburgers". Como você procederia? Uma solução imediata é digitar "hamburger" na linha de endereço do MS Internet Explorer e rápidamente serão encontradas as páginas que contém esta palavra. Abaixo está a cópia da tela com o comando que produz esta consulta.

Como isto é possivel? É simples, o MS Internet Explorer não reconhece a expressão "hamburger" como uma instrução para acessar uma página Web, em conseqüência envia a palavra ou as palavras digitadas para o serviço de busca MSN Web Search. O serviço de busca retorna as páginas que contém a palavra ou frase da consulta. Tentem, agora, a expressão de busca "cachorro quente".

A consulta acima retornará as páginas que contenham a expressão "cachorro quente" e não as páginas que contenham as palavras "cachorro" e "quente" em diferentes locais do texto.

Explicando o funcionamento: o serviço de busca, neste caso o MSN Web Search, coleta páginas na Web (documentos), e as indexa, isto é, seleciona as palavras existentes na página para a geração de um índice e guarda os resultados. O usuário escolhe uma ou mais palavras e escreve uma consulta que satisfaça os requisitos (necessidades) de sua busca. No nosso caso as consultas geradas foram: "hamburger" e "cachorro quente". O serviço de busca procura as similaridades, isto é, as páginas indexadas que contenham a ou as palavras utilizadas na consulta. Finalmente o serviço de busca oferece uma lista com os apontadores para as páginas que satisfizeram a consulta. Esta lista é classificada com as páginas mais similares a consulta em primeiro lugar.

Resumo:

    1. O serviço de busca coleta páginas na Web e gera um índice com as palavras contidas nestas páginas;
    2. Um usuário escreve uma consulta com as palavras que julga serem adequadas para achar a página desejada;
    3. O usuário envia estas palavras para o sistema de busca;
    4. O sistema de busca compara estas palavras (consulta) com o índice das páginas Web catalogadas;
    5. As páginas mais semelhantes com a consulta (as que tem mais palavras comuns com o texto enviado na consulta) são escolhidas e enviadas ao usuário;
    6. O usuário verifica a qualidade da resposta e escolhe as páginas recuperadas de atendam a sua consulta.

Dica:

Leia esta página e experimente diversas busas.

No caso inicial, apresentado acima, foi utilizado o serviço MSN Web Search pois o mesmo vá vem associado com o MS Internet Explorer. Mas se você não utilizar este sistema operacional ou se preferir outro navegador (Web browser) existem inúmeros outros sistemas de busca que podem ser acessados. Entre outros podemos citar o Google, o AltaVista e o Yahoo! No caso do navegador Firebird, da Mozilla.org, o mecanismo de busca associado é o Google. Neste caso ao digitar "cachorro quente" na linha de endereço o Google é acionado na opção "estou com sorte" e o site mais provavel é acessado.

E o resultado será:

Note que neste caso a seleção do site mais adequado é feita pelo Google. Este tipo de consulta é apropriado pra os casos onde a consulta deve gerar um único site. Este tipo consulta ocorre quando você está procurando pela página principal (homepage), por exemplo, a consulta "Barco Cisne Branco" resultará na página a seguir, com informações sobre um barco de turismo no Lago Guaiba, em Porto Alegre.

Dica:

Procure definir uma expressão de consulta com duas ou três palavras que caracterizem bem o assunto que está sendo pesquisado.

 

6. A qualidade da busca

Para que você consiga atingir os resultados desejados em sua pesquisa deve considerar os dois pontos:

1) qual serviço de busca utilizar, e

2) como escrever uma boa consulta.

Qual o motivo de escolhermos um entre os diversos sistemas de busca? Todos estes serviços de busca são iguais? A resposta é:

  • Nao, cada serviço de busca possui suas características específicas e, mais importante, cobrem conjuntos muito diferentes de páginas na Web.

Nenhum serviço de busca consegue recuperar todas as páginas existentes. A figura abaixo ilustra esta idéia. Cada serviço de busca recupera um conjunto de páginas, algumas são recuperadas por mais de um serviço mas nenhum indexa todas as páginas da Web. Se você utilizar apenas um serviço de busca não conseguirá recuperar muitas das páginas que podem ser interessantes para sua consulta. Na figura a seguir procuro mostrar que a cobertura de cada serviço de busca é diferente. Nenhm serviço de busca cobre todas as páginas existentes na Web. Para você ter uma idéia do número de páginas indexadas realize uma consulta sobre a palavra "a" que existe em praticamente todas as páginas. Hoje (08-Jukl-2006) o Google indexa cerca de 24.000.000.000 páginas!

A segunda questão é, também, muito importante: Todas as buscas realizadas tem a mesma qualidade? A resposta é, novamente: não, a qualidade da busca depende:

(i) da quantidade de páginas recolhidas pelo serviço de busca;

(ii) da qualidade da consulta.

A recuperação consiste em selecionar as palavras utilizadas na consulta e localizar cada ocorrencia destas palavras nas páginas Web coletadas pelo serviço de busca. A consulta (você já sabe que uma consulta é uma palavra ou seqüencia de palavras) representa os requisitos (as necessidades) de informação do usuário. O serviço de busca tenta encontrar as páginas Web mais semelhantes a uma consulta. Esta atividade é denominada "Processo de identificação de similaridades". No caso mais simples a similaridade é identificada pela contagem das palavras utilizadas na consulta e existentes nas páginas. As páginas mais similares em relação a consulta são aquelas que contém o maior número de palavras utilizadas na formulação da consulta. É essencial que você consiga escrever uma consulta que tenha o conteúdo mais próximo possível ao conteúdo do documento procurado.

Dica:

As páginas na Web são coletadas pelas ferramentas de busca e indexadas. Ao ser feita uma consulta um mecanismo de identificação de similaridades escolhe, entre os milhoes de páginas armazenadas pelo serviço de busca, aquelas que mais se aproximam da consulta. Portanto procure colocar-se na posição de quem quer divulgar uma informação na Web, o web designer, se você conseguir fazer isto suas consultas serão muito mais eficientes.

 

Dica:

Veja como é interessanter ter a barra de ferramentas Google instalada. Uma das vantagens das ferramentas é o indicador de PageRank™ da Barra de ferramentas para saber como os algoritmos do Google avaliam a importância da página que está sendo exibida.

 

 

Realize os seguintes exercícios:

1.1 Você deseja comprar sanduiches do tipo hamburgers, realize uma busca nos serviços listados, se quiser e conhecer outros utilize-os. Para realizar estas busca utilize a palavra "hamburger". Complete a tabela a seguir com os resultados obtidos e escreva um pequeno texto resumindo sua avaliação sobre esta pesquisa.

Serviço de busca

Sua nota para
o serviço de
busca

Número de páginas
encontradas

As primeiras páginas encontradas
resolveram a sua necessidade de
informação?

1a

2a

3a

4a

Google

Altavista

HotBot

Todo BR

Netscape

MSN

Ask.com

Sapo

Entre os inúmeros serviços de busca na Web encontramos os seguintes:

 

1.2 As cinco primeiras páginas recuperadas em cada serviço de busca foram as mesmas? Faça uma tabela com os resultados das buscas. Preencha o modelo a seguir. Este exercício permite compreender as diferenças nos sistemas de ordenação por relevância das páginas dos diferentes serviços de busca.

Páginas

Google

Yahoo!

Todo Br

MSN

Netscape

Lycos

Ask.com

Sapo

http://www.xxx.yyy.com

S

N

S

S

N

N

S

S

 

1.3 Preste muita atenção nas páginas de resultado dos diferentes serviços de busca, veja se há algo interessante a ser relatado sobre estas páginas ou sobre o conjunto de páginas recuperadas.

 

1.4 Descreva as diferenças percebidas entre cada um dos serviços de busca utilizados.

 

1.5 Procure realizar esta busca: "descobrir onde é possível comprar hamburgers", isto é, escolha palavras ou grupos de palavras para aperfeiçoar a busca. Explique o que você fez e os resultados desta nova consulta.

Busca inteligente na internet Modulo I" y "Módulo II - Aperfeiçoando a primeira busca"

Nem sempre os resultados de uma busca são os esperados. Muitas vezes as páginas encontradas como resultado da buscas não atendem às expectativas do usuário. Isto ocorre porque o argumento de pesquisa não representa exatamente o que o usuário estava pensando. Este capítulo fornece algumas sugestões de como é possível aperfeiçoar uma busca para que os resultados sejam mais adequados àquilo que se espera quando da realização da consulta.

7. A análise dos resultados obtidos

Você já verificou que Internet oferece um volume muito grande de informação. Certamente a busca sobre os sanduíches do tipo "hamburger" apresentou surpresas. Algumas páginas recuperadas estavam em português, outras em inglês e, ainda outras, em alemão. Além disto, certamente foram recuperadas páginas sobre museus ou eventos em Hamburgo, uma cidade na Alemanha! Estas páginas foram recuperadas pois a palavra "hamburger" é utilizada em várias línguas, além disto "Hamburger" em alemão indica algo ou alguém de Hamburgo. Agora precisamos responder mais uma pergunta importante:

  • Como melhorar a qualidade da pesquisa realizada?

Esta pergunta é uma variação da que fizemos no módulo anterior:

  • Todas as buscas tem a mesma qualidade?

A resposta é "Não", mas agora podemos detalhar mais a resposta. A qualidade da busca depende do serviço de busca e da consulta propriamente dita. Quanto ao serviço de busca, nada podemos fazer quanto a forma de indexação nem quanto a quantidade de páginas recolhidas na Web. A escolha está limitada à seleção do serviço de busca mais adequado às nossas necessidades. Por outro lado temos toda a liberdade para melhorar a qualidade da consulta.

No caso da consulta anterior uma alternativa para obtermos o resultado esperado é solicitar que os resultados sejam exclusivamente páginas em portugês sobre hamburgers. Neste caso vamos utilizar o serviço de busca Google® (http://www.google.com.br) e, além da palavra "hamburger", vamos marcar o botão "Pesquisar páginas em português".

O resultado obtido é: (atenção: os resultados são apenas exemplos criados em algum momento no passado. Páginas são continuamente criadas e destruidas e os serviços de busca estão continuamente indexando as novas páginas, portanto você deve realizar, novamente, esta consulta e analizar os resultados atuais)

Hamburgo SV - SoccerAge.com
... Live Scores. Hamburger Sport Verein. Ano de fundação: 1887. ... Team Jerseys, Home
Jersey, Away Jersey, goleiro, goleiro, Hamburger SV FÓRUM (29). Salut. Buscar. ...
www.soccerage.com/pt/02/00367.html - 60k

Hamburgo SV _ Bundesliga 2002/2003 _ calendário - SoccerAge.com
... 59, Bayern München, 0-3, 1-1. 46, Borussia Dortmund, (12/04/2003), 1-1. 43, VfB
Stuttgart, 3-2, 1-1. 40, Hamburger SV, --, --. 38, Schalke 04, 3-1, 3-0. 37, Werder
Bremen, 1-0, 2-1. ...
www.soccerage.com/pt/39/22936.html - 53k

Joakin's Hamburger
Site em fase de reformulação ! Envie suas sugestôes por email ! ...
www.joakins.com.br/ - 6k

Joakin's Hamburger
194572.jpg (20657 bytes). O Joakin’s Hamburger nasceu há 34 anos no dia
7 de março de 1965. ... Seu nome foi mudado para Joakin’s Hamburger. ...
www.joakins.com.br/Historia.htm - 9k

Bem, as páginas agora estão em português mas não tratam do assunto que desejávamos! O que fazer? Vamos colocar mais uma palavra caracterizando melhor o assunto desejado, a consulta ficará "hamburger sanduiche".

Agora sim conseguimos encontrar as páginas desejadas:

Fritas Aliança - Receita de Sanduíche Crocante
... meio, coloque a fatia de presunto, a mussarela, o bife de hamburger, sobre a ... batata
palha Fritas Aliança, junte a parte de cima do pão montando o sanduíche. ...
www.fritasalianca.com.br/sanduiche.html - 2k

Lista com todos os Pães, Bolos e Cia
... (30/08/2002) SANDUÍCHE RIVIERA DEI FIORE, HAMBURGER SICILIANO. . (19/07/2002)
PÃO DE ABOBRINHA COM QUEIJO, PÃO DE BACON COM CEBOLA. . (24/05/2002) ...
www.butterfry.com.br/apaes.htm - 18k

Conseguimos obter algo mais próximo doas páginas desejadas. Esta é a principal técnica na busca inteligente: utilizar conceitos, isto é, duas ou mais palavras que representem o mais exatamente possível o que desejamos procurar na Web. No caso desta consulta queríamos encontrar páginas sobre sanduiches do tipo hamburger. Mas notem que a expressão "hamburger sanduiche " não é uma frese corrente corrente na lígua falada mas sim um conjunto de palavras que caracteriza bastante bem o objetivo da consulta. Você deve ser criativo na construção da sua expressão de busca (esta é a forma rigorosa para designar o conjunto das palavras utilizadas na busca).

 

Agora voce deve clicar em "Dicas de pesquisa" e estudar muito bem as sugestões apresentadas.

 

Mudemos de consulta. Agora desejamos encontrar o texto completo do Hino Nacional Brasileiro. A primeira idéia que surge é consultar utilizando o termo Ipiranga. Pois o Hino inicia com a descrição dos fatos acontecidos às margens do Ipiranga. Olhem só o resultado:

Empresas Petróleo Ipiranga <::> Portal
Advice NetBusiness Política de Privacidade,
www.ipiranga.com.br/ - 35k

Ipiranga - Gás Natural
O Seu Posto. ...
www.ipiranga.com.br/petroleo/ distribuicao/gnv/posto.htm - 62k

MUSEU PAULISTA DA USP
MUSEU PAULISTA UNIVERSIDADE DE SÃO PAULO (MUSEU DO IPIRANGA). ...
www.mp.usp.br/ - 8k

IPQ
A Ipiranga Petroquímica produz quatro resinas termoplásticas presentes em diversos
produtos do seu dia-a-dia. ... Clique para baixar - Ipiranga Petroquímica . ...
www.ipq.com.br/ - 18k

UniFAI - Centro Universitário Assunção
www.fai.br/ - 3k

Home Page do Bairro do Ipiranga
www.bairrodoipiranga.com.br/ - 2k

Bem, não era isto o que desejávamos.

As buscas podem ser melhoradas se colocarmos algumas instruções adicionai na expressão de busca. As mais conhecidas são os operadores +termo, -termo e "expressão". Esta é a forma mais simple de melhorar uma consulta. O símbolo + indica a obrigatoriedade da palavra seguinte, - indica que a próxima palavra não deve aparecer nas páginas buscadas e, finalmente, as "..." delimitam uma frase que deve aparecer totalmente nas páginas recuperadas.

Vamos utilizar o operador +. A consulta anterior fica assim: [Ipiranga +hino]. O resultado é bem melhor:

LETRA DO HINO NACIONAL DO BRASIL OUVIRAM DO IPIRANGA AS MARGENS ...
... BRASIL HIMNO NACIONAL OUVIRAM DO IPIRANGA AS MARGENS PLÁCIDAS AS MARGENS PACÍFICAS
DO IPIRANGA OUVIRAM DE UM POVO HERÓICO O BRADO RETUMBANTE, O GRITO DE UM ...
caveromiranda.50megs.com/BRASIL.html - 14k

HINO NACIONAL BRASILEIRO
... Interpretação. HINO DO BRASIL. OUVIRAM DO IPIRANGA AS MARGENS PLÁCIDAS. AS
MARGENS PACÍFICAS DO IPIRANGA OUVIRAM. DE UM POVO HERÓICO O BRADO RETUMBANTE,. ...
www.lesles.hpg.ig.com.br/cultura_e_curiosidades/ Patriotas/Patriotas.htm - 100k

FolhaNet - Araçatuba/SP
... Questão 3 - O riacho Ipiranga aparece no hino porque foi às suas margens, conforme
conta a História do Brasil, que D. Pedro deu o Grito da Independência. ...
portrasdasletras.folhadaregiao.com.br/ hinonacional.html - 29k

hino nacional
... Pela bela música e pelos belos versos, vale a pena conhecer melhor nosso hino. ... 1.
Ouviram do Ipiranga às margens plácidas De um povo heróico o brado ...
www.folhadomeioambiente.com.br/jsp/fma-97/hino.jsp - 16k

Das quatro primeiras páginas, duas contém o texto do hino. As outras duas tratam de uma questão e da interpretação do texto do hino. Podemos ainda melhorar a consulta. A consulta ["Ouviram do Ipiranga as margens plácidas"] vai recuperar as páginas que tratam do hino Nacional Brasileiro. Algumas das páginas recuperadas contém o texto completo, outras apenas comentários sobre a letra do Hino ou questões de prova. Se tomarmos como argumento da pesquisa a segunda linha do Hino ["e o sol da liberdade, em raios fúlgidos"] retornará praticamente todas as páginas com o texto completo. Por que esta diferença? É fácil explicar, a primeira frase do Hino caracteriza o tema servindo para representá-lo em uma série de contextos. Uma frase tomada mais adiante em um texto tem uma grande possibilidade de recuperar página que contenham todo o texto.

Realize os seguintes exercícios:

2.1 Escreva um resumo de como você deve proceder para recuparar, da melhor forma possível, as referências sobre sanduiches do tipo hamburger disponíveis na sua cidade ou em uma cidade de sua preferência (caso não existam sites sobre estes sanduiches na sua cidade) utilizando o Google.

2.2 A partir das instruções apresentadas no Módulo II realize uma série de buscas para encontrar informações sobre a sua cidade. Procure criar consultas para recuperar dados sobre atrações turísticas, sobre restaurantes e sobre serviços médicos.

2.3 Localize a letra de suas músicas preferidas ou tente encontrar algum texto do qual você se lembre de um pequeno trecho. Como exemplo caso você se lembre deste início de frase "I have a dream" quem a disse? Quando? Em que lugar? Ou quem sabe se este trecho "Independência ou morte!" ou ainda este: "Por la razón o la fuerza".

José Palazzo - palazzo[arroba]inf.urfgs.br



 Página anterior Voltar ao início do trabalhoPágina seguinte 



As opiniões expressas em todos os documentos publicados aqui neste site são de responsabilidade exclusiva dos autores e não de Monografias.com. O objetivo de Monografias.com é disponibilizar o conhecimento para toda a sua comunidade. É de responsabilidade de cada leitor o eventual uso que venha a fazer desta informação. Em qualquer caso é obrigatória a citação bibliográfica completa, incluindo o autor e o site Monografias.com.