A busca no Google consiste em uma série de sites localizados. O maior deles, o site google.com, é o site mais visitado do mundo. Algumas de suas características incluem um link de definição para a maioria das buscas, incluindo palavras do dicionário, o número de resultados obtidos em sua busca, links para outras buscas (por exemplo, para palavras que o Google acredita estarem mal soletradas, ele fornece um link para os resultados da busca usando sua ortografia proposta), e muito mais.
Sintaxe de busca
O mecanismo de busca do Google normalmente aceita consultas como um texto simples, e divide o texto do usuário em uma seqüência de termos de busca, que normalmente serão palavras que devem ocorrer nos resultados, mas também se pode usar operadores booleanos, tais como: aspas (") para uma frase, um prefixo como "+", "-" para termos qualificados, ou um de vários operadores avançados, tais como "site:". As páginas do "Google Search Basics" descrevem cada uma dessas consultas e opções adicionais (veja abaixo: Opções de busca).
O formulário de busca avançada do Google fornece vários campos adicionais que podem ser usados para qualificar as buscas por critérios como a data da primeira recuperação. Todas as consultas avançadas se transformam em consultas regulares, geralmente com termos qualificados adicionais.
Consulta de expansão
O Google aplica expansão de consulta à consulta submetida, transformando-a na consulta que será realmente utilizada para recuperar resultados. Como na classificação da página, os detalhes exatos do algoritmo que o Google utiliza são deliberadamente obscuros, mas certamente as seguintes transformações estão entre aquelas que ocorrem:
- Reordenamento de termos: na recuperação de informações, esta é uma técnica padrão para reduzir o trabalho envolvido na recuperação de resultados. Esta transformação é invisível para o usuário, uma vez que o pedido de resultados usa a ordem de consulta original para determinar a relevância.
- O recorte é usado para aumentar a qualidade da busca, mantendo pequenas variantes sintáticas de termos de busca.
- Há uma facilidade limitada para corrigir possíveis erros ortográficos em consultas.
"Estou me sentindo sortudo"
A página inicial do Google inclui um botão com o nome "Estou me sentindo com sorte". Quando um usuário clica no botão, o usuário será levado diretamente ao primeiro resultado da busca, contornando a página de resultados do mecanismo de busca. A idéia é que se um usuário estiver "se sentindo com sorte", o mecanismo de busca retornará a correspondência perfeita na primeira vez sem ter que paginar através dos resultados da busca. De acordo com um estudo de Tom Chavez do "Rapt", este recurso custa ao Google $110 milhões por ano, já que 1% de todas as buscas usam este recurso e ignoram toda a publicidade.
Em 30 de outubro de 2009, para alguns usuários, o botão "I'm Feeling Lucky" foi removido da página principal do Google, junto com o botão de busca regular. Ambos os botões foram substituídos por um campo que diz: "Este espaço foi intencionalmente deixado em branco". Este texto desapareceu quando o mouse foi movido na página, e a funcionalidade normal de busca é obtida preenchendo o campo de busca com os termos desejados e pressionando enter. Um porta-voz do Google explica: "Isto é apenas um teste, e uma forma de avaliarmos se nossos usuários gostarão de uma interface de busca ainda mais simples". As homepages personalizadas do Google mantiveram ambos os botões e suas funções normais.
Em 21 de maio de 2010, no 30º aniversário do Pac-Man, o botão "I'm Feeling Lucky" foi substituído por um botão lendo as palavras "Insert Coin" (Inserir Moeda). Após pressionar o botão, o usuário começaria um jogo com o tema Google do Pac-Man na área onde o logotipo do Google normalmente estaria. Pressionar o botão uma segunda vez iniciaria uma versão para dois jogadores do mesmo jogo que inclui Ms. Pacman para o jogador 2. Esta versão pode ser acessada em http://www.google.com/pacman como um link permanente para a página.
Snippets ricos
Em 12 de maio de 2009, o Google anunciou que eles estariam analisando os microformatos hCard, hReview e hProduct e usando-os para preencher as páginas de resultados de pesquisa com o que eles chamaram de "Rich Snippets".
Características especiais
Além da principal característica do motor de busca de texto, a busca no Google tem mais de 22 "características especiais" (ativadas pela digitação de qualquer uma das dezenas de palavras de gatilho) ao pesquisar:
- Tempo - As condições climáticas, temperatura, vento, umidade e previsão, para muitas cidades, podem ser vistas digitando "tempo" junto com uma cidade para cidades maiores ou cidade e estado, código postal dos EUA, ou cidade e país para cidades menores (como: tempo Lawrence, Kansas; tempo Paris; tempo Bremen, Alemanha).
- cotações de ações - Os dados de mercado de uma empresa ou fundo específico podem ser visualizados, digitando o símbolo de "ação" (ou incluir "estoque"), como por exemplo: CSCO; MSFT; ação IBM; ação F (lista Ford Motor Co. ); ou AIVSX (fundo). Os resultados mostram as mudanças entre dias, ou gráficos de 5 anos, etc. Isto não funciona para nomes de ações com uma letra, tais como Citigroup (C) ou Macy's (M) (sendo a Ford uma exceção), ou são palavras comuns, tais como Diamond Offshore (DO) ou Majesco (COOL).
- tempo - A hora atual em muitas cidades (no mundo todo), pode ser vista digitando "tempo" e o nome da cidade (como: tempo Cairo; tempo Pratt, KS).
- pontuações esportivas - As pontuações e horários, para equipes esportivas, podem ser exibidas digitando o nome da equipe ou o nome da liga na caixa de busca.
- conversão de unidades - As medidas podem ser convertidas, digitando cada frase, como por exemplo: 10,5 cm em polegadas; ou 90 km em milhas
- conversão de moeda - Um conversor de moeda ou dinheiro pode ser selecionado, digitando os nomes ou códigos de moeda (listados pela ISO 4217): 6789 Euro em USD; 150 GBP em USD; 5000 Yen em USD; 5000 Yuan em lira (o dólar americano pode ser USD ou "US$" ou "$", enquanto o canadense é CAD, etc.).
- calculadora - Os resultados dos cálculos podem ser determinados, como calculados ao vivo, entrando com uma fórmula em números ou palavras, como por exemplo: 6*77 +pi +sqrt(e^3)/888 mais 0,45. O usuário tem a opção de pesquisar a fórmula, após o cálculo. A calculadora também usa as funções de conversão de unidade e moeda para permitir cálculos com consciência de unidade. Por exemplo, "(3 EUR/litro) / (40 milhas/gallon) em USD / milha" calcula o custo em dólares por milha para um carro de 40 mpg com gasolina custando 3 euros por litro. O caret "^" eleva um número para uma potência exponencial, e porcentagens são permitidas ("40% de 300").
- intervalos numéricos - Um conjunto de números pode ser combinado usando um ponto duplo entre os números do intervalo (70..73 ou 90..100) para corresponder a qualquer número positivo no intervalo, inclusive. Números negativos são tratados como usando o traço de exclusão para não corresponder ao número.
- Pesquisa de dicionário - Uma definição para uma palavra ou frase pode ser encontrada, digitando "definir" seguido por dois pontos e a(s) palavra(s) a ser(em) pesquisada(s) (como, por exemplo, "definir:filosofia")
- mapas - Alguns mapas relacionados podem ser exibidos, digitando o nome ou código postal americano de um local e a palavra "mapa" (como: mapa de Nova Iorque; mapa do Kansas; ou mapa de Paris).
- horários de exibição de filmes - Críticas ou horários de exibição de filmes podem ser listados para qualquer filme que esteja sendo exibido nas proximidades, digitando "filmes" ou o nome de qualquer filme atual na caixa de busca. Se um local específico foi salvo em uma busca anterior, o resultado da busca superior exibirá os horários de exibição dos cinemas próximos para aquele filme. Estas listagens, entretanto, às vezes são totalmente incorretas e não há como pedir ao Google que as corrija; por exemplo, em 25 de julho, para o Teatro El Capitan, o google showtimes lista Up, mas de acordo com o site El Capitan, o único filme em cartaz naquele dia é o G-Force. []
- dados públicos - As tendências da população (ou taxas de desemprego) podem ser encontradas para os estados e condados dos EUA, digitando "população" ou "taxa de desemprego" seguido de um nome de estado ou condado.
- imóveis e moradias - As listas de moradias em uma determinada área podem ser exibidas, usando as palavras "moradia", "casa", ou "imóvel" seguidas do nome de uma cidade ou código postal americano.
- dados de viagem/aeroportos - O status do vôo de chegada ou partida de vôos dos EUA pode ser exibido, digitando o nome da companhia aérea e o número do vôo na caixa de busca (como: American airlines 18). Atrasos em um aeroporto específico também podem ser visualizados (digitando o nome da cidade ou o código do aeroporto de três letras mais a palavra "aeroporto").
- rastreamento de pacotes - Os pacotes de correio podem ser rastreados digitando o número de rastreamento de um pacote Royal Mail, UPS, Fedex ou USPS diretamente na caixa de busca. Os resultados incluirão links rápidos para rastrear o status de cada remessa.
- números de patentes - as patentes americanas podem ser pesquisadas digitando a palavra "patente" seguida do número da patente na caixa de pesquisa (como: Patente 5123123).
- código de área - A localização geográfica (para qualquer código de área telefônica dos EUA) pode ser exibida digitando um código de área de 3 dígitos (tais como: 650).
- busca de sinônimos - Uma busca pode combinar palavras semelhantes às especificadas, colocando o sinal de til (~) imediatamente em frente a um termo de busca, como por exemplo ~alimentação rápida.
- Pesquisa do governo dos EUA - A pesquisa de sites do governo dos EUA pode ser realizada a partir da página web: www.google.com/unclesam.
Opções de busca
As páginas web mantidas pelo Centro de Ajuda do Google têm texto descrevendo mais de 15 várias opções de busca. Os operadores do Google:
- OU - Procura por qualquer um dos dois, como "preço alto OU baixo" procura "preço" com "alto" ou "baixo".
- "-" - Busca excluindo uma palavra, tal como "maçã - árvore" busca onde a palavra "árvore" não é usada.
- "+" - Forçar a inclusão de uma palavra, como "Nome + do + jogo" para exigir que as palavras "de" & "o" apareçam em uma página correspondente.
- "*" - Operador de Wildcard para fazer corresponder quaisquer palavras entre outras palavras específicas.
Algumas das opções de consulta são as seguintes:
- definir: - O prefixo de consulta "definir:" fornecerá uma definição das palavras listadas após a mesma.
- ações: - Após "ações:", os termos de consulta são tratados como símbolos de estoque para consulta.
- site: - Restringir os resultados a esses sites no domínio em questão, como, por exemplo, site:www.acmeacme.com. A opção "site:com" procurará todas as URLs de domínio nomeadas com ".com". (sem espaço após "site:").
- allintitle: - Somente os títulos das páginas são pesquisados (não o texto restante em cada página da web).
- intitle: - Prefixo para pesquisar em um título de página web, como "intitle:google search" listará páginas com a palavra "google" no título, e a palavra "search" em qualquer lugar (sem espaço após "intitle:").
- allinurl: - Somente as linhas de endereço URL da página são pesquisadas (não o texto dentro de cada página da web).
- inurl: - Prefixo para cada palavra a ser encontrada na URL; outras palavras são combinadas em qualquer lugar, tais como "inurl:acme search" corresponde a "acme" em uma URL, mas corresponde a "search" em qualquer lugar (sem espaço após "inurl:").
As opções de exibição de página (ou tipos de consulta) são:
- cache: - Destaca as palavras de busca dentro do documento em cache, tais como "cache:www.google.com xxx" mostra o conteúdo em cache com a palavra "xxx" destacada.
- link: - O prefixo "link:" listará páginas web que têm links para a página web especificada, como "link:www.google.com" lista páginas web com links para a página inicial do Google.
- relacionados: - O prefixo "relacionado:" listará páginas da web que são "similares" a uma página da web especificada.
- info: - O prefixo "info:" exibirá algumas informações de fundo sobre uma página da web específica, como, por exemplo, info:www.google.com. Normalmente, a informação é o primeiro texto (160 bytes, cerca de 23 palavras) contido na página, exibido no estilo de uma entrada de resultados (para apenas 1 página como correspondendo à pesquisa).
- tipo de arquivo: - os resultados mostrarão somente arquivos do tipo desejado (ex filetype:pdf retornará arquivos pdf)
Observe que o Google pesquisa a codificação HTML dentro de uma página web, não a aparência da tela: as palavras exibidas em uma tela podem não estar listadas na mesma ordem na codificação HTML.
Mensagens de erro
Algumas buscas darão um erro 403 Proibido com o texto
"Pedimos desculpas...
... mas sua consulta parece semelhante a solicitações automatizadas de um vírus de computador ou de um aplicativo de spyware. Para proteger nossos usuários, não podemos processar sua solicitação agora mesmo.
Restauraremos seu acesso o mais rápido possível, portanto, tente novamente em breve. Enquanto isso, se você suspeitar que seu computador ou rede foi infectado, você pode querer executar um verificador de vírus ou removedor de spyware para ter certeza de que seus sistemas estão livres de vírus e outros softwares espúrios.
Pedimos desculpas pelo inconveniente, e esperamos vê-lo novamente de toda a equipe aqui no Google".
às vezes seguido de uma solicitação de CAPTCHA.
A tela foi relatada pela primeira vez em 2005, e foi uma resposta ao uso pesado do Google por empresas de otimização de mecanismos de busca para verificar as fileiras de sites que eles estavam otimizando. A mensagem é acionada por grandes volumes de solicitações de um único endereço IP. O Google aparentemente usa o cookie Google como parte de sua determinação de recusar o serviço.
Em junho de 2009, após a morte do superastro pop Michael Jackson, esta mensagem apareceu a muitos internautas que estavam procurando no Google notícias relacionadas ao cantor, e foi assumida pelo Google como sendo um ataque DDoS, embora muitas consultas tenham sido submetidas por pesquisadores legítimos.
Janeiro de 2009 malware bug
O Google sinaliza os resultados da pesquisa com a mensagem "Este site pode prejudicar seu computador" se o site for conhecido por instalar software malicioso em segundo plano ou de forma sub-reptícia. O Google faz isso para proteger os usuários contra visitas a sites que possam danificar seus computadores. Por aproximadamente 40 minutos em 31 de janeiro de 2009, todos os resultados de pesquisa foram erroneamente classificados como malware e, portanto, não puderam ser clicados; em vez disso, uma mensagem de aviso foi exibida e o usuário foi solicitado a digitar o URL solicitado manualmente. O erro foi causado por erro humano. A URL de "/" (que se expande para todas as URLs) foi erroneamente adicionada ao arquivo de padrões de malware.
Doodle para Google
Em certas ocasiões, o logotipo na página web do Google mudará para uma versão especial, conhecida como "Google Doodle". Clicando nos links do Doodle para uma seqüência de resultados de pesquisa do Google sobre o tópico. O primeiro foi uma referência ao Festival do HomemQueimado em 1998, e outros foram produzidos para os aniversários de pessoas notáveis como Albert Einstein, eventos históricos como o 50º aniversário do bloco Lego interligado e feriados como o Dia dos Namorados.
Cafeína Google
Em agosto de 2009, o Google anunciou o lançamento de uma nova arquitetura de busca, codinome "Cafeína". A nova arquitetura foi projetada para retornar resultados mais rapidamente e para lidar melhor com informações rapidamente atualizadas de serviços incluindo Facebook e Twitter. Os desenvolvedores do Google observaram que a maioria dos usuários notaria pouca mudança imediata, mas convidaram os desenvolvedores a testar a nova busca em sua caixa de areia. As diferenças observadas por seu impacto sobre a otimização dos mecanismos de busca incluíam o peso mais pesado da palavra-chave e a importância da idade do domínio. A mudança foi interpretada em alguns trimestres como uma resposta ao recente lançamento pela Microsoft de uma versão atualizada de seu próprio serviço de busca, renomeado Bing. O Google anunciou a conclusão da Caffeine em 8 de junho de 2010, alegando resultados 50% mais recentes devido à atualização contínua de seu índice. Com Caffeine, o Google transferiu seu sistema de indexação back-end do MapReduce para o BigTable, a plataforma de banco de dados distribuído da empresa. A cafeína também é baseada na Colossus, ou GFS2, uma revisão do sistema de arquivos distribuídos GFS.
Busca encriptada
Em maio de 2010, o Google lançou a pesquisa na web criptografada por SSL. A busca criptografada pode ser acessada em: https://encrypted.google.com
Busca instantânea
O Google Instant, um aprimoramento que exibe resultados sugeridos enquanto os tipos de usuários, foi introduzido nos Estados Unidos a partir de 8 de setembro de 2010. Uma preocupação é que as pessoas possam selecionar um dos resultados sugeridos ao invés de finalizar seu pedido, e que tal prática possa causar preconceito em relação a negócios familiares ou outros termos de busca. Os termos de busca pornográficos ou de outra forma ofensivos são excluídos dos resultados sugeridos. O recurso instantâneo aparece apenas no site básico do Google e não nas páginas especializadas do iGoogle. O Google espera que o Google Instant poupe aos usuários de 2 a 5 segundos em cada busca, que eles dizem ser coletivamente 11 milhões de segundos por hora. Os especialistas em marketing dos mecanismos de busca especularam que o Google Instant teria um grande impacto na busca local e paga.
Em conjunto com o lançamento do Google Instant, o Google desabilitou a capacidade dos usuários de escolher ver mais de 10 resultados de pesquisa por página. A busca instantânea pode ser desativada através do menu "preferências" do Google, mas as sugestões de busca no estilo autocompletar agora não podem ser desativadas. Um representante do Google declarou: "É de acordo com nossa visão de uma experiência de busca unificada do Google fazer com que características populares e úteis façam parte da experiência padrão, em vez de manter versões diferentes do Google. Como a qualidade do Autocomplete melhorou, sentimos que era apropriado tê-lo sempre ligado para todos os nossos usuários".