Targeted Communities - III THE COMMISSION’S FINDINGS

4 AVSLUTTENDE BETRAKTNINGER

III THE COMMISSION’S FINDINGS

E. Targeted Communities

No ano de 2014, mais precisamente dia 07 de abril, a Grande Rede completou 45 anos de vida. Evidentemente, não da forma como todos a conhecemos atualmente, mas foi em 1969 que nasceu o princípio básico do que viria a ser uma das mais impactantes criações humanas.

O grande “boom” da Internet se deu nos anos de 1990 e, no Brasil, foi em 1995 que o país

teve acesso comercial a Internet. Não é objetivo desta seção detalhar a história da Internet (apenas referencia-se a data) e sim, particularizar um pouco os motores de busca que permitem que seus usuários desvelem o conteúdo da Grande Rede.

Em meados da década de 1940, Vannevar Bush idealizou a criação de um mecanismo capaz de articular a informação de acordo com as necessidades do usuário, atuando como uma

“extensão de memória”. Este dispositivo foi designado como Memex e tinha o intuito de

permitir ao usuário definir associações entre informações de um texto e outro. Tavares et al (2009, p.888) assinalam esta como a “ideia visionária” que ilustrou a necessidade de criar mecanismos que permitissem armazenar e acessar o conhecimento permitindo uma fácil consulta.

About Company. Disponível em: https://www.google.com.br/intl/pt-PT/about/company/. Acesso: 08 ago. 2015.

FIGURA 5: Artigo de V. Bush sobre o Memex

FONTE: Tavares et al (2009). Motores de busca em uma perspectiva cognitiva

Com a popularização da Internet e de suas infinitas possibilidades, os mecanismos de busca se transformaram em ferramentas fundamentais de trabalho, pois são eles que possibilitam explorar e operar na Internet. A figura a seguir contém um demonstrativo histórico do desenvolvimento dos motores de busca. Diante da existência de uma enorme quantidade de diretórios e mecanismos de busca na Internet24, pretende-se, a seguir, dar uma visão geral do assunto, oferecendo uma contextualização breve do conceito e fazendo uma análise de alguns dos principais mecanismos de busca em ordem cronológica.

Cornella (1999), citado por Blattmann, Fachin e Rados (1999), chama a atenção para o fato do constante desenvolvimento e transformação que caracteriza o campo das ferramentas de busca. São constantes as incorporações entre as empresas e a atualização dos mecanismos tecnológicos. Como se trata de uma área em constante evolução, recomenda-se acompanhar constantemente o tema através de Fóruns na Internet que regularmente publicam artigos sobre as ferramentas de busca na Internet. Tanto Blattmann (1999) como Cendón (2001) indicam o SEW – SearchEngineWatch (Disponível em: http://www.searchenginewatch.com. Acesso: 08 ago. 2015) – que proporciona a seus utilizadores dicas e informações sobre busca na Web, análises da indústria de feramentas de busca e encoraja os leitores a comentar e participar sobre os artigos e colunas publicados.

FIGURA 6: Crescimento dos mecanismos de busca

Fonte: Elaborado pela autora, 2015.

Cendón (2001) diferencia basicamente dois tipos de ferramentas de busca na Web: os motores de busca e os diretórios de busca. Contudo, a partir dessas duas categorias básicas,

surgem outros tipos de ferramentas, “fazendo o mundo dos serviços de busca complexo e volátil” (CENDÓN, 2001, p.1).

Os diretórios precederam os motores de busca por palavras-chave e constituíram a primeira solução para organizar e localizar os recursos da Web. Foram implementados quando o conteúdo da Web ainda era suficientemente limitado para permitir que o mesmo fosse absorvido de forma não automática. Os sites que compunham suas bases de dados eram organizados por assunto, hierarquicamente, em categorias e subcategorias que possibilitavam aos usuários navegar progressivamente entre elas até localizar a informação de interesse.

Para Tavares et al (2009) um motor de busca é uma aplicação informática que encontra informações contidas nos sites. Existem três funções chave que todos estes devem desempenhar: procurar informações por palavras; constituir um índice e indexá-las ao local onde foram encontradas; para permitir ao internauta conjugar palavras contidas nesse índice, de forma a possibilitar a recuperação da informação. Além da procura nos cabeçalhos, URL,

nos títulos e nos textos, podem ser utilizados metadados dos sites, “etiquetas de informação”

que o desenvolvedor de um site define como sendo o resumo do seu site e que estabelece como este deve ser indexado.

Para estes autores um motor de busca é composto por cinco componentes principais: um crawler, um repositório, um indexador, um ordenador e um apresentador. O crawler é o responsável por realizar uma varredura na Web, descobrindo e recolhendo automaticamente conteúdos, seguindo os links contidos nas páginas. Somente aqueles conteúdos que o crawler é capaz de encontrar e recolher são passíveis de constar nos resultados da pesquisa.

O repositório, ou banco de dados (database), armazena as páginas recolhidas de forma que estas possam ser indexadas e exibidas em cache. O indexador processa as páginas obtidas

pelo crawler e extrai as palavras dos conteúdos Web; criando um índice invertido. Isso também tem alta relevância, pois caso não seja possível extrair corretamente as palavras de uma página, esta dificilmente será retornada como resultado de pesquisas.

O ordenador classifica as páginas que contém os termos pesquisados de modo que as mais relevantes sejam apresentadas nos primeiros lugares. Aquelas que não demonstram os termos pesquisados são relegadas para posições mais baixas. O apresentador realiza a gestão da interface de utilização do motor de busca. Recebe os termos pesquisados pelos usuários, adere à informação dos índices e apresenta os resultados da pesquisa na forma de links para as páginas.

Em uma disposição semelhante, Cohen (1999) demonstra que um mecanismo de busca, ou serviço de busca, consiste em uma base de dados de arquivos da Internet percorrida por um programa de computador (que pode ser tipo wanderer, crawler, robot, worm, spider). A indexação é realizada nos arquivos coletados e pode ser pelo título, texto integral, tamanho, URL, dentre outros.

Para ela, os componentes de um mecanismo de busca compreendem: um programa que vasculha a Web de link para link, identificando e lendo as páginas, como o spider, por exemplo; um Index – que consiste em uma base de dados com as páginas obtidas pelo spider e por fim o mecanismo de busca propriamente dito, que é um software que possibilita aos usuários consultarem o índice gerado e o qual devolve os resultados da busca pela relação numa ordem de relevância.

Em síntese, o crawler ou spider percorre e coleta as páginas da Web convertendo-as em um índice invertido; recurso que o buscador usa para responder as consultas realizadas pelos usuários (queries). O índice (index) é a interface que existe entre essas duas partes. Para produzir sumários e fornecer acesso ao cache das páginas o buscador precisa acessar os segmentos descritos acima.

Os primeiros motores de busca surgiram ainda antes da Web. Na dissertação intitulada Estudo de Tecnologias de Busca na Web, Alves (2004) oferece uma cronologia das ferramentas de busca na web. Segundo ele, antes do advento da Internet, já havia sistemas para outros protocolos ou usos. É o caso do serviço de diretório Archie, indexador de arquivos que entrou em operação em 1990. Considerado o primórdio dos mecanismos de busca, começou a ser utilizado como sistema de busca para servidores FTP – File Transfer Protocol.

A ferramenta criava listagens do conteúdo de sites anônimos de FTP e executava buscas de dados baseando-se em expressões regulares, scripts usados para recuperar nomes de arquivos disponíveis fornecidos pelo usuário. Em 1992 já era uma ferramenta popular na Internet.

O sucesso do Archie passou a inspirar a criação de outros índices, como os menus Gopher, que constituíam um protocolo de redes de computadores. Então, em 1993, um grupo de pesquisadores da Universidade de Nevada desenvolveu o sistema Veronica – Very Easy

Rodent-Oriented Net-wide Index to Computerized Archives. Mais tarde foi criado o Jughead,

também com a finalidade de operar no Gopher. Atualmente ambos estão obsoletos devido ao desuso do Gopher em detrimento ao HTML.

O primeiro sistema de busca específico para a Internet foi o World Wide Web Wanderer, Desenvolvido em junho de 1993, foi originalmente implantado para mensurar o tamanho da web. Mais tarde, no mesmo ano, foi adicionado a ele um programa de busca chamado Wandex. Autores e estudiosos da área consideram o Wanderer o primeiro Bot (ou robô web) da Internet, aplicação de software que executa tarefas automatizadas através da Internet.

Em outubro de 1993, um sistema de busca equivalente ao Archie foi desenvolvido para buscas na Web, o Aliweb (Archie Like Indexing for the WEB). O Aliweb fornecia um programa que realizava buscas nos índices fornecidos pelos autores dos sites e exigia que cada servidor Web construísse um índice das páginas de seus sites e se registrasse no Aliweb.

Outras ferramentas de busca na Internet continuaram sendo desenvolvidas. Em dezembro de 1993 foram disponibilizadas para uso o Jumpstation, o World Wide Web Worm e o RBSE (Repository-Based Software Enginnering) Spider. Em abril de 1994, entrou em operação o WebCrawler. O Jumpstation foi o primeiro motor de pesquisa a usar um robô Web, ou spider, considerado uma das principais funcionalidades de um motor de pesquisa moderno (rastreamento, indexação e busca). Este mecanismo de busca simples era empregado para recuperar informações sobre o título e os cabeçalhos das páginas da Web. O WWW Worm designava índices dos títulos e das URLs permitindo busca por palavras no índice invertido. Até então, estas duas ferramentas geravam uma listagem dos documentos encontrados na ordem do banco de dados, mas não havia nenhum tipo de classificação baseada na expressão de busca do usuário. O RBSE Spider, assim como o Webcrawler, inovou ao programar os primeiros motores de busca cujas respostas eram baseadas em

classificação de relevância; retomando nos primeiros lugares aqueles documentos que se mostravam mais relacionados aos termos de busca do usuário (ALVES, 2004).

Ainda segundo Alves (2004), foi em 1994 que as ferramentas de busca alcançaram a maturidade. Começaram a surgir motores de pesquisa que indexavam todo o conteúdo das páginas. Destaca-se aqui a criação do Yahoo! em janeiro de 1994, por David Filo e Geny Yang – também alunos da Universidade de Stanford. Retoma-se mais ao fim desta categorização maiores detalhes deste buscador fazendo um paralelo com o Google.

Em julho de 1994, foi disponibilizado o motor de busca Lycos. Batizado com o nome científico da aranha Lycosidae lycosa, ele entrou em ação com um catálogo contendo 54.000 documentos. Knoblock (1997), apresentando os relatos de Michael Mauldin (idealizador do Lycos), alega que dentre suas principais características constava o fato de existir uma classificação por ranking de relevância, calculada através de parâmetros como a quantidade dos termos de busca presentes no documento, quantidade de ocorrências repetidas do termo no mesmo documento e a posição da ocorrência no documento. Contudo, o grande diferencial do motor Lycos foi realmente o tamanho de seu catálogo. Em agosto de 1994 ele havia identificado 394.000 documentos; em janeiro de 1995 o catálogo havia alcançado 1,5 milhão de documentos; e em novembro de 1996, já tinha indexado em sua base mais de 60 milhões de documentos, o que abrangia mais que qualquer outra ferramenta de busca da época.

No final de 1994 entrou em operação o lnfoseek. Segundo Kattenberg (2011, p.20), foi fundado por Steve Kirsch, que acreditava que a web estava saturada de informações de baixa relevância. Com conhecimento de métodos para recuperar informações de múltiplas e grandes bases de dados, Kirsch desenvolveu um modelo de análise comportamental chamado ULTRAMATCH. Em 1997 o InfoSeek chegaria com um dos primeiros roteiros para segmentação comportamental, o que significava que a propaganda seria mais direcionada ao comportamento do usuário. O Infoseek evoluiria para ser um dos melhores motores de busca, em 1996, tendo as maiores páginas da web categorizadas até então. Em 1998 o InfoSeek foi quase totalmente comprado pela Disney e parte do software mais tarde foi vendido para Inktomi em 2000.

Outra ferramenta desenvolvida em 1994 foi o Inktomi. Criado por Eric Brewer, professor da University of California, trazia a ideia de um mecanismo de busca específico

distribuindo a carga de trabalho entre vários servidores. Kattenberg (2011) pontua que foi isto, inclusive, que permitiu a criação do HotBot posteriormente, em 1996, então parte dos servidores e softwares Inktomi. O sucesso do HotBot foi rapidamente visível trazendo incorporações. Em 1997, a Microsoft começou a usar clientes Inktomi para o seu motor de busca e, em 1998, a AOL também começou a utilizar o software e servidores. Mais tarde também a Yahoo! e AOL seguiriam a Microsoft. Na época ele tornou-se o mais poderoso dos mecanismos de busca, com capacidade para indexação estimada em 10 milhões de páginas por dia, o que minimizava o número de respostas de busca desatualizadas.

O AltaVista, desenvolvido pela Digital Equipment Corporation em 1994 e disponibilizado em dezembro de 1995, é outro buscador que merece destaque. De acordo com Chu & Rosenthal (2003), em janeiro de 1996, o buscador já indexava textos completos de mais de 16 milhões de páginas da web com uma frequência de atualização não específica. De acordo com a sua documentação, o Alta Vista podia buscar 2,5 milhões de páginas por dia e indexar 1 GB de informação por hora. Operava buscas booleanas e fornecia três opções de exibição: compactas, padrão, e detalhadas, embora as duas últimas fossem semelhantes. A ordem de apresentação ou a classificação de relevância dos resultados de pesquisa eram determinadas pelo local (onde, no título ou no corpo de texto, estavam as palavras correspondentes), pela frequência de ocorrência de palavras correspondentes, e distância (isto é, o intervalo) entre as palavras correspondentes. Esse conjunto de funcionalidades rapidamente o conduziu ao topo da popularidade. Alves (2004) alega que foi o primeiro a utilizar buscas em linguagem natural, o que facilitava muito as buscas dos utilizadores. Perdeu espaço para o Google e foi comprado pelo Yahoo! em 2003, que manteve a marca, mas direcionou todas as buscas AltaVista em seu próprio motor de busca. Em 8 de julho de 2013 o serviço foi fechado pelo Yahoo!.

A empresa Yahoo!, como mencionado antes, foi criada em 1994, mas se estabeleceu em março de 1995. Originalmente era considerada um serviço de diretório, pois os links eram adicionados e categorizados manualmente. Entretanto, como o número de links crescia vertiginosamente e suas páginas começavam a receber milhares de acessos por dia, foram criados meios de melhorar a organização dos dados e a possibilidade de realizar buscas.

“Desde então o Yahoo! automatizou alguns aspectos do processo de busca e classificação de

(ALVES, 2004, p.17). Em 1995 o serviço de busca se expandiu gradativamente até seu momento de declínio.

Paralelamente nesta época, era fundado no Brasil, em setembro de 1995, O Cadê?. Foi a primeira empresa nacional no ramo de buscadores. Foi em seguida incorporada pelo Yahoo! Brasil, e chegou a ter uma utilização bastante expressiva nesta época. No Brasil o Yahoo! está disponível desde junho de 1999.

Em 2000, o Yahoo! juntamente com o Altavista (que mais a frente também incorporaria), indiscutivelmente lideravam o setor de buscas na Internet. Na ocasião o Google ainda era desconhecido. Seus criadores, apesar de premiados, ainda trabalhavam vendendo a licença de seu buscador para demais corporações como o Yahoo!. De fato, foi o que aconteceu: um acordo entre as duas empresas pelo qual se estabeleceu que as buscas Yahoo! seriam fornecidas pelo Google. Sánchez-Ocaña (2013) aponta que este foi “o início do fim” do Yahoo!: A qualidade das buscas do Yahoo! até então deficientes, melhoraram muito e seus usuários satisfeitos por encontrarem o que estavam buscando, passavam à pagina do Google. Esta sem publicidade, rápida e funcional fez com que pouco a pouco o Yahoo! fosse caindo em desuso.

Em 2002 a empresa constatou que havia se tornado tecnologicamente dependente e que estava favorecendo o posicionamento do rival na Internet, a ponto de tornar-se mera intermediária. Sofrendo desvalorização, começou a tomar medidas, como a compra do Inktomi (poderoso buscador com grande capacidade de indexar sites sem, contudo, a tecnologia necessária para organizar a informação – o que o Google fazia bem) em dezembro de 2002. Mais adiante em julho de 2003 o Yahoo! comprou a Overture (empresa precursora da rentabilização de buscas por meio de resultados patrocinados) que trazia consigo também a incorporação do Altavista (outrora concorrente do Yahoo! e líder de busca no fim de 1990) e do AlltheWeb.com (considerado durante pouco tempo o buscador do futuro, que pareceria capaz de fazer frente ao Google, que no entanto falhou na tentativa).

Em 2004 o Yahoo! abandonou o acordo com o Google, começando então a integrar seu próprio sistema. Em 2008, passando por maus momentos, se associou à Microsoft – de acordo com Sánchez-Ocaña (2013) – para fazer frente ao Google. O Bing passou a ser seu motor de busca exclusivo. A empresa foi melhorando a ponto de conseguir incorporar o motor Maktoob, o mais usado no mundo árabe; mas em alguns países sua quota de mercado como

buscador desabou e não se recuperaria. Atualmente conta com um portal de Internet, um Diretório Web e diversos outros serviços, como Yahoo!Mail, Yahoo!Messenger, Yahoo!Grupos, Yahoo!Jogos, Yahoo!Compras, e Yahoo! Leilões.

Analisando a história dessas duas empresas, considerada por Sánchez-Ocaña (2013) bastante paralelas, existe uma diferença essencial entre as duas companhias, que incide precisamente na utilização da tecnologia. O Google pensou em como melhorar e facilitar a vida do usuário, ao passo que o Yahoo! colocou-o como secundário, um mero consumidor de publicidade, pensando que seu nicho já estivesse consolidado. A estratégia do Google mostrou-se mais acertada. O autor destaca também que o mérito do Google, além de tudo,

está na sua estratégia empresarial, pois tenta fazer negócios “onde nunca ninguém fez antes”

(SÁNCHEZ-OCAÑA, 2013, p.48). Sendo assim as buscas do usuário da Internet passaram de algo secundário a um dos centros de sua atividade.

FIGURA 7: Porcentagem de utilização do serviço de busca Google.

FONTE: StatCounter; GlobalStats. SANCHEZ-OCAÑA, 2013, p.94)

Hoje uma parte destes buscadores ainda funciona, mas é complexo precisar quem os detem. Grande parte foi absorvida ou incorporada, segundo Sánchez-Ocaña (2013) e Vaidhyanathan (2012), para que pudessem se tornar competitivos frente ao Google. De fato, este buscador diferenciou-se dos demais; o que é ilustrado pela figura 7, que evidencia a

preferência pelo buscador Google. Em sequência, discorre-se sobre fatores que esclarecem por que o mesmo vigorou.

In document FORENTE BESKYTTERE? (sider 146-149)