Recuperação de Informação

Palestra sobre como sistemas de recuperação de informação funcionam.

Quando um usuário busca um determinado assunto em um banco de dados entra em cena o sistema de recuperação de informação. A recuperação de informação teve início nas empresas que tinham a necessidade de pesquisar informações em seus banco de dados. Nas últimas décadas expandiu para a Web, que pode ser interpretada como um grande banco de dados.

Assim como nas empresas, inicialmente as buscas na Web seguiam um modelo vetorial que tinha como principal critério o número de vezes que a palavra aparecia em um documento. Mas esse modelo não era eficaz para gerar resultados com qualidade na Web. Qualquer um poderia criar uma página com a densidade de palavras que quiser e essa página não ser necessariamente relevante para resultados para essas palavras. Surge então tecnologias como o PageRank do Google que mede a probabilidade de uma página ser acessada. Para isso, considera fatores como reputação da página, a concentração de links, o número de links para aquela página.

Os sistemas de recuperação de informação podem ser um dos responsáveis pela expansão da internet na última década. Milhares de sites que poderiam estar ocultos estão visíveis graças a eles, são, por isso, um dos motores do dinamismo da internet.