Novo sistema busca imagens mais precisas
11/04/2007
Pesquisadores da Universidade da Califórnia em San Diego desenvolveram um novo método de busca de imagens que pode superar as abordagens existentes em termos de eficiência e precisão. Segundo Nuno Vasconcelos, professor da universidade, a técnica modifica um típico método para treinar reconhecimento de imagem por computadores. O resultado é uma ferramenta de busca que automaticamente classifica as figuras com o nome dos objetos que estão nela, e como utiliza palavras para separar e classificar partes das imagens, é aplicável aos típicos sistemas de busca através de palavras-chave utilizados na web.
Segundo a publicação on-line “Technology Review”, ligada ao Massachusetts Institute of Technology (MIT), a nova abordagem, chamada de “baseada no conteúdo”, envolve descrever os objetos em uma figura ao analisar características como cor, textura e linhas. Esses objetos podem ser representados por conjuntos de características e comparados com as de outras figuras. Comparando as estatísticas dos grupos de dados, o computador busca por uniões possíveis e mostra, em uma imagem, o que poderia ser achado como “pedra” ou “grama”.
Normalmente, buscar por imagens na internet utilizando palavras específicas é um exercício de sorte. Isso porque a maior parte dos sistemas utiliza dados como o nome de um arquivo, datas, ou outras informações associadas a uma figura, que podem ser incompletas, inúteis para a busca ou simplesmente ausentes. Pesquisadores vêm trabalhando há uma década em melhores maneiras de identificar figuras e torná-las mas fáceis de serem achadas.
Nova etapa
A nova pesquisa é baseada nessa abordagem, mas adiciona um passo intermediário, diz Pedro Moreno, engenheiro do Google que participou do projeto. Ele explica que essa nova etapa fornece um “rótulo semântico”, ou uma descrição dos objetos nas figuras, ao invés de se apoiar apenas em números. Por exemplo, na imagem de um cachorro em um gramado, os objetos serão analisados e comparados com resultados de categorias conhecidas, como cachorros, gatos ou peixes. Então o computador fornece uma análise estatística que mostra a probabilidade de uma figura ser comparável a estas categorias. “A principal idéia é representar imagens em um espaço semântico. Isso parece melhorar a performance consideravelmente”, diz Moreno.
O sistema foi aperfeiçoado ao ser exposto a milhares de figuras que incluíam objetos como montanhas, flores, pessoas, água, animais, assim como a suas classificações semânticas correspondentes. Então os pesquisadores o testaram ao exibir novas figuras que incluíam objetos não classificados. Quando comparado com uma descrição humana da cena, o sistema funcionou bem: a imagem de um tigre na grama fez com que ele captasse as palavras gato, tigre, plantas, folha e grama. Uma classificação humana incluiu gato, tigre, floresta e grama.
Segundo especialistas, a nova abordagem de busca poderia ser útil para ser adicionada aos sistemas atualmente utilizados, facilitando o trabalho do usuário. Porém, a busca de características mais completas, como por “pessoas felizes”, por exemplo, deve demorar pelo menos mais cinco anos para ser possível.
Deixe uma resposta
Want to join the discussion?Feel free to contribute!