Staff Publications – LANL Research Library: Search engine coverage of the OAI-PMH corpus

10Mar06

Frank McCown, Xiaoming Liu, Michael L. Nelson, Mohammad Zubair:
« Les principaux moteurs de recherche rivalisent pour indexer le plus possible du Web. Après avoir indexé la plus grosse partie de la surface du Web, les moteurs de recherche utilisent diverses approches pour indexer le Web profond (deep Web). Dans le même temps, les dépôts institutionnels et les bibliothèques numériques adoptent le Protocole OAI pour le Moissonnage des Métadonnées (OAI-PMH) pour visibiliser leurs contenus, dont une partie est indexée par les moteurs de recherche et une partie ne l’est pas. Pour déterminer quelle proportion du corpus OAI-PMH actuel est indexé par les moteurs de recherche, nous avons moissonné près de 10 millions d’enregistrement en provenance de 776 dépôts OAI-PMH. Nous en avons extrait 3,3 millions d’URI et conduit des recherches sur des exemples de cette collection. De ce corpus OAI-PMH, Yahoo a indexé 65%, suivi par Google (44%) et MSN (7%). 22% de ces ressources n’a été indéxé dans aucun des trois moteurs de recherche. »
[via]



No Responses Yet to “Staff Publications – LANL Research Library: Search engine coverage of the OAI-PMH corpus”

  1. Laisser un commentaire

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s