À propos d'Internet Archive Scholar
Voir aussi : Guide de l'utilisateur qui liste certains bogues et problèmes connus
Comment ça marche
Le contenu de cet index de recherche se présente sous l'une des trois formes suivantes :
- contenu Web public tel que conservé dans The Wayback Machine et Archive-It collections partenaires
- documents imprimés numérisés provenant de collections de papier et de microformes
- matériel général provenant de collections archive.org , y compris des collaborations avec des partenaires
Cette présentation 2019 de la conférence FORCE11 donne un aperçu de l'infrastructure technique et des objectifs du projet dans son ensemble.
Sources de contenu
Les métadonnées proviennent de fatcat.wiki, un catalogue ouvert et modifiable par l'utilisateur. catalogue ouvert et modifiable par l'utilisateur des travaux universitaires. Il devrait être possible de suivre et d'attribuer d'attribuer la provenance du contenu et des métadonnées dans tous les cas. Veuillez contactez-nous si vous avez des questions.
Exploration de texte et de données
Nous avons l'intention de permettre aux chercheurs d'accéder au corpus complet à des fins d'exploration de textes et de données. de données. Des ensembles de données dérivées peuvent également être mis à la disposition du public pour analyse, par exemple un graphique de citations ou des fréquences de N-gram par année. par exemple un graphique de citations ou des fréquences de N-gram par année. Si vous êtes intéressé ou si vous souhaitez que des ensembles de données spécifiques soient mis à disposition, veuillez nous contacter.
Actuellement, des instantanés du corpus complet de métadonnées fatcat et des sources de métadonnées en amont sont téléchargés périodiquement dans la collection Bulk Bibliographic Metadata sur archive.org. Pour en savoir plus, consultez le Guide du chat gras.
Informations de contact
Les coordonnées de l'Internet Archive sont indiquées à https://archive.org/about/contact.php. Les demandes concernant ce service de recherche et le catalogue fatcat peuvent être adressées à webservices@archive.org. Il existe un canal de discussion public à https://gitter.im/internetarchive/fatcat.