关于互联网档案馆学术

另见用户指南,其中列出了一些错误和已知问题

怎么运行的

这个搜索索引的内容将以下列三种形式之一呈现:

这份2019年FORCE11会议报告概述了项目整体的技术基础设施和目标。

内容来源

元数据来自fatcat.wiki,一个开放的 用户可编辑的学术工作目录。应该能够跟踪和 在所有情况下,都要对内容和元数据的出处进行归属。请 如有疑问请联系我们

文本和数据挖掘

我们打算为研究人员提供文本和数据的完整语料库访问。 采矿目的。衍生的数据集也可以公开发布,用于分析,以达到以下目的 例如引文图或按年份排列的N-gram频率。如果您有兴趣 或希望看到特定的数据集,请联系我们。

目前,完整的fatcat元数据语料库和上游元数据源的快照会定期上传到archive.org上的批量书目元数据集合。 更多内容请阅读《肥猫指南》

联系信息

互联网档案馆的组织联系信息列于https://archive.org/about/contact.php。 关于这个搜索服务和fatcat目录的查询可以直接到webservices@archive.org。 在https://gitter.im/internetarchive/fatcat有一个公共聊天频道。