关于互联网档案馆学术
另见用户指南,其中列出了一些错误和已知问题
怎么运行的
这个搜索索引的内容将以下列三种形式之一呈现:
- 公共网络内容保存于 The Wayback Machine和Archive-It合作伙伴收藏
- 数字化的印刷材料,源自纸质和缩微收藏
- 一般材料,源自archive.org 收藏,包括与合作伙伴的协作
这份2019年FORCE11会议报告概述了项目整体的技术基础设施和目标。
内容来源
元数据来自fatcat.wiki,一个开放的 用户可编辑的学术工作目录。应该能够跟踪和 在所有情况下,都要对内容和元数据的出处进行归属。请 如有疑问请联系我们。
文本和数据挖掘
我们打算为研究人员提供文本和数据的完整语料库访问。 采矿目的。衍生的数据集也可以公开发布,用于分析,以达到以下目的 例如引文图或按年份排列的N-gram频率。如果您有兴趣 或希望看到特定的数据集,请联系我们。
目前,完整的fatcat元数据语料库和上游元数据源的快照会定期上传到archive.org上的批量书目元数据集合。 更多内容请阅读《肥猫指南》。
作者和出版商
可以访问 https://guide.fatcat.wiki/authors.html 获取专为研究著作作者准备的信息。这包括更正书目元数据和更新已发表作品的说明。
类似地,可以访问 https://guide.fatcat.wiki/publishers.html 获取专为出版商准备的信息。这包括对内容进行索引和保存的指南。
联系信息
互联网档案馆的组织联系信息列于https://archive.org/about/contact.php。 关于这个搜索服务和fatcat目录的查询可以直接到webservices@archive.org。 在https://gitter.im/internetarchive/fatcat有一个公共聊天频道。
支持和致谢
Internet Archive 学术的工作获得了安德鲁W·梅隆基金会 “确保开放获取期刊文献的持续访问” 项目多个阶段的支持 (见 原始声明)。
查看其它致谢,请前往 fatcat.wiki。