用户指南
另请参阅:关于学术搜索
本服务提供对存档于互联网档案馆中各种集合的研究出版物进行全文搜索。它包括自然科学,人文科学,生物医学,艺术,历史,工业研究,政府报告等内容。
如果可能,提供读者对内容的访问。有时,这种访问是对作品的“预印本”或其他版本的访问,这在搜索结果中指明。 在其他情况下,根据搜索过滤器,将包括仅包含书目目录条目的结果。仍然有可能通过公共图书馆或直接从出版商获得访问权限。
查询语法
除了基本的过滤和排序选项,此搜索
界面还允许在搜索框中使用Lucene查询语法。您可以
使用冒号语句限制对多个元数据字段的术语查询
journal:Science
,设置过滤器,例如 lang:de
,以及
应用范围查询,例如 year:> 1989 year:< 2000
。
虽然这种语法允许相对复杂和强大的查询,但某些时候,高级用户可能会遇到查询的大小或复杂性的限制。 目前,我们建议使用 lens.org 之类的系统来提供更强大的界面。
查询示例
搜索特定年份的有关主题的数字化页面:
搜索符合条件的中文论文:
具有作者姓名查询的会议论文:
引文查询
作为一项实验性功能,如果搜索查询“看起来像”是正式引文(如在研究论文的书目中发现的那样),则该服务将尝试解析引文,并与我们的已知作品目录进行匹配。发生这种情况时,将忽略所有过滤器。
元数据字段
您可以使用星号(例如 doi:*
)限制字段存在的记录,并否定!type:article-journal
之类的任何术语。
查询语法的深入文档是可用的,参见 ,这源自 Elasticsearch 项目。
完整的当前搜索文档模式是可用的 (作为 JSON),参见 ,这位于项目源码。
title: | |
author: | |
journal: | |
year: | |
issue: | |
volume: | |
doi: | |
tag: | eg, "tag:oa" |
type: | eg, "article-journal", "dataset", "book" |
stage: | eg, "published", "submitted", "accepted", "draft" |
lang; | value is a 2-character lower-case ISO language code) |
country: | value is a 2-character lower-case ISO country code |
access_type: | "wayback", "ia_file", "ia_sim" |
搜索结果
访问链接
标签
搜索结果可能具有标签标签,这些标签标签提供了有关作品的其他背景信息。例如,包含期刊的索引,或用于出版物的开放平台技术。
多个版本 | 该作品有多个发行的“版本”或“版本”,并且正在显示“主要”的书目元数据。点击标题以查看其他版本 |
lang:en | 这项工作的主要语言不同于搜索界面语言。指示 ISO两字母语言代码 |
DOAJ | 发表在开放获取期刊目录出版物中,这意味着这是一项开放获取工作 |
Szczepanski | 在 Szczepanski的“开放获取期刊列表” 中索引的出版物,这意味着这是一项开放获取工作 |
开放存取 | 由于任何其他原因,该作品被认为是“开放获取” |
SciELO | 在 SciELO 国家平台上发布 |
OJS | 使用 Open Journal Systems 软件发布 |
Wordpress | 使用 WordPress 软件发布 |
JSTOR | 在 JSTOR 数字保存平台上保存和/或托管 |
持久标识符
在搜索结果和替代版本列表的下方,是可以唯一标识作品特定版本的任何已知“持久标识符”。这些通常是超链接。
doi: | 数字对象标识符(DOI),用于重定向到发布者的登录页面 |
pmid: | PubMed / MEDLINE |
pmcid: | PubMed Central |
arxiv: | arXiv预印服务 |
dblp: | DBLP计算机科学书目 |
doaj: | DOAJ中作品的文章级标识符,尤其是没有DOI的作品 |
fatcat: | fatcat.wiki “发布”标识符。 Scholar是基于fatcat目录建立的 |
工作正在进行中
一些已知的错误和问题:
- 会议记录的元数据质量差。许多论文集被标注为 "未出版",与会议无关。
- 同一作品的重复版本。例如,同一论文或数据集的不同版本。我们正在研究fatcat目录中的基本实体重复数据删除。
- 文件内容或版本与作品元数据不匹配。例如,有时预印本或作者手稿与记录版本元数据的关联不正确,反之亦然。