RefSeq(参考序列)数据库是一个开放存取、公开注释的公共收藏核苷酸序列(DNA、RNA)及其蛋白质产品。这个数据库是由国家生物技术信息中心(NCBI)建立,并且,不像基因银行为每个主要生物分子(即DNA、RNA或蛋白质)提供一个单一记录,用于从病毒到细菌到真核生物的主要生物。
针对每一个典型生物,RefSeq目的是为基因组DNA、基因转录物和由这些转录物产生的蛋白质提供单独和连锁的记录。RefSeq仅限于能够获得足够数据的主要生物体(超过66000个不同的命名有机体,截至2011年9月);同时基因银行包括提交的任何生物体的序列(大约250000种不同命名的生物体)。