O Banco de Dados de Proteínas (PDB) é uma coleção de informações sobre a estrutura tridimensional (3-D) de grandes moléculas biológicas, tais como proteínas e ácidos nucléicos. Biólogos e bioquímicos de todo o mundo enviam os dados. A maioria dos dados vem da cristalografia de raios X ou espectroscopia NMR. Qualquer pessoa pode acessar o PDB gratuitamente on-line. O Banco Mundial de Dados de Proteínas, wwPDB, gerencia o PDB.
O PDB é útil para os cientistas que estudam biologia estrutural e genômica estrutural. Muitos cientistas têm que enviar suas informações para o banco de dados. As principais revistas científicas e algumas agências de financiamento, como os Institutos Nacionais de Saúde dos Estados Unidos, têm regras que dizem aos cientistas para enviar os dados para o PDB. O PDB tem os dados originais ou primários. Centenas de outras bases de dados reutilizam os dados. Estas bases de dados secundárias organizam as informações de diferentes maneiras. Por exemplo, tanto SCOP quanto CATH colocam estruturas em grupos organizados por tipo de estrutura e idéias sobre como eles se relacionam através da evolução. A ontologia dos genes coloca os dados em grupos baseados em genes.