A ciência dos dados é o estudo da extração do conhecimento a partir dos dados. Ela utiliza várias técnicas de muitas áreas, incluindo processamento de sinais, matemática, probabilidade, aprendizagem de máquinas, programação de computadores, estatística, engenharia de dados, correspondência de padrões e visualização de dados, com o objetivo de extrair conhecimento útil dos dados. Com sistemas de computador capazes de lidar com mais dados, os grandes dados são um aspecto importante da ciência de dados.

Uma pessoa que faz ciência de dados é chamada de cientista de dados. Os cientistas de dados resolvem problemas complicados de dados usando matemática, estatística e ciência da computação, embora não seja necessária muita habilidade nestes assuntos. Entretanto, um cientista de dados é provavelmente um especialista em apenas uma ou duas destas disciplinas, o que significa que equipes interdisciplinares cruzadas podem ser um componente chave da ciência de dados.

Bons cientistas de dados são capazes de aplicar suas habilidades para atingir muitos tipos de objetivos. Suas aptidões e competências variam muito.