Les Data Scientists sont chargés de découvrir des informations pertinentes à partir d'importants volumes de données. Ils organisent et analysent de grandes quantités de données à l'aide de logiciels spécifiques. Afin qu’un Data Scientist puisse trouver un sens aux données, les responsables de projets IoT doivent lui faire part de leurs objectifs. Les données analysées proviennent en général de plusieurs sources disparates (par exemple de capteurs embarqués à l'appareil IoT, du GPS du smartphone de son utilisateur, et de la base de données de gestion des clients de l'entreprise). Elles peuvent être structurées ou non structurées.
Les données structurées sont organisées, généralement en catégories, ce qui facilite le tri, la lecture et l’organisation automatique à l'aide d'un outil logiciel. Une feuille de calcul Excel, avec sa mise en forme en colonnes et lignes prédéfinies, permet notamment de les visualiser. Ses composants sont facilement catégorisés (horodatage, température, pression, consommation, temps d'utilisation...), ce qui permet aux concepteurs et aux administrateurs de bases de données de définir des algorithmes pour effectuer des recherches et des analyses. Les données non structurées sont plus délicates à traiter. Elles peuvent être constituées de commentaires de clients, de vidéos, d'images, de publications sur les réseaux sociaux, de fichiers audio... De telles données sont généralement plus difficiles à trier et à gérer car elles ne sont pas aisément classables dans des bases de données traditionnelles.