Pour un ordinateur, trier des images en fonction de ce qu’elles représentent (par exemple, des chiens, des chats ou des êtres humaines, est une tâche difficile. N’importe qui est capable de faire la différence au premier coup d’œil. De son côté, l’ordinateur doit d’abord procéder à une analyse dans le but d’identifier les caractéristiques de chaque image.
Dans le cadre de l’apprentissage profond, l’information d’entrée (ici une image) est analysée couche après couche. Par exemple, la première couche d'un réseau de neurones artificiel peut vérifier la couleur des pixels de l’image. Chaque pixel est alors traité par un neurone différent. Dans la couche suivante, ce sont les contours et les formes qui sont éventuellement identifiés, puis des caractéristiques encore plus complexes dans la suivante.
Les informations ainsi collectées sont cartographiées de façon à constituer un algorithme flexible. Le résultat de l’analyse d’une couche est transmis à la couche suivante et, ce faisant, modifie l’algorithme. L’ordinateur est ainsi capable, au terme d’une multitude d'opérations, de déterminer si une image appartient à la catégorie « chien », « chat » ou « être humain ».
Au début du processus, le système reçoit des instructions humaines qui visent à corriger les éventuelles erreurs d'allocation. L'algorithme est modifié en conséquence. Ce n’est qu’après cette phase que le système acquiert la capacité d’améliorer de manière autonome sa reconnaissance d'image. En modifiant les connexions établies entre les neurones du réseau et en ajustant la pondération des variables à l'intérieur de l’algorithme, on arrive à faire en sorte que la variation des motifs d'entrée (par exemple des images de chats présentées de façons différentes) conduise de plus en plus aux mêmes modèles de sortie (détection du chat), sans erreur. Plus on nourrit le système d’images à « apprendre », plus il peut s’améliorer.
Pour un observateur extérieur, il n’est pas toujours possible de comprendre quels motifs ont été reconnus par l'ordinateur en apprentissage profond pour aboutir à sa prise de décision. C’est d’autant plus difficile que le système lui-même optimise en permanence ses propres règles de prise de décision.