Wat is Computer vision?

Stel je voor dat een computer ogen krijgt en leert kijken zoals jij dat doet! Dat is eigenlijk wat computer vision is: het helpt computers om beelden en video's te begrijpen en te interpreteren. Denk aan:

  • een zelfrijdende auto die een stopbord herkent, of bijvoorbeeld
  • je telefoon die jouw gezicht herkend en ontgrendelt.

Met computer vision leren machines zien Ên begrijpen wat ze zien, waardoor ze slimme dingen kunnen doen zoals katten van honden onderscheiden, je gebaren volgen, of zelfs pizza's detecteren op foto's (want wie houdt er nou niet van pizza?). 😄🍕

Hoe computers plaatjes zien

Voor een computer is een plaatje niets anders dan een reeks (matrix) getallen. Elke pixel heeft een getal voor de kleuren rood, groen en een voor blauw.

Wat computer vision zo lastig maakt

Wanneer ik aan ChatGPT vraag om een plaatje voor mij te genereren dan krijg ik standaard een plaatje van 1024 bij 1024 pixels. Het plaatje bestaat dus uit 1024 * 1024 * 3 kleuren = 3.145.728 getallen die simpelweg achter elkaar staan. Meestal kan elk getal minimaal een waarde van 0 en maximaal een waarde van 255 krijgen, hoe hoger het getal hoe feller de kleur. In Google zit een html color picker die dit mooi laat zien. Het is voor de computer heel eenvoudig om de afbeelding op je scherm te laten zien. Dat is een kwestie van een voor een de getallen uitlezen en een ledje op je scherm instellen op een corresponderende intensiteit. Betekenis geven aan wat er op het plaatje te zien is dat is extreem lastig, het is alsof je door een microscoop naar een flatgebouw kijkt.

Je maakt hier al gebruik van in CSS

Misschien herken je dit uit CSS code, daar gebruiken we hexadeximale notatie voor hetzelfde: Lees deze korte tekst als je wilt weten hoe dat werkt als je nieuwschierig bent

Theoretisch deel

  1. Wat is computer vision?
  2. Wat is OpenCV?
  3. Wat is Python en waarom Python?

Navigatie

« Les programma Wat is OpenCv »