Machines leren zien

Zien gaat voor mensen zo vanzelfsprekend dat we zelden stilstaan bij de complexiteit ervan. Je kijkt naar een foto en herkent onmiddellijk gezichten, objecten, scènes en relaties. Je begrijpt dat de kat op de stoel zit, dat de persoon op de achtergrond zwaait, en dat het licht erop wijst dat het laat in de middag is. Dit moeiteloze visuele begrip is een van de meest verfijnde vormen van informatieverwerking die je brein uitvoert.

Voor computers is zien een totaal andere uitdaging. Zij nemen enkel rasters van getallen waar—miljoenen pixelwaarden die helderheid en kleur representeren. Vanuit deze wiskundige representaties moeten ze leren objecten te herkennen, scènes te begrijpen en zelfs volledig nieuwe visuele inhoud te genereren.

Computer vision is geëvolueerd van eenvoudige patroonherkenning naar systemen die ziekten kunnen diagnosticeren in medische beelden, autonome voertuigen mogelijk maken en verbluffende kunstwerken creëren. Het meest opmerkelijke is dat dezelfde principes die AI in staat stellen beelden te herkennen, ook omgekeerd gebruikt kunnen worden om nieuwe beelden te genereren—wat leidt tot systemen die fotorealistische afbeeldingen kunnen maken, kunst uit tekstbeschrijvingen kunnen produceren en zelfs mensen kunnen bedenken die nooit hebben bestaan.

Hoofdstuk 6: Computer Vision

Machines leren zien

Subhoofdstukken