História strojového učenia je úzko spojená s históriou umelej inteligencie, históriou rôznych štatistických metód, ale aj samotných počítačov.
V roku 1949 vytvoril kanadský psychológ Donald Hebb tzv. Hebbovu teóriu, ktorá v podstate popisuje učenie sa ako proces, pri ktorom sa vytvárajú nové synapsie medzi neurónmi v mozgu. Tie môžu v závislosti na opakovaní získaných poznatkov silnieť alebo slabnúť. Táto teória pomohla vývoju metódy neurónových sietí, ktorá funguje rovnako, ako ľudský mozog.
V roku 1952 vytvoril Arthur Samuel prvý učiaci sa program, ktorý hral dámu a zlepšoval sa na základe učenia sa ťahov a víťazných stratégií.
Prvá umelá neurónová sieť zvaná perceptron (obr. 1) bola vytvorená Frankom Rossenblattom v roku 1957 a obsahovala len jeden umelý neurón, avšak mala len obmedzené využitie, ktoré rozširoval až neskorší viacvrstvový perceptron.
Prvý algoritmus, ktorý umožňoval programom základné rozoznávanie vzorov bol algoritmus nearest neighbour vytvorený v roku 1967.
V roku 2006 vzniká pojem deep learning označujúci podoblasť strojového učenia zahŕňajúca pokročilé algoritmy, ktoré sa snažia priblížiť úplne autonómnej umelej inteligencii.