1. gawk skripta "htmltxt" a) od html stranice izbaci tagove i napravi tekst (ASCII) file (od node123.html napravi node123.html.txt) b) od node123.html.txt filea napravi clean dokument node123.html.txt.cl (to su riječi poredane jedna ispod druge složene po abecedi i bez ponavljanja) c) zadnja naradbe (sada zakomentirna) dalje rječnik u datoteci "all" (tu su sve rijeci složene po abecedi ) 2. csh greptxt od node123.html.txt.cl napravi file node123.html.txt.cl.g svakoj riječi u *.cl fileu pridruži redni broj pod kojim se ta riječ javlja u rječniku "all" 3. csh finaltxt od node123.html.txt.cl.g napravi file node123.html.txt.cl.g.f ostaju samo brojevi koji kasnije služe za kreiranje vektora 4. U direktoriju mat1txt se pozove Matlab program matematika1.m taj program pozove sve ostale programe (txtf.m svdbipart.m svdnormrez.m svdrebipart.m)