1. gawk skripta "htmltxt"
a) od html stranice izbaci tagove i napravi tekst (ASCII) file
(od node123.html napravi node123.html.txt)
b) od node123.html.txt filea napravi clean dokument node123.html.txt.cl
(to su riječi poredane jedna ispod druge složene po abecedi i bez
ponavljanja)
c) zadnja naradbe (sada zakomentirna) dalje rječnik u datoteci "all"
(tu su sve rijeci složene po abecedi )
2. csh greptxt
od node123.html.txt.cl napravi file node123.html.txt.cl.g
svakoj riječi u *.cl fileu pridruži redni broj pod kojim se ta riječ
javlja u rječniku "all"
3. csh finaltxt
od node123.html.txt.cl.g napravi file node123.html.txt.cl.g.f
ostaju samo brojevi koji kasnije služe za kreiranje vektora
4. U direktoriju mat1txt se pozove Matlab program
matematika1.m
taj program pozove sve ostale programe
(txtf.m svdbipart.m svdnormrez.m svdrebipart.m)