Norwegian Nynorsk (nn) subword embeddings

Vocab size vocab model 25 dim 50 dim 100 dim 200 dim 300 dim
1000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
3000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
5000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
10000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
25000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
50000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
100000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
200000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix

Training corpus sample, encoded with different BPE vocabulary sizes

Vocab sizennwiki sample
original fil:magnus den godes saga - magnus og horda-knut - h. egedius.jpg|mini|000px|magnus den gode og harde-knut møtest ved göta elv (ågrip nemner brennøyan
*forsvarsmedaljen med tre stjerner *hærens vernedugleiksmedalje med tre stjerner *krigsdeltagerforbundets hederstegn *norges røde kors hederstegn
* 0000: motpave clemens vii * 0000: daniel gabriel fahrenheit, polsk-nederlandsk fysikar * 0000: ludvig xviii av frankrike * 0000: edward whymper, bri
1000 ▁fil : m ag n us ▁den ▁g ode s ▁s ag a ▁- ▁m ag n us ▁og ▁h ord a - k n ut ▁- ▁h . ▁e g ed i us . jpg | mini | 000 p x | m ag n us ▁den ▁g ode ▁og ▁har de - k n ut ▁m ø te st ▁ved ▁g ö ta ▁el v ▁( åg ri p ▁n em ner ▁br enn øy an
▁* for s var s med al j en ▁med ▁tre ▁st jer ner ▁* h ær ens ▁ver n ed ug lei ks med al je ▁med ▁tre ▁st jer ner ▁* k ri g s d elt ag er for b und et s ▁h ed er st eg n ▁* nor ge s ▁r ø de ▁kor s ▁h ed er st eg n
▁* ▁0000: ▁mot p av e ▁c lem ens ▁vi i ▁* ▁0000: ▁d an i el ▁g ab ri el ▁f a h r en h eit , ▁pol sk - n ed er land sk ▁f ys ikar ▁* ▁0000: ▁l ud v ig ▁ x v i i i ▁av ▁fr ank ri ke ▁* ▁0000: ▁ ed w ard ▁w h y m per , ▁b ri
3000 ▁fil : m ag n us ▁den ▁g ode s ▁sag a ▁- ▁mag n us ▁og ▁hord a - kn ut ▁- ▁h . ▁eg ed ius . jpg | mini | 000 p x | m ag n us ▁den ▁g ode ▁og ▁har de - kn ut ▁mø test ▁ved ▁g ö ta ▁elv ▁( åg ri p ▁nem ner ▁br enn øy an
▁* for svar s medaljen ▁med ▁tre ▁st jer ner ▁* h ær ens ▁ver n ed ug lei ks medalje ▁med ▁tre ▁st jer ner ▁* k rig s delt ag er for b undet s ▁h eder st eg n ▁* nor ges ▁r ø de ▁kor s ▁h eder st eg n
▁* ▁0000: ▁mot p ave ▁c lem ens ▁vi i ▁* ▁0000: ▁dan i el ▁g abri el ▁f ah ren h eit , ▁pol sk - n ed erland sk ▁fys ikar ▁* ▁0000: ▁l ud vig ▁x vi ii ▁av ▁frankrike ▁* ▁0000: ▁ed ward ▁wh ym per , ▁bri
5000 ▁fil : mag n us ▁den ▁gode s ▁sag a ▁- ▁magnus ▁og ▁hord a - kn ut ▁- ▁h . ▁eg ed ius . jpg | mini |000 px | mag n us ▁den ▁gode ▁og ▁har de - kn ut ▁mø test ▁ved ▁gö ta ▁elv ▁( åg ri p ▁nem ner ▁br enn øy an
▁* for svar s medaljen ▁med ▁tre ▁stjer ner ▁* h ær ens ▁ver ned ug lei ks medalje ▁med ▁tre ▁stjer ner ▁* k rig s delt ag er forb undet s ▁h eder st eg n ▁* nor ges ▁rø de ▁kor s ▁h eder st eg n
▁* ▁0000: ▁mot p ave ▁c lem ens ▁vi i ▁* ▁0000: ▁dan iel ▁g abri el ▁f ah ren heit , ▁pol sk - ned erland sk ▁fys ikar ▁* ▁0000: ▁ludvig ▁x vi ii ▁av ▁frankrike ▁* ▁0000: ▁edward ▁wh ym per , ▁bri
10000 ▁fil : mag n us ▁den ▁gode s ▁saga ▁- ▁magnus ▁og ▁hord a - kn ut ▁- ▁h . ▁eg ed ius . jpg | mini |000 px | mag n us ▁den ▁gode ▁og ▁harde - kn ut ▁mø test ▁ved ▁gö ta ▁elv ▁( åg ri p ▁nemner ▁brenn øy an
▁* forsvar s medaljen ▁med ▁tre ▁stjerner ▁* h ær ens ▁ver ned ug leiks medalje ▁med ▁tre ▁stjerner ▁* krig s delt ager forbundet s ▁h eder steg n ▁* nor ges ▁rø de ▁kor s ▁h eder steg n
▁* ▁0000: ▁mot p ave ▁c lem ens ▁vii ▁* ▁0000: ▁daniel ▁gabriel ▁f ah ren heit , ▁polsk - nederland sk ▁fysikar ▁* ▁0000: ▁ludvig ▁x vi ii ▁av ▁frankrike ▁* ▁0000: ▁edward ▁wh ym per , ▁bri
25000 ▁fil : mag nus ▁den ▁gode s ▁saga ▁- ▁magnus ▁og ▁hord a - knut ▁- ▁h . ▁eg ed ius . jpg | mini |000 px | mag nus ▁den ▁gode ▁og ▁harde - knut ▁møtest ▁ved ▁gö ta ▁elv ▁( åg rip ▁nemner ▁brenn øy an
▁* forsvar s medaljen ▁med ▁tre ▁stjerner ▁* h ær ens ▁ver ned ug leiks medalje ▁med ▁tre ▁stjerner ▁* krig s delt ager forbundet s ▁h eder steg n ▁* norges ▁rø de ▁kors ▁h eder steg n
▁* ▁0000: ▁mot p ave ▁clem ens ▁vii ▁* ▁0000: ▁daniel ▁gabriel ▁fah ren heit , ▁polsk - nederlandsk ▁fysikar ▁* ▁0000: ▁ludvig ▁xvi ii ▁av ▁frankrike ▁* ▁0000: ▁edward ▁wh ym per , ▁bri
50000 ▁fil : magnus ▁den ▁gode s ▁saga ▁- ▁magnus ▁og ▁hord a - knut ▁- ▁h . ▁egedius . jpg | mini |000 px | magnus ▁den ▁gode ▁og ▁harde - knut ▁møtest ▁ved ▁göta ▁elv ▁( åg rip ▁nemner ▁brenn øy an
▁* forsvar s medaljen ▁med ▁tre ▁stjerner ▁* hær ens ▁ver ned ug leiks medalje ▁med ▁tre ▁stjerner ▁* krigs delt ager forbundet s ▁h eder steg n ▁* norges ▁røde ▁kors ▁h eder steg n
▁* ▁0000: ▁mot pave ▁clemens ▁vii ▁* ▁0000: ▁daniel ▁gabriel ▁fah ren heit , ▁polsk - nederlandsk ▁fysikar ▁* ▁0000: ▁ludvig ▁xvi ii ▁av ▁frankrike ▁* ▁0000: ▁edward ▁whymper , ▁bri
100000 ▁fil : magnus ▁den ▁gode s ▁saga ▁- ▁magnus ▁og ▁hord a - knut ▁- ▁h . ▁egedius . jpg | mini |000 px | magnus ▁den ▁gode ▁og ▁harde - knut ▁møtest ▁ved ▁göta ▁elv ▁( åg rip ▁nemner ▁brenn øyan
▁* forsvars medaljen ▁med ▁tre ▁stjerner ▁* hær ens ▁ver ned ug leiks medalje ▁med ▁tre ▁stjerner ▁* krigs delt ager forbundet s ▁hederstegn ▁* norges ▁røde ▁kors ▁hederstegn
▁* ▁0000: ▁motpave ▁clemens ▁vii ▁* ▁0000: ▁daniel ▁gabriel ▁fahrenheit , ▁polsk - nederlandsk ▁fysikar ▁* ▁0000: ▁ludvig ▁xviii ▁av ▁frankrike ▁* ▁0000: ▁edward ▁whymper , ▁bri