Icelandic (is) subword embeddings

Vocab size vocab model 25 dim 50 dim 100 dim 200 dim 300 dim
1000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
3000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
5000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
10000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
25000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
50000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
100000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
200000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix

Training corpus sample, encoded with different BPE vocabulary sizes

Vocab sizeiswiki sample
original mynd:egil skallagrimsson 00c manuscript.jpg|thumb|000px|egill skallagrímsson egils saga, eða egla er ein elsta íslendingasagan. aðalpersóna hennar er
langanesskagi grænmerktur langanes er stór skagi fyrir austan þistilfjörð og norðan við bakkaflóa. skaginn teygist næstum 00 km út í hafið til norðaus
á drangsnesi er löndunarbryggja, en 0,0 km innan við þorpið, í kokkálsvík, er viðleguhöfn. yst í þorpinu, þar sem heita grundir, er sérkennilegur stei
1000 ▁mynd : eg il ▁sk al lag ri m sson ▁00 c ▁m an us c ri pt . jpg | th umb | 000 p x | eg ill ▁sk al lag rí m sson ▁e g il s ▁sag a , ▁eða ▁e g la ▁er ▁ein ▁el sta ▁ísl end ing as ag an . ▁aðal p ers ó na ▁hennar ▁er
▁lang an es sk ag i ▁g ræ n mer k tur ▁lang an es ▁er ▁stór ▁sk ag i ▁fyrir ▁aust an ▁þ ist il f jör ð ▁og ▁nor ðan ▁við ▁b a kk af l ó a . ▁sk ag inn ▁t ey g ist ▁næ st um ▁00 ▁k m ▁út ▁í ▁haf ið ▁til ▁nor ða us
▁á ▁dr ang s n es i ▁er ▁l önd unar br ygg ja , ▁en ▁0 , 0 ▁k m ▁inn an ▁við ▁þor p ið , ▁í ▁k okk ál sv ík , ▁er ▁við leg u h öf n . ▁y st ▁í ▁þor p inu , ▁þar ▁sem ▁h ei ta ▁gr und ir , ▁er ▁sér k enn ileg ur ▁st ei
3000 ▁mynd : eg il ▁sk al lag ri m sson ▁00 c ▁man us c ri pt . jpg | thumb | 000 px | eg ill ▁sk al lag rím sson ▁eg ils ▁saga , ▁eða ▁eg la ▁er ▁ein ▁el sta ▁íslend ing as ag an . ▁aðal p ers óna ▁hennar ▁er
▁lang an es sk ag i ▁græn mer k tur ▁lang an es ▁er ▁stór ▁skag i ▁fyrir ▁austan ▁þ ist il f jörð ▁og ▁norðan ▁við ▁ba kk afl ó a . ▁skag inn ▁t ey g ist ▁næst um ▁00 ▁km ▁út ▁í ▁haf ið ▁til ▁nor ða us
▁á ▁dr ang s nes i ▁er ▁l önd unar br ygg ja , ▁en ▁0,0 ▁km ▁innan ▁við ▁þor p ið , ▁í ▁k okk ál sv ík , ▁er ▁við legu höfn . ▁y st ▁í ▁þor p inu , ▁þar ▁sem ▁h eita ▁grund ir , ▁er ▁sér k enn ileg ur ▁st ei
5000 ▁mynd : eg il ▁skal lag ri m sson ▁00 c ▁man us c ri pt . jpg | thumb |000 px | eg ill ▁skal lag rím sson ▁eg ils ▁saga , ▁eða ▁eg la ▁er ▁ein ▁elsta ▁íslend ing as ag an . ▁aðal pers óna ▁hennar ▁er
▁lang anes sk agi ▁græn merk tur ▁lang anes ▁er ▁stór ▁skag i ▁fyrir ▁austan ▁þ ist il f jörð ▁og ▁norðan ▁við ▁ba kk afl óa . ▁skag inn ▁t eyg ist ▁næst um ▁00 ▁km ▁út ▁í ▁haf ið ▁til ▁norða us
▁á ▁dr ang s nesi ▁er ▁lönd unar br ygg ja , ▁en ▁0,0 ▁km ▁innan ▁við ▁þorp ið , ▁í ▁k okk ál svík , ▁er ▁við legu höfn . ▁y st ▁í ▁þorp inu , ▁þar ▁sem ▁h eita ▁grund ir , ▁er ▁sér kenn ileg ur ▁st ei
10000 ▁mynd : eg il ▁skal lag ri m sson ▁00 c ▁man us c ri pt . jpg | thumb |000 px | eg ill ▁skal lag rímsson ▁egils ▁saga , ▁eða ▁eg la ▁er ▁ein ▁elsta ▁íslendingas agan . ▁aðal pers óna ▁hennar ▁er
▁lang anes sk agi ▁græn merk tur ▁lang anes ▁er ▁stór ▁skag i ▁fyrir ▁austan ▁þ ist il fjörð ▁og ▁norðan ▁við ▁bakk aflóa . ▁skag inn ▁t eyg ist ▁næstum ▁00 ▁km ▁út ▁í ▁hafið ▁til ▁norða us
▁á ▁dr ang s nesi ▁er ▁lönd unar br yggja , ▁en ▁0,0 ▁km ▁innan ▁við ▁þorpið , ▁í ▁k okk ál svík , ▁er ▁við legu höfn . ▁y st ▁í ▁þorp inu , ▁þar ▁sem ▁heita ▁grund ir , ▁er ▁sér kenn ilegur ▁st ei
25000 ▁mynd : eg il ▁skallag ri m sson ▁00 c ▁manus cript . jpg | thumb |000 px | eg ill ▁skallag rímsson ▁egils ▁saga , ▁eða ▁eg la ▁er ▁ein ▁elsta ▁íslendingas agan . ▁aðal persóna ▁hennar ▁er
▁lang anes skagi ▁græn merk tur ▁lang anes ▁er ▁stór ▁skag i ▁fyrir ▁austan ▁þ istil fjörð ▁og ▁norðan ▁við ▁bakk aflóa . ▁skag inn ▁teyg ist ▁næstum ▁00 ▁km ▁út ▁í ▁hafið ▁til ▁norða us
▁á ▁dr angs nesi ▁er ▁lönd unar br yggja , ▁en ▁0,0 ▁km ▁innan ▁við ▁þorpið , ▁í ▁k okk ál svík , ▁er ▁við legu höfn . ▁yst ▁í ▁þorpinu , ▁þar ▁sem ▁heita ▁grund ir , ▁er ▁sérkenn ilegur ▁st ei
50000 ▁mynd : eg il ▁skallag rim sson ▁00 c ▁manuscript . jpg | thumb |000 px | egill ▁skallagrímsson ▁egils ▁saga , ▁eða ▁eg la ▁er ▁ein ▁elsta ▁íslendingas agan . ▁aðalpersóna ▁hennar ▁er
▁langanes skagi ▁græn merk tur ▁langanes ▁er ▁stór ▁skagi ▁fyrir ▁austan ▁þistil fjörð ▁og ▁norðan ▁við ▁bakk aflóa . ▁skaginn ▁teyg ist ▁næstum ▁00 ▁km ▁út ▁í ▁hafið ▁til ▁norða us
▁á ▁drangs nesi ▁er ▁lönd unar bryggja , ▁en ▁0,0 ▁km ▁innan ▁við ▁þorpið , ▁í ▁kokk ál svík , ▁er ▁við legu höfn . ▁yst ▁í ▁þorpinu , ▁þar ▁sem ▁heita ▁grund ir , ▁er ▁sérkenn ilegur ▁st ei
100000 ▁mynd : egil ▁skallag rim sson ▁00 c ▁manuscript . jpg | thumb |000 px | egill ▁skallagrímsson ▁egils ▁saga , ▁eða ▁eg la ▁er ▁ein ▁elsta ▁íslendingas agan . ▁aðalpersóna ▁hennar ▁er
▁langanes skagi ▁græn merk tur ▁langanes ▁er ▁stór ▁skagi ▁fyrir ▁austan ▁þistilfjörð ▁og ▁norðan ▁við ▁bakkaflóa . ▁skaginn ▁teygist ▁næstum ▁00 ▁km ▁út ▁í ▁hafið ▁til ▁norða us
▁á ▁drangsnesi ▁er ▁lönd unar bryggja , ▁en ▁0,0 ▁km ▁innan ▁við ▁þorpið , ▁í ▁kokk ál svík , ▁er ▁við legu höfn . ▁yst ▁í ▁þorpinu , ▁þar ▁sem ▁heita ▁grund ir , ▁er ▁sérkennilegur ▁st ei