Zeeuws (zea) subword embeddings

Vocab size vocab model 25 dim 50 dim 100 dim 200 dim 300 dim
1000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
3000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
5000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
10000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
25000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix

Training corpus sample, encoded with different BPE vocabulary sizes

Vocab sizezeawiki sample
original de ereddene en de redders wiere in vlissienge ontaeld as'elden. de bemannienge van de doris wier onderebracht in een 'otel en een inzaemeliengsactie o
categorie:bedrief categorie:economie van zeêland categorie:geschiedenisse van zeêland categorie:middelburg categorie:vlissienge
't nieuwedurp is 't op eên nae joengste durp van de gemeênte bossele. d'r weunden in 0000 ruum 0000 mênsen. 't nieuwedurp is eên van de wienige durpen
1000 ▁de ▁ ere d den e ▁en ▁de ▁re d ders ▁wiere ▁in ▁vliss ienge ▁ont a eld ▁as ' el den . ▁de ▁be man n ienge ▁van ▁de ▁d or is ▁wier ▁onder eb racht ▁in ▁een ▁' ot el ▁en ▁een ▁in z aem el iengs a ct ie ▁o
▁categorie : be d rie f ▁categorie : e c on om ie ▁van ▁zeêland ▁categorie : ge sch ieden isse ▁van ▁zeêland ▁categorie : m id del burg ▁categorie : vl iss ienge
▁' t ▁nieuwe durp ▁is ▁' t ▁op ▁eên ▁nae ▁j oen g ste ▁durp ▁van ▁de ▁gemeênte ▁bos s ele . ▁d ' r ▁we un den ▁in ▁0000 ▁r uu m ▁0000 ▁m ên sen . ▁' t ▁nieuwe durp ▁is ▁eên ▁van ▁de ▁w ien ige ▁durp en
3000 ▁de ▁ ere d den e ▁en ▁de ▁re d ders ▁wiere ▁in ▁vlissienge ▁ont a eld ▁as ' el den . ▁de ▁be mann ienge ▁van ▁de ▁d oris ▁wier ▁onder eb racht ▁in ▁een ▁' ot el ▁en ▁een ▁in z aem el iengs a ctie ▁o
▁categorie : bed rief ▁categorie : e conom ie ▁van ▁zeêland ▁categorie : gesch iedenisse ▁van ▁zeêland ▁categorie : middel burg ▁categorie : vl iss ienge
▁' t ▁nieuwe durp ▁is ▁' t ▁op ▁eên ▁nae ▁j oeng ste ▁durp ▁van ▁de ▁gemeênte ▁bossele . ▁d ' r ▁weun den ▁in ▁0000 ▁ruum ▁0000 ▁mênsen . ▁' t ▁nieuwe durp ▁is ▁eên ▁van ▁de ▁w ien ige ▁durpen
5000 ▁de ▁ere d den e ▁en ▁de ▁red ders ▁wiere ▁in ▁vlissienge ▁ont a eld ▁as ' elden . ▁de ▁bemann ienge ▁van ▁de ▁d oris ▁wier ▁onder eb racht ▁in ▁een ▁' otel ▁en ▁een ▁in zaem el iengs a ctie ▁o
▁categorie : bedrief ▁categorie : e conom ie ▁van ▁zeêland ▁categorie : geschiedenisse ▁van ▁zeêland ▁categorie : middelburg ▁categorie : vl iss ienge
▁' t ▁nieuwe durp ▁is ▁' t ▁op ▁eên ▁nae ▁j oeng ste ▁durp ▁van ▁de ▁gemeênte ▁bossele . ▁d ' r ▁weun den ▁in ▁0000 ▁ruum ▁0000 ▁mênsen . ▁' t ▁nieuwe durp ▁is ▁eên ▁van ▁de ▁w ien ige ▁durpen
10000 ▁de ▁ere d den e ▁en ▁de ▁red ders ▁wiere ▁in ▁vlissienge ▁ont aeld ▁as ' elden . ▁de ▁bemann ienge ▁van ▁de ▁doris ▁wier ▁onder eb racht ▁in ▁een ▁' otel ▁en ▁een ▁in zaem el iengs a ctie ▁o
▁categorie : bedrief ▁categorie : economie ▁van ▁zeêland ▁categorie : geschiedenisse ▁van ▁zeêland ▁categorie : middelburg ▁categorie : vlissienge
▁' t ▁nieuwedurp ▁is ▁' t ▁op ▁eên ▁nae ▁joeng ste ▁durp ▁van ▁de ▁gemeênte ▁bossele . ▁d ' r ▁weunden ▁in ▁0000 ▁ruum ▁0000 ▁mênsen . ▁' t ▁nieuwedurp ▁is ▁eên ▁van ▁de ▁wien ige ▁durpen
25000 ▁de ▁ered dene ▁en ▁de ▁red ders ▁wiere ▁in ▁vlissienge ▁ont aeld ▁as ' elden . ▁de ▁bemannienge ▁van ▁de ▁doris ▁wier ▁onder eb racht ▁in ▁een ▁' otel ▁en ▁een ▁in zaem el iengs actie ▁o
▁categorie : bedrief ▁categorie : economie ▁van ▁zeêland ▁categorie : geschiedenisse ▁van ▁zeêland ▁categorie : middelburg ▁categorie : vlissienge
▁' t ▁nieuwedurp ▁is ▁' t ▁op ▁eên ▁nae ▁joeng ste ▁durp ▁van ▁de ▁gemeênte ▁bossele . ▁d ' r ▁weunden ▁in ▁0000 ▁ruum ▁0000 ▁mênsen . ▁' t ▁nieuwedurp ▁is ▁eên ▁van ▁de ▁wien ige ▁durpen