Polish (pl) subword embeddings

Vocab size vocab model 25 dim 50 dim 100 dim 200 dim 300 dim
1000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
3000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
5000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
10000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
25000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
50000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
100000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
200000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix

Training corpus sample, encoded with different BPE vocabulary sizes

Vocab sizeplwiki sample
original plik:rostra.jpg|thumb|pozostałości rostra, mównicy na forum romanum w rzymie, z której wielokrotnie swoje mowy wygłaszał cyceron. 0 września na posied
* chemia fizyczna * chemiczna analiza jakościowa związków nieorganicznych * kinetyka reakcji chemicznych * mineralogia * reakcje utleniania-redukcji *
urodził się i mieszka do dzisiaj w łodzi. od 0 lipca 0000 roku jest honorowym obywatelem tego miasta. jest absolwentem xxi liceum ogólnokształcącego i
1000 ▁plik : ro stra . jpg | th um b | po z osta ło ści ▁ro stra , ▁m ów nicy ▁na ▁for um ▁ro man um ▁w ▁ rzy mie , ▁z ▁które j ▁wie lo k ro tnie ▁swo je ▁m owy ▁wy g ła sza ł ▁cy ce ron . ▁0 ▁wrześ nia ▁na ▁po sie d
▁* ▁ch em ia ▁fi zy cz na ▁* ▁ch e mi cz na ▁a na li za ▁jako ści owa ▁związ ków ▁nie or gani cznych ▁* ▁k i ne ty ka ▁re a k cji ▁ch e mi cznych ▁* ▁mi ne ra lo g ia ▁* ▁re a k cje ▁ut le nia nia - re du k cji ▁*
▁u ro dził ▁się ▁i ▁miesz ka ▁do ▁dz is ia j ▁w ▁ ło dzi . ▁od ▁0 ▁lip ca ▁0000 ▁roku ▁jest ▁h on or owym ▁ob y wa te lem ▁tego ▁miasta . ▁jest ▁a b so l w en tem ▁x x i ▁li ce um ▁o g ól no ksz ta ł cą ce go ▁i
3000 ▁plik : ro stra . jpg | thumb | po z osta łości ▁ro stra , ▁m ów nicy ▁na ▁for um ▁ro man um ▁w ▁ rzy mie , ▁z ▁której ▁wielo krotnie ▁swoje ▁m owy ▁wy g ła sza ł ▁cy ce ron . ▁0 ▁września ▁na ▁po sie d
▁* ▁ch em ia ▁fizy czna ▁* ▁che mi czna ▁ana liza ▁jako ści owa ▁związ ków ▁nie organi cznych ▁* ▁ki ne tyka ▁rea kcji ▁che mi cznych ▁* ▁mi nera log ia ▁* ▁rea k cje ▁ut lenia nia - re du kcji ▁*
▁uro dził ▁się ▁i ▁mieszka ▁do ▁dz is ia j ▁w ▁ło dzi . ▁od ▁0 ▁lipca ▁0000 ▁roku ▁jest ▁hon or owym ▁oby wa te lem ▁tego ▁miasta . ▁jest ▁ab solwen tem ▁xx i ▁li ce um ▁ogól no kształ cą cego ▁i
5000 ▁plik : ro stra . jpg | thumb | po z osta łości ▁ro stra , ▁mów nicy ▁na ▁for um ▁roman um ▁w ▁ rzymie , ▁z ▁której ▁wielo krotnie ▁swoje ▁m owy ▁wy gła sza ł ▁cy ce ron . ▁0 ▁września ▁na ▁po sie d
▁* ▁ch em ia ▁fizy czna ▁* ▁chemi czna ▁ana liza ▁jako ści owa ▁związ ków ▁nie organi cznych ▁* ▁ki ne tyka ▁rea kcji ▁chemi cznych ▁* ▁mi nera logia ▁* ▁rea k cje ▁ut lenia nia - re du kcji ▁*
▁urodził ▁się ▁i ▁mieszka ▁do ▁dzis ia j ▁w ▁łodzi . ▁od ▁0 ▁lipca ▁0000 ▁roku ▁jest ▁honor owym ▁obywa te lem ▁tego ▁miasta . ▁jest ▁ab solwen tem ▁xx i ▁li ce um ▁ogólno kształ cą cego ▁i
10000 ▁plik : ro stra . jpg | thumb | po z osta łości ▁ro stra , ▁mów nicy ▁na ▁for um ▁roman um ▁w ▁rzymie , ▁z ▁której ▁wielokrotnie ▁swoje ▁m owy ▁wy gła sza ł ▁cy ce ron . ▁0 ▁września ▁na ▁po sie d
▁* ▁ch em ia ▁fizy czna ▁* ▁chemi czna ▁ana liza ▁jakości owa ▁związków ▁nie organi cznych ▁* ▁ki ne tyka ▁reakcji ▁chemi cznych ▁* ▁mi nera logia ▁* ▁rea k cje ▁ut lenia nia - re du kcji ▁*
▁urodził ▁się ▁i ▁mieszka ▁do ▁dzisiaj ▁w ▁łodzi . ▁od ▁0 ▁lipca ▁0000 ▁roku ▁jest ▁honor owym ▁obywa te lem ▁tego ▁miasta . ▁jest ▁absolwen tem ▁xx i ▁liceum ▁ogólnokształcą cego ▁i
25000 ▁plik : ro stra . jpg | thumb | po zosta łości ▁ro stra , ▁mów nicy ▁na ▁forum ▁roman um ▁w ▁rzymie , ▁z ▁której ▁wielokrotnie ▁swoje ▁mowy ▁wygła szał ▁cy ce ron . ▁0 ▁września ▁na ▁posie d
▁* ▁chem ia ▁fizy czna ▁* ▁chemi czna ▁analiza ▁jakości owa ▁związków ▁nie organi cznych ▁* ▁kine tyka ▁reakcji ▁chemicznych ▁* ▁minera logia ▁* ▁reakcje ▁ut lenia nia - re du kcji ▁*
▁urodził ▁się ▁i ▁mieszka ▁do ▁dzisiaj ▁w ▁łodzi . ▁od ▁0 ▁lipca ▁0000 ▁roku ▁jest ▁honorowym ▁obywate lem ▁tego ▁miasta . ▁jest ▁absolwentem ▁xxi ▁liceum ▁ogólnokształcą cego ▁i
50000 ▁plik : ro stra . jpg | thumb | pozosta łości ▁ro stra , ▁mów nicy ▁na ▁forum ▁roman um ▁w ▁rzymie , ▁z ▁której ▁wielokrotnie ▁swoje ▁mowy ▁wygła szał ▁cyce ron . ▁0 ▁września ▁na ▁posie d
▁* ▁chemia ▁fizyczna ▁* ▁chemiczna ▁analiza ▁jakości owa ▁związków ▁nieorgani cznych ▁* ▁kine tyka ▁reakcji ▁chemicznych ▁* ▁minera logia ▁* ▁reakcje ▁utlenia nia - re du kcji ▁*
▁urodził ▁się ▁i ▁mieszka ▁do ▁dzisiaj ▁w ▁łodzi . ▁od ▁0 ▁lipca ▁0000 ▁roku ▁jest ▁honorowym ▁obywatelem ▁tego ▁miasta . ▁jest ▁absolwentem ▁xxi ▁liceum ▁ogólnokształcą cego ▁i
100000 ▁plik : ro stra . jpg | thumb | pozostałości ▁ro stra , ▁mów nicy ▁na ▁forum ▁romanum ▁w ▁rzymie , ▁z ▁której ▁wielokrotnie ▁swoje ▁mowy ▁wygłaszał ▁cyceron . ▁0 ▁września ▁na ▁posie d
▁* ▁chemia ▁fizyczna ▁* ▁chemiczna ▁analiza ▁jakości owa ▁związków ▁nieorganicznych ▁* ▁kine tyka ▁reakcji ▁chemicznych ▁* ▁minera logia ▁* ▁reakcje ▁utleniania - redu kcji ▁*
▁urodził ▁się ▁i ▁mieszka ▁do ▁dzisiaj ▁w ▁łodzi . ▁od ▁0 ▁lipca ▁0000 ▁roku ▁jest ▁honorowym ▁obywatelem ▁tego ▁miasta . ▁jest ▁absolwentem ▁xxi ▁liceum ▁ogólnokształcą cego ▁i