Swedish (sv) subword embeddings

Vocab size vocab model 25 dim 50 dim 100 dim 200 dim 300 dim
1000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
3000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
5000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
10000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
25000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
50000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
100000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
200000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix

Training corpus sample, encoded with different BPE vocabulary sizes

Vocab sizesvwiki sample
original kategori:solna kommun kategori:byggnadsminnen i stockholms län kategori:byggnadsminnesförklarade trädgårdar kategori:slottsparker i sverige kategori:p
north bank supporters. hv00 har under historien haft tre olika supporterklubbar. den första supporterklubben hette klapp & klang. klapp & klang bildad
i april 0000 lanserade migrationsverket i samarbete med egmont kärnan en bamsetidning med syfte att utgöra informationsmaterial för barn om asylproces
1000 ▁kategori : s ol na ▁kommun ▁kategori : b ygg na d sm in n en ▁i ▁stockholm s ▁l än ▁kategori : b ygg na d sm in nes för k lar ade ▁t rä d g år d ar ▁kategori : sl ott sp ark er ▁i ▁sverige ▁kategori : p
▁n ort h ▁b an k ▁s upp or ter s . ▁h v 00 ▁har ▁under ▁h ist ori en ▁ha ft ▁t re ▁o li ka ▁s upp or ter k l ub bar . ▁den ▁första ▁s upp or ter k l ub b en ▁h ett e ▁k la pp ▁ & ▁kl ang . ▁k la pp ▁ & ▁kl ang ▁b ild ad
▁i ▁april ▁0000 ▁l ans erade ▁m ig rat ion s ver ket ▁i ▁sam ar bet e ▁med ▁eg m on t ▁k är nan ▁en ▁b am s et id ning ▁med ▁s y f te ▁att ▁ut g ö ra ▁in for mat ion s mat er i al ▁för ▁bar n ▁om ▁a s yl pro c es
3000 ▁kategori : s ol na ▁kommun ▁kategori : bygg nad sm in nen ▁i ▁stockholms ▁län ▁kategori : bygg nad sm in nes för klar ade ▁träd gård ar ▁kategori : sl ott sp ark er ▁i ▁sverige ▁kategori : p
▁n orth ▁ban k ▁s upp orter s . ▁h v 00 ▁har ▁under ▁histori en ▁ha ft ▁tre ▁olika ▁s upp orter kl ub bar . ▁den ▁första ▁s upp orter kl ubb en ▁hett e ▁k la pp ▁& ▁kl ang . ▁k la pp ▁& ▁kl ang ▁bild ad
▁i ▁april ▁0000 ▁l ans erade ▁m ig rat ions ver ket ▁i ▁sam arbet e ▁med ▁eg m ont ▁kär nan ▁en ▁b am s et id ning ▁med ▁sy f te ▁att ▁utg öra ▁in format ions mat er ial ▁för ▁barn ▁om ▁as yl pro c es
5000 ▁kategori : sol na ▁kommun ▁kategori : byggnad smin nen ▁i ▁stockholms ▁län ▁kategori : byggnad smin nes för klar ade ▁träd gård ar ▁kategori : sl ott sp ark er ▁i ▁sverige ▁kategori : p
▁north ▁bank ▁s upp orter s . ▁h v 00 ▁har ▁under ▁histori en ▁haft ▁tre ▁olika ▁s upp orter kl ubbar . ▁den ▁första ▁s upp orter klubb en ▁hett e ▁k la pp ▁& ▁kl ang . ▁k la pp ▁& ▁kl ang ▁bild ad
▁i ▁april ▁0000 ▁lans erade ▁mig rat ions verket ▁i ▁samarbete ▁med ▁eg m ont ▁kär nan ▁en ▁b am s et id ning ▁med ▁sy fte ▁att ▁utg öra ▁informat ions mat er ial ▁för ▁barn ▁om ▁as yl pro ces
10000 ▁kategori : sol na ▁kommun ▁kategori : byggnad smin nen ▁i ▁stockholms ▁län ▁kategori : byggnad smin nes för klar ade ▁trädgård ar ▁kategori : sl ott sp ark er ▁i ▁sverige ▁kategori : p
▁north ▁bank ▁supp orter s . ▁h v 00 ▁har ▁under ▁historien ▁haft ▁tre ▁olika ▁supp orter klubbar . ▁den ▁första ▁supp orter klubben ▁hette ▁k la pp ▁& ▁kl ang . ▁k la pp ▁& ▁kl ang ▁bild ad
▁i ▁april ▁0000 ▁lans erade ▁mig rat ions verket ▁i ▁samarbete ▁med ▁eg mont ▁kär nan ▁en ▁b am set id ning ▁med ▁syfte ▁att ▁utg öra ▁informat ions material ▁för ▁barn ▁om ▁as yl pro ces
25000 ▁kategori : sol na ▁kommun ▁kategori : byggnad smin nen ▁i ▁stockholms ▁län ▁kategori : byggnad smin nes förklar ade ▁trädgårdar ▁kategori : slott spark er ▁i ▁sverige ▁kategori : p
▁north ▁bank ▁supp orter s . ▁hv 00 ▁har ▁under ▁historien ▁haft ▁tre ▁olika ▁supp orter klubbar . ▁den ▁första ▁supp orter klubben ▁hette ▁kla pp ▁& ▁kl ang . ▁kla pp ▁& ▁kl ang ▁bildad
▁i ▁april ▁0000 ▁lanserade ▁mig rations verket ▁i ▁samarbete ▁med ▁eg mont ▁kärnan ▁en ▁bam set idning ▁med ▁syfte ▁att ▁utgöra ▁informations material ▁för ▁barn ▁om ▁asyl proces
50000 ▁kategori : sol na ▁kommun ▁kategori : byggnadsminnen ▁i ▁stockholms ▁län ▁kategori : byggnad smin nes förklar ade ▁trädgårdar ▁kategori : slott spark er ▁i ▁sverige ▁kategori : p
▁north ▁bank ▁supporter s . ▁hv 00 ▁har ▁under ▁historien ▁haft ▁tre ▁olika ▁supporter klubbar . ▁den ▁första ▁supporter klubben ▁hette ▁kla pp ▁& ▁klang . ▁kla pp ▁& ▁klang ▁bildad
▁i ▁april ▁0000 ▁lanserade ▁migrations verket ▁i ▁samarbete ▁med ▁egmont ▁kärnan ▁en ▁bam set idning ▁med ▁syfte ▁att ▁utgöra ▁informations material ▁för ▁barn ▁om ▁asyl proces
100000 ▁kategori : solna ▁kommun ▁kategori : byggnadsminnen ▁i ▁stockholms ▁län ▁kategori : byggnad smin nes förklarade ▁trädgårdar ▁kategori : slott spark er ▁i ▁sverige ▁kategori : p
▁north ▁bank ▁supporter s . ▁hv 00 ▁har ▁under ▁historien ▁haft ▁tre ▁olika ▁supporter klubbar . ▁den ▁första ▁supporter klubben ▁hette ▁klapp ▁& ▁klang . ▁klapp ▁& ▁klang ▁bildad
▁i ▁april ▁0000 ▁lanserade ▁migrations verket ▁i ▁samarbete ▁med ▁egmont ▁kärnan ▁en ▁bam set idning ▁med ▁syfte ▁att ▁utgöra ▁informations material ▁för ▁barn ▁om ▁asyl proces