Latvian (lv) subword embeddings

Vocab size vocab model 25 dim 50 dim 100 dim 200 dim 300 dim
1000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
3000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
5000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
10000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
25000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
50000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
100000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
200000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix

Training corpus sample, encoded with different BPE vocabulary sizes

Vocab sizelvwiki sample
original parasti tīkla karte atbalsta vienu no lokālo tīklu arhitektūrām, piemēram, ethernet, localtalk, token ring vai arcnet. pašlaik populārākā tīkla arhite
no citu virzienu vējiem somu līča krastos no maija līdz jūlijam bieži ir ziemeļrietumu vēji (00-00%), bet no septembra līdz aprīlim — dienvidaustrumu
attēls:sudan meroe pyramids 0000.jpg|thumb|right|000px|kušas valdnieku piramīdas meroē sudānas teritorija bijusi apdzīvota jau akmens laikmetā.
1000 ▁par asti ▁t īk la ▁kar te ▁at bal st a ▁vien u ▁no ▁l ok āl o ▁t īk lu ▁ar h it ekt ūr ām , ▁piem ēram , ▁ et h er n et , ▁l oc al t al k , ▁t ok en ▁r ing ▁vai ▁ar c n et . ▁paš lai k ▁p op ul ār āk ā ▁t īk la ▁ar h it e
▁no ▁c itu ▁vir z ien u ▁v ēj iem ▁s om u ▁lī č a ▁kr ast os ▁no ▁ma ija ▁līdz ▁jū l ij am ▁b iež i ▁ir ▁ziemeļ r iet umu ▁v ēji ▁( 00 - 00 % ), ▁bet ▁no ▁sep t embr a ▁līdz ▁apr īl im ▁— ▁dienvid au str umu
▁attēls : s ud an ▁m er o e ▁p y r am id s ▁0000. jpg | th umb | r ig h t | 000 p x | k uš as ▁vald nieku ▁p ir am īd as ▁m er o ē ▁su d ān as ▁terit orija ▁b ij usi ▁ap dzīv ota ▁jau ▁ak m ens ▁laik me tā .
3000 ▁parasti ▁t īk la ▁kar te ▁atbal sta ▁vienu ▁no ▁lok ālo ▁t īk lu ▁arhit ekt ūr ām , ▁piemēram , ▁et h ern et , ▁loc al t al k , ▁t ok en ▁r ing ▁vai ▁ar c n et . ▁pašlaik ▁populār ākā ▁t īk la ▁arhit e
▁no ▁citu ▁virz ienu ▁v ējiem ▁som u ▁lī ča ▁krast os ▁no ▁ma ija ▁līdz ▁jūl ij am ▁bieži ▁ir ▁ziemeļ riet umu ▁v ēji ▁(00 -00 % ), ▁bet ▁no ▁sept embra ▁līdz ▁aprīl im ▁— ▁dienvidaustr umu
▁attēls : s ud an ▁m er o e ▁p y r am id s ▁0000. jpg | thumb | r ight |000 px | k ušas ▁vald nieku ▁p ir am īd as ▁m er o ē ▁su d ānas ▁teritorija ▁bijusi ▁apdzīv ota ▁jau ▁ak mens ▁laik me tā .
5000 ▁parasti ▁tīk la ▁kar te ▁atbal sta ▁vienu ▁no ▁lok ālo ▁tīk lu ▁arhitekt ūr ām , ▁piemēram , ▁et h ern et , ▁loc al t alk , ▁t ok en ▁r ing ▁vai ▁ar c n et . ▁pašlaik ▁populār ākā ▁tīk la ▁arhit e
▁no ▁citu ▁virz ienu ▁v ējiem ▁som u ▁lī ča ▁krastos ▁no ▁ma ija ▁līdz ▁jūl ijam ▁bieži ▁ir ▁ziemeļriet umu ▁v ēji ▁(00 -00 % ), ▁bet ▁no ▁sept embra ▁līdz ▁aprīl im ▁— ▁dienvidaustr umu
▁attēls : s ud an ▁mer o e ▁p y r am ids ▁0000. jpg | thumb | right |000 px | k ušas ▁vald nieku ▁pir am īdas ▁mer o ē ▁su d ānas ▁teritorija ▁bijusi ▁apdzīvota ▁jau ▁akmens ▁laikme tā .
10000 ▁parasti ▁tīkla ▁karte ▁atbalsta ▁vienu ▁no ▁lok ālo ▁tīklu ▁arhitekt ūr ām , ▁piemēram , ▁et h ern et , ▁loc alt alk , ▁tok en ▁r ing ▁vai ▁ar c net . ▁pašlaik ▁populār ākā ▁tīkla ▁arhit e
▁no ▁citu ▁virz ienu ▁v ējiem ▁somu ▁līča ▁krastos ▁no ▁maija ▁līdz ▁jūl ijam ▁bieži ▁ir ▁ziemeļrietumu ▁v ēji ▁(00 -00 %), ▁bet ▁no ▁septembra ▁līdz ▁aprīl im ▁— ▁dienvidaustrumu
▁attēls : s ud an ▁mer o e ▁p yr am ids ▁0000. jpg | thumb | right |000 px | k ušas ▁valdnieku ▁pir am īdas ▁mer o ē ▁su d ānas ▁teritorija ▁bijusi ▁apdzīvota ▁jau ▁akmens ▁laikme tā .
25000 ▁parasti ▁tīkla ▁karte ▁atbalsta ▁vienu ▁no ▁lok ālo ▁tīklu ▁arhitekt ūrām , ▁piemēram , ▁eth ernet , ▁loc alt alk , ▁tok en ▁ring ▁vai ▁arc net . ▁pašlaik ▁populār ākā ▁tīkla ▁arhit e
▁no ▁citu ▁virzienu ▁v ējiem ▁somu ▁līča ▁krastos ▁no ▁maija ▁līdz ▁jūlijam ▁bieži ▁ir ▁ziemeļrietumu ▁vēji ▁(00 -00 %), ▁bet ▁no ▁septembra ▁līdz ▁aprīlim ▁— ▁dienvidaustrumu
▁attēls : s ud an ▁mer oe ▁p yr am ids ▁0000. jpg | thumb | right |000 px | k ušas ▁valdnieku ▁piramīdas ▁mer o ē ▁sud ānas ▁teritorija ▁bijusi ▁apdzīvota ▁jau ▁akmens ▁laikmetā .
50000 ▁parasti ▁tīkla ▁karte ▁atbalsta ▁vienu ▁no ▁lokālo ▁tīklu ▁arhitekt ūrām , ▁piemēram , ▁ethernet , ▁loc alt alk , ▁tok en ▁ring ▁vai ▁arc net . ▁pašlaik ▁populārākā ▁tīkla ▁arhit e
▁no ▁citu ▁virzienu ▁vējiem ▁somu ▁līča ▁krastos ▁no ▁maija ▁līdz ▁jūlijam ▁bieži ▁ir ▁ziemeļrietumu ▁vēji ▁(00-00 %), ▁bet ▁no ▁septembra ▁līdz ▁aprīlim ▁— ▁dienvidaustrumu
▁attēls : sud an ▁mer oe ▁pyr am ids ▁0000. jpg | thumb | right |000 px | k ušas ▁valdnieku ▁piramīdas ▁mer o ē ▁sudānas ▁teritorija ▁bijusi ▁apdzīvota ▁jau ▁akmens ▁laikmetā .
100000 ▁parasti ▁tīkla ▁karte ▁atbalsta ▁vienu ▁no ▁lokālo ▁tīklu ▁arhitekt ūrām , ▁piemēram , ▁ethernet , ▁loc alt alk , ▁token ▁ring ▁vai ▁arc net . ▁pašlaik ▁populārākā ▁tīkla ▁arhit e
▁no ▁citu ▁virzienu ▁vējiem ▁somu ▁līča ▁krastos ▁no ▁maija ▁līdz ▁jūlijam ▁bieži ▁ir ▁ziemeļrietumu ▁vēji ▁(00-00 %), ▁bet ▁no ▁septembra ▁līdz ▁aprīlim ▁— ▁dienvidaustrumu
▁attēls : sud an ▁mer oe ▁pyr am ids ▁0000. jpg | thumb | right |000 px | k ušas ▁valdnieku ▁piramīdas ▁mer o ē ▁sudānas ▁teritorija ▁bijusi ▁apdzīvota ▁jau ▁akmens ▁laikmetā .