Czech (cs) subword embeddings

Vocab size vocab model 25 dim 50 dim 100 dim 200 dim 300 dim
1000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
3000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
5000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
10000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
25000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
50000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
100000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
200000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix

Training corpus sample, encoded with different BPE vocabulary sizes

Vocab sizecswiki sample
original je častým omylem považovat iso za zkratku z anglického názvu. ve skutečnosti je odvozeno od řeckého slova ἴσος (isos), znamenající ''stejný'' ve smysl
ve článku iv bruselského paktu se výslovně píše, že reakce států na ozbrojený útok musí být vojenského charakteru. tím se liší od článku 0 severoatlan
zlatá přilba města pardubic je každoroční závod motocyklů na ploché dráze ve svítkově. je to nejstarší plochodrážní závod na světě; poprvé se jela v r
1000 ▁je ▁ča st ým ▁o my lem ▁p ova ž ovat ▁i so ▁za ▁z k rat ku ▁z ▁an gli ck ého ▁ná z vu . ▁ve ▁sku te č nosti ▁je ▁od vo zen o ▁od ▁ře ck ého ▁s lov a ▁ ἴσος ▁( is o s ), ▁zna men a jící ▁'' ste j ný '' ▁ve ▁s my s l
▁ve ▁č lá n ku ▁i v ▁b ru se l ského ▁pak tu ▁se ▁vý s lov ně ▁pí še , ▁že ▁re ak ce ▁stát ů ▁na ▁o z b ro jen ý ▁ú to k ▁mu sí ▁být ▁vo jen ského ▁ch a ra k te ru . ▁t ím ▁se ▁li ší ▁od ▁č lá n ku ▁0 ▁se ve ro at lan
▁z la tá ▁p ř il ba ▁města ▁par du b ic ▁je ▁ka ž do ro ční ▁zá vod ▁mo to c y k l ů ▁na ▁p lo ch é ▁d rá ze ▁ve ▁s ví t kov ě . ▁je ▁to ▁nej st ar ší ▁p lo chod rá ž ní ▁zá vod ▁na ▁svě tě ; ▁po pr vé ▁se ▁je la ▁v ▁r
3000 ▁je ▁ča st ým ▁o my lem ▁považ ovat ▁i so ▁za ▁z k rat ku ▁z ▁angli ckého ▁náz vu . ▁ve ▁skuteč nosti ▁je ▁odvo zen o ▁od ▁ře ckého ▁slov a ▁ ἴσος ▁( is os ), ▁zna men a jící ▁'' ste j ný '' ▁ve ▁smy sl
▁ve ▁č lán ku ▁i v ▁bru sel ského ▁pak tu ▁se ▁vý slov ně ▁pí še , ▁že ▁re ak ce ▁stát ů ▁na ▁o z bro jen ý ▁ú tok ▁musí ▁být ▁vojen ského ▁charak te ru . ▁tím ▁se ▁li ší ▁od ▁č lán ku ▁0 ▁severo at lan
▁zla tá ▁př il ba ▁města ▁par du b ic ▁je ▁kaž do ro ční ▁závod ▁mo to c yk lů ▁na ▁plo ch é ▁drá ze ▁ve ▁s ví t kově . ▁je ▁to ▁nejstar ší ▁plo chod rá žní ▁závod ▁na ▁světě ; ▁poprvé ▁se ▁je la ▁v ▁r
5000 ▁je ▁ča st ým ▁o my lem ▁považ ovat ▁i so ▁za ▁z krat ku ▁z ▁angli ckého ▁náz vu . ▁ve ▁skuteč nosti ▁je ▁odvo zeno ▁od ▁ře ckého ▁slova ▁ ἴσος ▁( is os ), ▁zna mena jící ▁'' ste j ný '' ▁ve ▁smy sl
▁ve ▁člán ku ▁iv ▁bru sel ského ▁pak tu ▁se ▁vý slov ně ▁pí še , ▁že ▁reak ce ▁států ▁na ▁oz bro jen ý ▁ú tok ▁musí ▁být ▁vojen ského ▁charak te ru . ▁tím ▁se ▁li ší ▁od ▁člán ku ▁0 ▁severo at lan
▁zla tá ▁př il ba ▁města ▁pardu b ic ▁je ▁kaž do ro ční ▁závod ▁moto cyk lů ▁na ▁plo ché ▁drá ze ▁ve ▁s ví t kově . ▁je ▁to ▁nejstarší ▁plo chod rá žní ▁závod ▁na ▁světě ; ▁poprvé ▁se ▁je la ▁v ▁r
10000 ▁je ▁ča stým ▁o my lem ▁považ ovat ▁iso ▁za ▁zkrat ku ▁z ▁anglického ▁názvu . ▁ve ▁skutečnosti ▁je ▁odvo zeno ▁od ▁ře ckého ▁slova ▁ ἴσος ▁( is os ), ▁zna mena jící ▁'' ste j ný '' ▁ve ▁smy sl
▁ve ▁člán ku ▁iv ▁bru sel ského ▁pak tu ▁se ▁vý slov ně ▁píše , ▁že ▁reakce ▁států ▁na ▁ozbrojen ý ▁útok ▁musí ▁být ▁vojenského ▁charak teru . ▁tím ▁se ▁liší ▁od ▁člán ku ▁0 ▁severo at lan
▁zlatá ▁přil ba ▁města ▁pardub ic ▁je ▁každoro ční ▁závod ▁moto cyk lů ▁na ▁plo ché ▁drá ze ▁ve ▁sví t kově . ▁je ▁to ▁nejstarší ▁plo chod rá žní ▁závod ▁na ▁světě ; ▁poprvé ▁se ▁je la ▁v ▁r
25000 ▁je ▁častým ▁omy lem ▁považovat ▁iso ▁za ▁zkrat ku ▁z ▁anglického ▁názvu . ▁ve ▁skutečnosti ▁je ▁odvozeno ▁od ▁řeckého ▁slova ▁ ἴσος ▁( is os ), ▁znamena jící ▁'' stej ný '' ▁ve ▁smysl
▁ve ▁článku ▁iv ▁brusel ského ▁pak tu ▁se ▁výslov ně ▁píše , ▁že ▁reakce ▁států ▁na ▁ozbrojen ý ▁útok ▁musí ▁být ▁vojenského ▁charakteru . ▁tím ▁se ▁liší ▁od ▁článku ▁0 ▁severo at lan
▁zlatá ▁přil ba ▁města ▁pardubic ▁je ▁každoro ční ▁závod ▁motocyk lů ▁na ▁ploché ▁dráze ▁ve ▁sví t kově . ▁je ▁to ▁nejstarší ▁plo chod rá žní ▁závod ▁na ▁světě ; ▁poprvé ▁se ▁je la ▁v ▁r
50000 ▁je ▁častým ▁omylem ▁považovat ▁iso ▁za ▁zkrat ku ▁z ▁anglického ▁názvu . ▁ve ▁skutečnosti ▁je ▁odvozeno ▁od ▁řeckého ▁slova ▁ ἴσος ▁( is os ), ▁znamenající ▁'' stej ný '' ▁ve ▁smysl
▁ve ▁článku ▁iv ▁brusel ského ▁paktu ▁se ▁výslovně ▁píše , ▁že ▁reakce ▁států ▁na ▁ozbrojený ▁útok ▁musí ▁být ▁vojenského ▁charakteru . ▁tím ▁se ▁liší ▁od ▁článku ▁0 ▁severo atlan
▁zlatá ▁přil ba ▁města ▁pardubic ▁je ▁každoroční ▁závod ▁motocyklů ▁na ▁ploché ▁dráze ▁ve ▁sví t kově . ▁je ▁to ▁nejstarší ▁plo chod rá žní ▁závod ▁na ▁světě ; ▁poprvé ▁se ▁jela ▁v ▁r
100000 ▁je ▁častým ▁omylem ▁považovat ▁iso ▁za ▁zkratku ▁z ▁anglického ▁názvu . ▁ve ▁skutečnosti ▁je ▁odvozeno ▁od ▁řeckého ▁slova ▁ ἴσος ▁( is os ), ▁znamenající ▁'' stej ný '' ▁ve ▁smysl
▁ve ▁článku ▁iv ▁brusel ského ▁paktu ▁se ▁výslovně ▁píše , ▁že ▁reakce ▁států ▁na ▁ozbrojený ▁útok ▁musí ▁být ▁vojenského ▁charakteru . ▁tím ▁se ▁liší ▁od ▁článku ▁0 ▁severo atlan
▁zlatá ▁přilba ▁města ▁pardubic ▁je ▁každoroční ▁závod ▁motocyklů ▁na ▁ploché ▁dráze ▁ve ▁sví t kově . ▁je ▁to ▁nejstarší ▁plo chod rá žní ▁závod ▁na ▁světě ; ▁poprvé ▁se ▁jela ▁v ▁r