Turkish (tr) subword embeddings

Vocab size vocab model 25 dim 50 dim 100 dim 200 dim 300 dim
1000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
3000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
5000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
10000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
25000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
50000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
100000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
200000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix

Training corpus sample, encoded with different BPE vocabulary sizes

Vocab sizetrwiki sample
original * 0000 - sscb satranç şampiyonu gary kasparov, vatandaşı anatoli karpov'u yenerek dünya satranç şampiyonu oldu. * 0000 - moskova'da ilk mcdonald's açı
* 0000 - cumhurbaşkanı kenan evren'e fahri profesörlük ve istanbul üniversitesi hukuk fakültesi'nin fahri hukuk doktorluğu unvanları verildi. * 0000 -
orta çağ'da özellikle ibn nefis, ibn cahız ve ibn baytar gibi müslümanlar bilim insanları biyoloji dalına katkıda bulunmuşlardır. özellikle erken evri
1000 ▁* ▁0000 ▁- ▁s s c b ▁s at r an ç ▁şampiyon u ▁g ar y ▁kas par ov , ▁v at an da ş ı ▁an at ol i ▁kar p ov ' u ▁y en erek ▁dünya ▁s at r an ç ▁şampiyon u ▁oldu . ▁* ▁0000 ▁- ▁m os k ov a ' da ▁ilk ▁m c d on al d ' s ▁aç ı
▁* ▁0000 ▁- ▁cumhur b aş k anı ▁ken an ▁ev r en ' e ▁f ah ri ▁pro f es ör l ük ▁ve ▁istanbul ▁üniversitesi ▁h uk uk ▁fak ült esi ' nin ▁f ah ri ▁h uk uk ▁d ok t or lu ğu ▁un van ları ▁ver ildi . ▁* ▁0000 ▁-
▁or ta ▁ç ağ ' da ▁özel likle ▁i b n ▁n ef is , ▁i b n ▁c ah ız ▁ve ▁i b n ▁b ay t ar ▁gibi ▁m üs l üm an lar ▁bil im ▁insan ları ▁b iy oloj i ▁d al ına ▁kat k ı da ▁bulun m uş lar dır . ▁özel likle ▁erk en ▁ev ri
3000 ▁* ▁0000 ▁- ▁s sc b ▁sat ran ç ▁şampiyon u ▁g ary ▁kas par ov , ▁vat anda ş ı ▁an at ol i ▁kar p ov ' u ▁yen erek ▁dünya ▁sat ran ç ▁şampiyon u ▁oldu . ▁* ▁0000 ▁- ▁m os k ova ' da ▁ilk ▁mc d on al d ' s ▁aç ı
▁* ▁0000 ▁- ▁cumhur baş k anı ▁ken an ▁ev ren ' e ▁f ah ri ▁profes ör lük ▁ve ▁istanbul ▁üniversitesi ▁hukuk ▁fakültesi ' nin ▁f ah ri ▁hukuk ▁doktor luğu ▁un van ları ▁ver ildi . ▁* ▁0000 ▁-
▁orta ▁çağ ' da ▁özellikle ▁i bn ▁n ef is , ▁i bn ▁c ah ız ▁ve ▁i bn ▁bay tar ▁gibi ▁müs l üman lar ▁bilim ▁insan ları ▁b iy oloji ▁dal ına ▁kat kı da ▁bulun muş lardır . ▁özellikle ▁erk en ▁ev ri
5000 ▁* ▁0000 ▁- ▁s sc b ▁sat ran ç ▁şampiyonu ▁g ary ▁kas par ov , ▁vatandaş ı ▁an at ol i ▁kar p ov ' u ▁yen erek ▁dünya ▁sat ran ç ▁şampiyonu ▁oldu . ▁* ▁0000 ▁- ▁moskova ' da ▁ilk ▁mc don ald ' s ▁açı
▁* ▁0000 ▁- ▁cumhurbaşkanı ▁ken an ▁evren ' e ▁f ah ri ▁profesör lük ▁ve ▁istanbul ▁üniversitesi ▁hukuk ▁fakültesi ' nin ▁f ah ri ▁hukuk ▁doktor luğu ▁unvan ları ▁verildi . ▁* ▁0000 ▁-
▁orta ▁çağ ' da ▁özellikle ▁i bn ▁nef is , ▁i bn ▁c ah ız ▁ve ▁i bn ▁bay tar ▁gibi ▁müslüman lar ▁bilim ▁insanları ▁biy oloji ▁dal ına ▁katkı da ▁bulun muş lardır . ▁özellikle ▁erken ▁ev ri
10000 ▁* ▁0000 ▁- ▁sscb ▁sat ran ç ▁şampiyonu ▁g ary ▁kas par ov , ▁vatandaşı ▁an at oli ▁kar p ov ' u ▁yenerek ▁dünya ▁sat ran ç ▁şampiyonu ▁oldu . ▁* ▁0000 ▁- ▁moskova ' da ▁ilk ▁mc don ald ' s ▁açı
▁* ▁0000 ▁- ▁cumhurbaşkanı ▁ken an ▁evren ' e ▁fah ri ▁profesör lük ▁ve ▁istanbul ▁üniversitesi ▁hukuk ▁fakültesi ' nin ▁fah ri ▁hukuk ▁doktor luğu ▁unvan ları ▁verildi . ▁* ▁0000 ▁-
▁orta ▁çağ ' da ▁özellikle ▁ibn ▁nef is , ▁ibn ▁c ah ız ▁ve ▁ibn ▁bay tar ▁gibi ▁müslüman lar ▁bilim ▁insanları ▁biy oloji ▁dal ına ▁katkıda ▁bulunmuş lardır . ▁özellikle ▁erken ▁ev ri
25000 ▁* ▁0000 ▁- ▁sscb ▁satranç ▁şampiyonu ▁gary ▁kas par ov , ▁vatandaşı ▁anat oli ▁karp ov ' u ▁yenerek ▁dünya ▁satranç ▁şampiyonu ▁oldu . ▁* ▁0000 ▁- ▁moskova ' da ▁ilk ▁mc donald ' s ▁açı
▁* ▁0000 ▁- ▁cumhurbaşkanı ▁kenan ▁evren ' e ▁fahri ▁profesör lük ▁ve ▁istanbul ▁üniversitesi ▁hukuk ▁fakültesi ' nin ▁fahri ▁hukuk ▁doktor luğu ▁unvan ları ▁verildi . ▁* ▁0000 ▁-
▁orta ▁çağ ' da ▁özellikle ▁ibn ▁nef is , ▁ibn ▁cah ız ▁ve ▁ibn ▁bay tar ▁gibi ▁müslümanlar ▁bilim ▁insanları ▁biyoloji ▁dal ına ▁katkıda ▁bulunmuş lardır . ▁özellikle ▁erken ▁ev ri
50000 ▁* ▁0000 ▁- ▁sscb ▁satranç ▁şampiyonu ▁gary ▁kaspar ov , ▁vatandaşı ▁anat oli ▁karp ov ' u ▁yenerek ▁dünya ▁satranç ▁şampiyonu ▁oldu . ▁* ▁0000 ▁- ▁moskova ' da ▁ilk ▁mcdonald ' s ▁açı
▁* ▁0000 ▁- ▁cumhurbaşkanı ▁kenan ▁evren ' e ▁fahri ▁profesörlük ▁ve ▁istanbul ▁üniversitesi ▁hukuk ▁fakültesi ' nin ▁fahri ▁hukuk ▁doktor luğu ▁unvan ları ▁verildi . ▁* ▁0000 ▁-
▁orta ▁çağ ' da ▁özellikle ▁ibn ▁nef is , ▁ibn ▁cah ız ▁ve ▁ibn ▁bay tar ▁gibi ▁müslümanlar ▁bilim ▁insanları ▁biyoloji ▁dalına ▁katkıda ▁bulunmuşlardır . ▁özellikle ▁erken ▁ev ri
100000 ▁* ▁0000 ▁- ▁sscb ▁satranç ▁şampiyonu ▁gary ▁kasparov , ▁vatandaşı ▁anatoli ▁karp ov ' u ▁yenerek ▁dünya ▁satranç ▁şampiyonu ▁oldu . ▁* ▁0000 ▁- ▁moskova ' da ▁ilk ▁mcdonald ' s ▁açı
▁* ▁0000 ▁- ▁cumhurbaşkanı ▁kenan ▁evren ' e ▁fahri ▁profesörlük ▁ve ▁istanbul ▁üniversitesi ▁hukuk ▁fakültesi ' nin ▁fahri ▁hukuk ▁doktorluğu ▁unvanları ▁verildi . ▁* ▁0000 ▁-
▁orta ▁çağ ' da ▁özellikle ▁ibn ▁nefis , ▁ibn ▁cah ız ▁ve ▁ibn ▁baytar ▁gibi ▁müslümanlar ▁bilim ▁insanları ▁biyoloji ▁dalına ▁katkıda ▁bulunmuşlardır . ▁özellikle ▁erken ▁ev ri