Azerbaijani (az) subword embeddings

Vocab size vocab model 25 dim 50 dim 100 dim 200 dim 300 dim
1000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
3000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
5000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
10000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
25000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
50000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
100000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
200000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix

Training corpus sample, encoded with different BPE vocabulary sizes

Vocab sizeazwiki sample
original bakı dövlət universiteti və ya qısaca bdu — azərbaycan respublikası təhsil nazirliyinin tabeliyində olan ali təhsil müəssisəsi; azərbaycanın ilk ali t
* 00 sentyabr – bakı-tbilisi-ceyhan neft boru kəmərinin təməlinin qoyulması. * azərbaycan respublikasının abidələrin bərpası konserbasiyası və tədqiqi
000 min 000 km² ərazisi olan zimbabve 0 əyalətdən ibarətdir. tipik kənd ölkəsi olan zimbabvedə 00 milyonluq əhalinin (0000-ci il məlumatına əsasən) 00
1000 ▁bakı ▁dövlət ▁universitet i ▁və ▁ya ▁q ıs ac a ▁b du ▁— ▁azərbaycan ▁respublik ası ▁təhsil ▁naz ir liy inin ▁t ab el iy ində ▁olan ▁al i ▁təhsil ▁mü əss is əsi ; ▁azərbaycan ın ▁ilk ▁al i ▁t
▁* ▁00 ▁s ent yabr ▁– ▁bakı - t b il isi - c ey h an ▁n ef t ▁b oru ▁k əm ər inin ▁təm əl inin ▁qoy ul ması . ▁* ▁azərbaycan ▁respublik asının ▁ab idə lərin ▁bər p ası ▁kon s er b as iyası ▁və ▁təd qiq i
▁000 ▁min ▁000 ▁k m 2 ▁əraz isi ▁olan ▁z im b ab v e ▁0 ▁ əy al ət dən ▁ibarət dir . ▁t ip ik ▁kənd ▁ölk əsi ▁olan ▁z im b ab v e də ▁00 ▁mil y on lu q ▁əhal inin ▁( 0000- ci ▁il ▁məlum at ına ▁əsasən ) ▁00
3000 ▁bakı ▁dövlət ▁universiteti ▁və ▁ya ▁q ıs ac a ▁b du ▁— ▁azərbaycan ▁respublikası ▁təhsil ▁nazir liyinin ▁tab el iy ində ▁olan ▁ali ▁təhsil ▁müəssis əsi ; ▁azərbaycanın ▁ilk ▁ali ▁t
▁* ▁00 ▁sentyabr ▁– ▁bakı - t b il isi - c ey han ▁neft ▁b oru ▁k əm ər inin ▁təm əl inin ▁qoy ul ması . ▁* ▁azərbaycan ▁respublikasının ▁abidə lərin ▁bər p ası ▁kons er bas iyası ▁və ▁tədqiq i
▁000 ▁min ▁000 ▁km 2 ▁əraz isi ▁olan ▁z im b ab v e ▁0 ▁əy alət dən ▁ibarətdir . ▁tip ik ▁kənd ▁ölk əsi ▁olan ▁z im b ab v e də ▁00 ▁milyon luq ▁əhalinin ▁(0000- ci ▁il ▁məlumat ına ▁əsasən ) ▁00
5000 ▁bakı ▁dövlət ▁universiteti ▁və ▁ya ▁qıs aca ▁b du ▁— ▁azərbaycan ▁respublikası ▁təhsil ▁nazirliyinin ▁tab el iy ində ▁olan ▁ali ▁təhsil ▁müəssis əsi ; ▁azərbaycanın ▁ilk ▁ali ▁t
▁* ▁00 ▁sentyabr ▁– ▁bakı - t bil isi - c ey han ▁neft ▁b oru ▁kəm ər inin ▁təm əl inin ▁qoy ulması . ▁* ▁azərbaycan ▁respublikasının ▁abidə lərin ▁bər p ası ▁kons er bas iyası ▁və ▁tədqiq i
▁000 ▁min ▁000 ▁km 2 ▁ərazisi ▁olan ▁z im bab v e ▁0 ▁əyalət dən ▁ibarətdir . ▁tip ik ▁kənd ▁ölk əsi ▁olan ▁z im bab v e də ▁00 ▁milyon luq ▁əhalinin ▁(0000- ci ▁il ▁məlumat ına ▁əsasən ) ▁00
10000 ▁bakı ▁dövlət ▁universiteti ▁və ▁ya ▁qıs aca ▁bdu ▁— ▁azərbaycan ▁respublikası ▁təhsil ▁nazirliyinin ▁tabel iyində ▁olan ▁ali ▁təhsil ▁müəssisəsi ; ▁azərbaycanın ▁ilk ▁ali ▁t
▁* ▁00 ▁sentyabr ▁– ▁bakı - t bilisi - c ey han ▁neft ▁boru ▁kəmər inin ▁təməl inin ▁qoy ulması . ▁* ▁azərbaycan ▁respublikasının ▁abidə lərin ▁bərp ası ▁kons er bas iyası ▁və ▁tədqiqi
▁000 ▁min ▁000 ▁km 2 ▁ərazisi ▁olan ▁z im bab ve ▁0 ▁əyalət dən ▁ibarətdir . ▁tip ik ▁kənd ▁ölk əsi ▁olan ▁z im bab ve də ▁00 ▁milyon luq ▁əhalinin ▁(0000- ci ▁il ▁məlumatına ▁əsasən ) ▁00
25000 ▁bakı ▁dövlət ▁universiteti ▁və ▁ya ▁qısaca ▁bdu ▁— ▁azərbaycan ▁respublikası ▁təhsil ▁nazirliyinin ▁tabeliyində ▁olan ▁ali ▁təhsil ▁müəssisəsi ; ▁azərbaycanın ▁ilk ▁ali ▁t
▁* ▁00 ▁sentyabr ▁– ▁bakı - tbilisi - cey han ▁neft ▁boru ▁kəmərinin ▁təməl inin ▁qoyulması . ▁* ▁azərbaycan ▁respublikasının ▁abidələrin ▁bərpası ▁kons er bas iyası ▁və ▁tədqiqi
▁000 ▁min ▁000 ▁km 2 ▁ərazisi ▁olan ▁zim bab ve ▁0 ▁əyalət dən ▁ibarətdir . ▁tipik ▁kənd ▁ölkəsi ▁olan ▁zim bab ve də ▁00 ▁milyon luq ▁əhalinin ▁(0000- ci ▁il ▁məlumatına ▁əsasən ) ▁00
50000 ▁bakı ▁dövlət ▁universiteti ▁və ▁ya ▁qısaca ▁bdu ▁— ▁azərbaycan ▁respublikası ▁təhsil ▁nazirliyinin ▁tabeliyində ▁olan ▁ali ▁təhsil ▁müəssisəsi ; ▁azərbaycanın ▁ilk ▁ali ▁t
▁* ▁00 ▁sentyabr ▁– ▁bakı - tbilisi - ceyhan ▁neft ▁boru ▁kəmərinin ▁təməl inin ▁qoyulması . ▁* ▁azərbaycan ▁respublikasının ▁abidələrin ▁bərpası ▁konser bas iyası ▁və ▁tədqiqi
▁000 ▁min ▁000 ▁km 2 ▁ərazisi ▁olan ▁zimbabve ▁0 ▁əyalət dən ▁ibarətdir . ▁tipik ▁kənd ▁ölkəsi ▁olan ▁zimbabve də ▁00 ▁milyon luq ▁əhalinin ▁(0000- ci ▁il ▁məlumatına ▁əsasən ) ▁00
100000 ▁bakı ▁dövlət ▁universiteti ▁və ▁ya ▁qısaca ▁bdu ▁— ▁azərbaycan ▁respublikası ▁təhsil ▁nazirliyinin ▁tabeliyində ▁olan ▁ali ▁təhsil ▁müəssisəsi ; ▁azərbaycanın ▁ilk ▁ali ▁t
▁* ▁00 ▁sentyabr ▁– ▁bakı - tbilisi - ceyhan ▁neft ▁boru ▁kəmərinin ▁təməlinin ▁qoyulması . ▁* ▁azərbaycan ▁respublikasının ▁abidələrin ▁bərpası ▁konser bas iyası ▁və ▁tədqiqi
▁000 ▁min ▁000 ▁km 2 ▁ərazisi ▁olan ▁zimbabve ▁0 ▁əyalətdən ▁ibarətdir . ▁tipik ▁kənd ▁ölkəsi ▁olan ▁zimbabve də ▁00 ▁milyonluq ▁əhalinin ▁(0000- ci ▁il ▁məlumatına ▁əsasən ) ▁00