Maithili (mai) subword embeddings

Vocab size vocab model 25 dim 50 dim 100 dim 200 dim 300 dim
1000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
3000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
5000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
10000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
25000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix

Training corpus sample, encoded with different BPE vocabulary sizes

Vocab sizemaiwiki sample
original मारियो द्रागी (; जन्म: ३ सेप्टेम्बर १९४७) इटालीक बैंकर तथा अर्थविद् छी जे हाल केन्द्रीय युरोपेली बैंकक प्रमुखक रूपमे कार्यरत अछि । ओ सन् २०११ नोभेम्बर
पेरिस फ्रान्सक राजधानी आ सबसँ पैग शहर सेहो छी। एकर क्षेत्रफल १०५ वर्ग किलोमिटर अछि आ करिब २० लाख लोकसभ ई शहरमे बसोबास करैत अछि। नगर आ अगलबगल समेत गणना
एकरा दुनियाक सब सँ पुरान नियोजित आ उत्कृष्ट सहर मानल जाइत अछि । ई सिन्धु घाटी सभ्यताक सब सँ परिपक्व सहर छी । ई नगर अवशेष सिन्धु नदीक किनार सक्खर जिलाम
1000 ▁म ार िय ो ▁द ्रा ग ी ▁( ; ▁जन्म : ▁0 ▁से प ्ट े म्बर ▁0000 ) ▁इ ट ाल ीक ▁ब ैं कर ▁तथा ▁अर् थ वि द् ▁छी ▁जे ▁ह ाल ▁केन्द्र ीय ▁य ुर ो प ेल ी ▁ब ैं क क ▁प्रमुख क ▁रूपमे ▁कार्य र त ▁अछि ▁। ▁ओ ▁सन् ▁0000 ▁न ो भ े म्बर
▁प ेर िस ▁फ ्रा न्स क ▁राजधानी ▁आ ▁सबसँ ▁पै ग ▁शहर ▁सेहो ▁छी । ▁एकर ▁क्षेत्रफल ▁00 0 ▁वर्ग ▁क िलोमिटर ▁अछि ▁आ ▁करि ब ▁00 ▁ला ख ▁लोक सभ ▁ई ▁शहर मे ▁ब स ो ब ास ▁करैत ▁अछि । ▁नगर ▁आ ▁अ ग ल ब ग ल ▁स मे त ▁ग ण ना
▁एक रा ▁द ुन िय ाक ▁सब ▁सँ ▁पुर ान ▁न िय ोज ित ▁आ ▁उ त् क ृ ष्ट ▁स हर ▁म ानल ▁जाइत ▁अछि ▁। ▁ई ▁सि न्ध ु ▁घ ा टी ▁सभ ्य त ाक ▁सब ▁सँ ▁पर िप क ्व ▁स हर ▁छी ▁। ▁ई ▁नगर ▁अव श ेष ▁सि न्ध ु ▁न द ीक ▁क िन ार ▁सक ् ख र ▁जिला म
3000 ▁मार ियो ▁द ्रा गी ▁(; ▁जन्म : ▁0 ▁से प ्ट ेम्बर ▁0000 ) ▁इ ट ाल ीक ▁ब ैं कर ▁तथा ▁अर्थ वि द् ▁छी ▁जे ▁हाल ▁केन्द्रीय ▁युरोप ेली ▁बैंक क ▁प्रमुख क ▁रूपमे ▁कार्य र त ▁अछि ▁। ▁ओ ▁सन् ▁0000 ▁न ो भ ेम्बर
▁प ेर िस ▁फ्रान्स क ▁राजधानी ▁आ ▁सबसँ ▁पैग ▁शहर ▁सेहो ▁छी । ▁एकर ▁क्षेत्रफल ▁000 ▁वर्ग ▁किलोमिटर ▁अछि ▁आ ▁करि ब ▁00 ▁लाख ▁लोकसभ ▁ई ▁शहर मे ▁बस ोब ास ▁करैत ▁अछि । ▁नगर ▁आ ▁अग ल ब गल ▁समेत ▁गण ना
▁एकरा ▁दुन ियाक ▁सब ▁सँ ▁पुरान ▁निय ोज ित ▁आ ▁उत्कृष्ट ▁सहर ▁मानल ▁जाइत ▁अछि ▁। ▁ई ▁सिन्धु ▁घ ा टी ▁सभ ्य ताक ▁सब ▁सँ ▁पर िप क ्व ▁सहर ▁छी ▁। ▁ई ▁नगर ▁अव श ेष ▁सिन्धु ▁नदीक ▁किन ार ▁सक ् खर ▁जिलाम
5000 ▁मार ियो ▁द ्रा गी ▁(; ▁जन्म : ▁0 ▁से प ्ट ेम्बर ▁0000) ▁इट ालीक ▁ब ैं कर ▁तथा ▁अर्थ वि द् ▁छी ▁जे ▁हाल ▁केन्द्रीय ▁युरोप ेली ▁बैंकक ▁प्रमुख क ▁रूपमे ▁कार्यरत ▁अछि ▁। ▁ओ ▁सन् ▁0000 ▁नो भ ेम्बर
▁प ेर िस ▁फ्रान्स क ▁राजधानी ▁आ ▁सबसँ ▁पैग ▁शहर ▁सेहो ▁छी । ▁एकर ▁क्षेत्रफल ▁000 ▁वर्ग ▁किलोमिटर ▁अछि ▁आ ▁करिब ▁00 ▁लाख ▁लोकसभ ▁ई ▁शहरमे ▁बसोबास ▁करैत ▁अछि । ▁नगर ▁आ ▁अग लब गल ▁समेत ▁गण ना
▁एकरा ▁दुनियाक ▁सब ▁सँ ▁पुरान ▁निय ोजित ▁आ ▁उत्कृष्ट ▁सहर ▁मानल ▁जाइत ▁अछि ▁। ▁ई ▁सिन्धु ▁घा टी ▁सभ ्य ताक ▁सब ▁सँ ▁पर िप क ्व ▁सहर ▁छी ▁। ▁ई ▁नगर ▁अव शेष ▁सिन्धु ▁नदीक ▁किनार ▁सक ् खर ▁जिलाम
10000 ▁मार ियो ▁द ्रा गी ▁(; ▁जन्म : ▁0 ▁सेप्टेम्बर ▁0000) ▁इटालीक ▁ब ैं कर ▁तथा ▁अर्थ विद् ▁छी ▁जे ▁हाल ▁केन्द्रीय ▁युरोपेली ▁बैंकक ▁प्रमुख क ▁रूपमे ▁कार्यरत ▁अछि ▁। ▁ओ ▁सन् ▁0000 ▁नोभेम्बर
▁पेरिस ▁फ्रान्सक ▁राजधानी ▁आ ▁सबसँ ▁पैग ▁शहर ▁सेहो ▁छी । ▁एकर ▁क्षेत्रफल ▁000 ▁वर्ग ▁किलोमिटर ▁अछि ▁आ ▁करिब ▁00 ▁लाख ▁लोकसभ ▁ई ▁शहरमे ▁बसोबास ▁करैत ▁अछि । ▁नगर ▁आ ▁अगलब गल ▁समेत ▁गणना
▁एकरा ▁दुनियाक ▁सब ▁सँ ▁पुरान ▁निय ोजित ▁आ ▁उत्कृष्ट ▁सहर ▁मानल ▁जाइत ▁अछि ▁। ▁ई ▁सिन्धु ▁घाटी ▁सभ्य ताक ▁सब ▁सँ ▁पर िप क ्व ▁सहर ▁छी ▁। ▁ई ▁नगर ▁अवशेष ▁सिन्धु ▁नदीक ▁किनार ▁सक ् खर ▁जिलाम
25000 ▁मारियो ▁द ्रा गी ▁(; ▁जन्म : ▁0 ▁सेप्टेम्बर ▁0000) ▁इटालीक ▁बैंकर ▁तथा ▁अर्थ विद् ▁छी ▁जे ▁हाल ▁केन्द्रीय ▁युरोपेली ▁बैंकक ▁प्रमुखक ▁रूपमे ▁कार्यरत ▁अछि ▁। ▁ओ ▁सन् ▁0000 ▁नोभेम्बर
▁पेरिस ▁फ्रान्सक ▁राजधानी ▁आ ▁सबसँ ▁पैग ▁शहर ▁सेहो ▁छी । ▁एकर ▁क्षेत्रफल ▁000 ▁वर्ग ▁किलोमिटर ▁अछि ▁आ ▁करिब ▁00 ▁लाख ▁लोकसभ ▁ई ▁शहरमे ▁बसोबास ▁करैत ▁अछि । ▁नगर ▁आ ▁अगलबगल ▁समेत ▁गणना
▁एकरा ▁दुनियाक ▁सब ▁सँ ▁पुरान ▁नियोजित ▁आ ▁उत्कृष्ट ▁सहर ▁मानल ▁जाइत ▁अछि ▁। ▁ई ▁सिन्धु ▁घाटी ▁सभ्यताक ▁सब ▁सँ ▁परिप क ्व ▁सहर ▁छी ▁। ▁ई ▁नगर ▁अवशेष ▁सिन्धु ▁नदीक ▁किनार ▁सक ्खर ▁जिलाम