Arabic (ar) subword embeddings

Vocab size vocab model 25 dim 50 dim 100 dim 200 dim 300 dim
1000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
3000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
5000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
10000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
25000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
50000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
100000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
200000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix

Training corpus sample, encoded with different BPE vocabulary sizes

Vocab sizearwiki sample
original وبعد انتخابات البرلمان الإسرائيلي (الكنيست) السابعة انضم الى الحكومة كوزير بدون وزارة، انما مسؤولاً عن شؤون المهاجرين الجدد. ثم عين وزيراً للمواصلات ب
الردع النووي الفرنسي ، (المعروف سابقا باسم " فرقة دي فرابيه ") ، وتعتمد على الاستقلال التام. تتكون القوة النووية الفرنسية الحالية من اربع غواصات من طر
وقبل صدام استقالة البكر، وبتحديد إقامته في منزله إلى أن توفى في أكتوبر عام 0000م، ومن بين أهم الأعمال التي قام بها صدام في بداية توليه السلطة، الإفراج
1000 ▁وب عد ▁انت خ ابات ▁الب ر لم ان ▁الإس را ئي لي ▁( ال ك ني ست ) ▁الس ابعة ▁ان ضم ▁ال ى ▁الح كومة ▁ك وز ير ▁بد ون ▁وز ارة ، ▁ان ما ▁مس ؤ ولا ً ▁عن ▁ش ؤ ون ▁الم ها جر ين ▁الج دد . ▁ثم ▁ع ين ▁و زي را ً ▁للم وا صل ات ▁ب
▁الر د ع ▁الن و وي ▁الف رن سي ▁، ▁( ال مع رو ف ▁س اب قا ▁ب اسم ▁" ▁فر قة ▁دي ▁ف را بي ه ▁" ) ▁، ▁وت عت مد ▁على ▁الاست ق لال ▁الت ام . ▁تت كون ▁الق وة ▁الن و وية ▁الف رن سية ▁الح الية ▁من ▁ ار بع ▁غ وا ص ات ▁من ▁ط ر
▁وق بل ▁ص د ام ▁است ق الة ▁الب كر ، ▁وب تح ديد ▁إ ق ام ته ▁في ▁من ز له ▁إلى ▁أن ▁ت وف ى ▁في ▁أ كت وب ر ▁عام ▁0000 م ، ▁ومن ▁بين ▁أ هم ▁الأ ع مال ▁التي ▁قام ▁بها ▁ص د ام ▁في ▁بد اية ▁ت ولي ه ▁الس ل طة ، ▁الإ ف راج
3000 ▁وبعد ▁انت خابات ▁البر لمان ▁الإس رائي لي ▁( الك ني ست ) ▁الس ابعة ▁ان ضم ▁الى ▁الحكومة ▁ك وز ير ▁بد ون ▁وزارة ، ▁ان ما ▁مس ؤ ولا ً ▁عن ▁ش ؤون ▁الم ها جر ين ▁الج دد . ▁ثم ▁عين ▁و زي را ً ▁للم وا صل ات ▁ب
▁الر د ع ▁النو وي ▁الفرنسي ▁، ▁( ال مع روف ▁ساب قا ▁باسم ▁" ▁فر قة ▁دي ▁ف را بي ه ▁" ) ▁، ▁وت عتمد ▁على ▁الاست قلال ▁الت ام . ▁تت كون ▁الق وة ▁النو وية ▁الفرنسية ▁الح الية ▁من ▁ ار بع ▁غ وا ص ات ▁من ▁ط ر
▁وق بل ▁صد ام ▁است ق الة ▁الب كر ، ▁وب تح ديد ▁إ قام ته ▁في ▁من ز له ▁إلى ▁أن ▁ت وف ى ▁في ▁أكتوبر ▁عام ▁0000 م ، ▁ومن ▁بين ▁أهم ▁الأعمال ▁التي ▁قام ▁بها ▁صد ام ▁في ▁بداية ▁ت ولي ه ▁السلطة ، ▁الإ ف راج
5000 ▁وبعد ▁انت خابات ▁البرلمان ▁الإسرائيلي ▁( الك ني ست ) ▁الس ابعة ▁انضم ▁الى ▁الحكومة ▁ك وز ير ▁بدون ▁وزارة ، ▁ان ما ▁مس ؤ ولا ً ▁عن ▁ش ؤون ▁المها جر ين ▁الج دد . ▁ثم ▁عين ▁و زي را ً ▁للم واصل ات ▁ب
▁الر دع ▁النووي ▁الفرنسي ▁، ▁( ال مع روف ▁سابقا ▁باسم ▁" ▁فرقة ▁دي ▁ف را بيه ▁" ) ▁، ▁وت عتمد ▁على ▁الاستقلال ▁الت ام . ▁تتكون ▁القوة ▁النو وية ▁الفرنسية ▁الحالية ▁من ▁ار بع ▁غ واص ات ▁من ▁ط ر
▁وق بل ▁صد ام ▁است ق الة ▁الب كر ، ▁وب تح ديد ▁إ قام ته ▁في ▁من ز له ▁إلى ▁أن ▁ت وف ى ▁في ▁أكتوبر ▁عام ▁0000 م ، ▁ومن ▁بين ▁أهم ▁الأعمال ▁التي ▁قام ▁بها ▁صد ام ▁في ▁بداية ▁ت ولي ه ▁السلطة ، ▁الإف راج
10000 ▁وبعد ▁انتخابات ▁البرلمان ▁الإسرائيلي ▁( الك ني ست ) ▁السابعة ▁انضم ▁الى ▁الحكومة ▁ك وزير ▁بدون ▁وزارة ، ▁ان ما ▁مسؤ ولا ً ▁عن ▁شؤون ▁المهاجرين ▁الج دد . ▁ثم ▁عين ▁وزيرا ً ▁للم واصل ات ▁ب
▁الر دع ▁النووي ▁الفرنسي ▁، ▁( المع روف ▁سابقا ▁باسم ▁" ▁فرقة ▁دي ▁فرا بيه ▁" ) ▁، ▁وت عتمد ▁على ▁الاستقلال ▁الت ام . ▁تتكون ▁القوة ▁النووية ▁الفرنسية ▁الحالية ▁من ▁ار بع ▁غ واص ات ▁من ▁ط ر
▁وقبل ▁صدام ▁است قالة ▁الب كر ، ▁وب تح ديد ▁إ قام ته ▁في ▁منز له ▁إلى ▁أن ▁ت وفى ▁في ▁أكتوبر ▁عام ▁0000 م ، ▁ومن ▁بين ▁أهم ▁الأعمال ▁التي ▁قام ▁بها ▁صدام ▁في ▁بداية ▁تولي ه ▁السلطة ، ▁الإف راج
25000 ▁وبعد ▁انتخابات ▁البرلمان ▁الإسرائيلي ▁( الك نيست ) ▁السابعة ▁انضم ▁الى ▁الحكومة ▁ك وزير ▁بدون ▁وزارة ، ▁ان ما ▁مسؤولا ً ▁عن ▁شؤون ▁المهاجرين ▁الجدد . ▁ثم ▁عين ▁وزيرا ً ▁للم واصل ات ▁ب
▁الر دع ▁النووي ▁الفرنسي ▁، ▁( المعروف ▁سابقا ▁باسم ▁" ▁فرقة ▁دي ▁فرا بيه ▁" ) ▁، ▁وتعتمد ▁على ▁الاستقلال ▁التام . ▁تتكون ▁القوة ▁النووية ▁الفرنسية ▁الحالية ▁من ▁اربع ▁غ واصات ▁من ▁طر
▁وقبل ▁صدام ▁استقالة ▁البكر ، ▁وب تحديد ▁إقامته ▁في ▁منزله ▁إلى ▁أن ▁توفى ▁في ▁أكتوبر ▁عام ▁0000 م ، ▁ومن ▁بين ▁أهم ▁الأعمال ▁التي ▁قام ▁بها ▁صدام ▁في ▁بداية ▁توليه ▁السلطة ، ▁الإفراج
50000 ▁وبعد ▁انتخابات ▁البرلمان ▁الإسرائيلي ▁( الك نيست ) ▁السابعة ▁انضم ▁الى ▁الحكومة ▁كوزير ▁بدون ▁وزارة ، ▁انما ▁مسؤولا ً ▁عن ▁شؤون ▁المهاجرين ▁الجدد . ▁ثم ▁عين ▁وزيرا ً ▁للم واصلات ▁ب
▁الر دع ▁النووي ▁الفرنسي ▁، ▁( المعروف ▁سابقا ▁باسم ▁" ▁فرقة ▁دي ▁فرا بيه ▁" ) ▁، ▁وتعتمد ▁على ▁الاستقلال ▁التام . ▁تتكون ▁القوة ▁النووية ▁الفرنسية ▁الحالية ▁من ▁اربع ▁غ واصات ▁من ▁طر
▁وقبل ▁صدام ▁استقالة ▁البكر ، ▁وب تحديد ▁إقامته ▁في ▁منزله ▁إلى ▁أن ▁توفى ▁في ▁أكتوبر ▁عام ▁0000 م ، ▁ومن ▁بين ▁أهم ▁الأعمال ▁التي ▁قام ▁بها ▁صدام ▁في ▁بداية ▁توليه ▁السلطة ، ▁الإفراج
100000 ▁وبعد ▁انتخابات ▁البرلمان ▁الإسرائيلي ▁( الك نيست ) ▁السابعة ▁انضم ▁الى ▁الحكومة ▁كوزير ▁بدون ▁وزارة ، ▁انما ▁مسؤولا ً ▁عن ▁شؤون ▁المهاجرين ▁الجدد . ▁ثم ▁عين ▁وزيرا ً ▁للمواصلات ▁ب
▁الردع ▁النووي ▁الفرنسي ▁، ▁( المعروف ▁سابقا ▁باسم ▁" ▁فرقة ▁دي ▁فرا بيه ▁") ▁، ▁وتعتمد ▁على ▁الاستقلال ▁التام . ▁تتكون ▁القوة ▁النووية ▁الفرنسية ▁الحالية ▁من ▁اربع ▁غواصات ▁من ▁طر
▁وقبل ▁صدام ▁استقالة ▁البكر ، ▁وب تحديد ▁إقامته ▁في ▁منزله ▁إلى ▁أن ▁توفى ▁في ▁أكتوبر ▁عام ▁0000 م ، ▁ومن ▁بين ▁أهم ▁الأعمال ▁التي ▁قام ▁بها ▁صدام ▁في ▁بداية ▁توليه ▁السلطة ، ▁الإفراج