Kannada (kn) subword embeddings

Vocab size vocab model 25 dim 50 dim 100 dim 200 dim 300 dim
1000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
3000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
5000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
10000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
25000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
50000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
100000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
200000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix

Training corpus sample, encoded with different BPE vocabulary sizes

Vocab sizeknwiki sample
original ಕೆನರಾ ಬ್ಯಾಂಕ್ ೧೯೦೬ರಲ್ಲಿ ಕೆನರಾ ಬ್ಯಾಂಕ್ ಹಿಂದೂ ಶಾಶ್ವತ ನಿಧಿ ಹೆಸರಿನಿಂದ ಮಂಗಳೂರಿನಲ್ಲಿ ಸ್ಥಾಪಿತವಾಯಿತು. ಅಮ್ಮೆಂಬಾಳ್ ಸುಬ್ಬರಾವ್ ಪೈ ಇದರ ಸ್ಥಾಪಕರು. ಭಾರತದ ಪ್ರಮುಖ ವಾಣಿಜ
*ಮೊದಲನೆಯದು ಇವನು ಕುರುಬನಾಗಿದ್ದು ಕಾಳಿಕಾದೇವಿಯ ವರದಿಂದ ವರಕವಿಯಾದನೆಂದು, ರಾಜಕುಮಾರಿಯೊಬ್ಬಳು ತನ್ನ ತಂದೆಯ ಆಸ್ಥಾನದ ಮಂತ್ರಿಯೊಬ್ಬನ ಕುಟಿಲತೆಯಿಂದ ಈ ಅವಿದ್ಯಾವಂತ ಕುರುಬನನ್ನು ಮ
ಇಂಟರ್ನ್ಯಾಷನಲ್ ಇನ್ಸ್ಟಿಟ್ಯೂಟ್ ಆಫ್ ಇನ್ಫರ್ಮೇಶನ್ ಟೆಕ್ನಾಲಜಿ , ಹೈದರಾಬಾದ್ (iiit-h), ಹೈದರಾಬಾದ್ ವಿಶ್ವವಿದ್ಯಾಲಯ(ಹೈದರಾಬಾದ್ ಕೇಂದ್ರೀಯ ವಿಶ್ವವಿದ್ಯಾಲಯ), ಮತ್ತು ಇಂಡಿಯನ್ ಸ
1000 ▁ಕೆ ನ ರಾ ▁ಬ್ಯಾ ಂ ಕ್ ▁0000 ರಲ್ಲಿ ▁ಕೆ ನ ರಾ ▁ಬ್ಯಾ ಂ ಕ್ ▁ಹಿಂದ ೂ ▁ಶಾ ಶ ್ವ ತ ▁ನಿ ಧಿ ▁ಹೆಸ ರಿನ ಿಂದ ▁ಮ ಂ ಗಳೂ ರಿ ನಲ್ಲಿ ▁ಸ್ಥಾಪ ಿತ ವ ಾಯಿತು . ▁ಅ ಮ್ಮ ೆ ಂಬ ಾ ಳ ್ ▁ಸು ಬ್ಬ ರಾ ವ್ ▁ಪ ೈ ▁ಇದರ ▁ಸ್ಥಾಪ ಕರು . ▁ಭಾರತದ ▁ಪ್ರಮುಖ ▁ವಾ ಣಿ ಜ
▁* ಮ ೊ ದಲ ನೆಯ ದು ▁ಇ ವ ನು ▁ಕು ರು ಬ ನ ಾಗ ಿದ್ದು ▁ಕಾ ಳ ಿಕ ಾದ ೇ ವ ಿಯ ▁ವ ರ ದಿಂದ ▁ವ ರ ಕ ವ ಿಯ ಾದ ನೆ ಂದು , ▁ರಾಜ ಕು ಮಾ ರಿಯ ೊ ಬ್ಬ ಳು ▁ತನ್ನ ▁ತ ಂದ ೆಯ ▁ಆ ಸ್ಥ ಾನ ದ ▁ಮ ಂತ್ ರಿಯ ೊ ಬ್ಬ ನ ▁ಕು ಟಿ ಲ ತೆಯ ಿಂದ ▁ಈ ▁ಅವ ಿದ ್ಯಾ ವ ಂತ ▁ಕು ರು ಬ ನ ನ್ನು ▁ಮ
▁ಇ ಂಟ ರ್ ನ್ಯಾ ಷ ನ ಲ್ ▁ಇ ನ್ಸ್ ಟಿ ಟ ್ಯೂ ಟ್ ▁ಆಫ್ ▁ಇ ನ್ ಫ ರ್ಮ ೇಶ ನ್ ▁ಟ ೆ ಕ್ ನ ಾಲ ಜಿ ▁, ▁ಹ ೈ ದ ರಾ ಬ ಾದ ್ ▁( i i it - h ), ▁ಹ ೈ ದ ರಾ ಬ ಾದ ್ ▁ವಿಶ್ವ ವಿದ ್ಯಾ ಲಯ ( ಹ ೈ ದ ರಾ ಬ ಾದ ್ ▁ಕೇಂದ್ರ ೀಯ ▁ವಿಶ್ವ ವಿದ ್ಯಾ ಲಯ ), ▁ಮತ್ತು ▁ಇ ಂಡ ಿಯನ್ ▁ಸ
3000 ▁ಕೆನ ರಾ ▁ಬ್ಯಾಂಕ್ ▁0000 ರಲ್ಲಿ ▁ಕೆನ ರಾ ▁ಬ್ಯಾಂಕ್ ▁ಹಿಂದೂ ▁ಶಾ ಶ್ವ ತ ▁ನಿ ಧಿ ▁ಹೆಸರಿನ ಿಂದ ▁ಮ ಂಗಳೂ ರಿನಲ್ಲಿ ▁ಸ್ಥಾಪ ಿತ ವಾಯಿತು . ▁ಅ ಮ್ಮೆ ಂಬ ಾ ಳ ್ ▁ಸು ಬ್ಬ ರಾ ವ್ ▁ಪೈ ▁ಇದರ ▁ಸ್ಥಾಪ ಕರು . ▁ಭಾರತದ ▁ಪ್ರಮುಖ ▁ವಾಣಿ ಜ
▁* ಮೊ ದಲ ನೆಯ ದು ▁ಇ ವನು ▁ಕು ರು ಬ ನ ಾಗಿದ್ದು ▁ಕಾ ಳ ಿಕ ಾದ ೇ ವಿಯ ▁ವರ ದಿಂದ ▁ವರ ಕ ವಿಯ ಾದ ನೆ ಂದು , ▁ರಾಜ ಕು ಮಾ ರಿಯ ೊಬ್ಬ ಳು ▁ತನ್ನ ▁ತಂದ ೆಯ ▁ಆ ಸ್ಥ ಾನದ ▁ಮ ಂತ್ ರಿಯ ೊಬ್ಬ ನ ▁ಕು ಟಿ ಲ ತೆಯ ಿಂದ ▁ಈ ▁ಅವ ಿದ ್ಯಾ ವಂತ ▁ಕು ರು ಬ ನನ್ನು ▁ಮ
▁ಇಂಟರ್ ನ್ಯಾ ಷನಲ್ ▁ಇ ನ್ಸ್ ಟಿ ಟ ್ಯೂ ಟ್ ▁ಆಫ್ ▁ಇನ್ ಫ ರ್ಮ ೇಶನ್ ▁ಟೆ ಕ್ ನ ಾಲ ಜಿ ▁, ▁ಹೈ ದ ರಾ ಬ ಾದ್ ▁( i i it - h ), ▁ಹೈ ದ ರಾ ಬ ಾದ್ ▁ವಿಶ್ವವಿದ್ಯಾಲಯ ( ಹ ೈ ದ ರಾ ಬ ಾದ್ ▁ಕೇಂದ್ರ ೀಯ ▁ವಿಶ್ವವಿದ್ಯಾಲಯ ), ▁ಮತ್ತು ▁ಇಂಡ ಿಯನ್ ▁ಸ
5000 ▁ಕೆನ ರಾ ▁ಬ್ಯಾಂಕ್ ▁0000 ರಲ್ಲಿ ▁ಕೆನ ರಾ ▁ಬ್ಯಾಂಕ್ ▁ಹಿಂದೂ ▁ಶಾ ಶ್ವ ತ ▁ನಿ ಧಿ ▁ಹೆಸರಿನ ಿಂದ ▁ಮಂಗಳೂ ರಿನಲ್ಲಿ ▁ಸ್ಥಾಪ ಿತ ವಾಯಿತು . ▁ಅ ಮ್ಮೆ ಂಬಾ ಳ್ ▁ಸು ಬ್ಬ ರಾವ್ ▁ಪೈ ▁ಇದರ ▁ಸ್ಥಾಪ ಕರು . ▁ಭಾರತದ ▁ಪ್ರಮುಖ ▁ವಾಣಿ ಜ
▁* ಮೊದಲ ನೆಯ ದು ▁ಇ ವನು ▁ಕುರು ಬ ನ ಾಗಿದ್ದು ▁ಕಾಳ ಿಕ ಾದ ೇ ವಿಯ ▁ವರ ದಿಂದ ▁ವರ ಕ ವಿಯ ಾದ ನೆಂದು , ▁ರಾಜ ಕು ಮಾ ರಿಯ ೊಬ್ಬ ಳು ▁ತನ್ನ ▁ತಂದೆಯ ▁ಆ ಸ್ಥ ಾನದ ▁ಮ ಂತ್ ರಿಯ ೊಬ್ಬ ನ ▁ಕು ಟಿ ಲ ತೆಯಿಂದ ▁ಈ ▁ಅವ ಿದ ್ಯಾ ವಂತ ▁ಕುರು ಬ ನನ್ನು ▁ಮ
▁ಇಂಟರ್ ನ್ಯಾ ಷನಲ್ ▁ಇನ್ಸ್ಟಿಟ್ಯೂ ಟ್ ▁ಆಫ್ ▁ಇನ್ ಫ ರ್ಮ ೇಶನ್ ▁ಟೆ ಕ್ನ ಾಲ ಜಿ ▁, ▁ಹೈದ ರಾ ಬಾದ್ ▁( i i it - h ), ▁ಹೈದ ರಾ ಬಾದ್ ▁ವಿಶ್ವವಿದ್ಯಾಲಯ ( ಹೈ ದ ರಾ ಬಾದ್ ▁ಕೇಂದ್ರ ೀಯ ▁ವಿಶ್ವವಿದ್ಯಾಲಯ ), ▁ಮತ್ತು ▁ಇಂಡ ಿಯನ್ ▁ಸ
10000 ▁ಕೆನ ರಾ ▁ಬ್ಯಾಂಕ್ ▁0000 ರಲ್ಲಿ ▁ಕೆನ ರಾ ▁ಬ್ಯಾಂಕ್ ▁ಹಿಂದೂ ▁ಶಾಶ್ವತ ▁ನಿಧಿ ▁ಹೆಸರಿನಿಂದ ▁ಮಂಗಳೂ ರಿನಲ್ಲಿ ▁ಸ್ಥಾಪಿತ ವಾಯಿತು . ▁ಅ ಮ್ಮೆ ಂಬಾ ಳ್ ▁ಸುಬ್ಬ ರಾವ್ ▁ಪೈ ▁ಇದರ ▁ಸ್ಥಾಪ ಕರು . ▁ಭಾರತದ ▁ಪ್ರಮುಖ ▁ವಾಣಿ ಜ
▁* ಮೊದಲ ನೆಯ ದು ▁ಇವನು ▁ಕುರು ಬ ನ ಾಗಿದ್ದು ▁ಕಾಳ ಿಕ ಾದ ೇವಿಯ ▁ವರ ದಿಂದ ▁ವರ ಕ ವಿಯ ಾದ ನೆಂದು , ▁ರಾಜ ಕು ಮಾ ರಿಯ ೊಬ್ಬ ಳು ▁ತನ್ನ ▁ತಂದೆಯ ▁ಆ ಸ್ಥಾನದ ▁ಮ ಂತ್ರಿಯ ೊಬ್ಬ ನ ▁ಕು ಟಿಲ ತೆಯಿಂದ ▁ಈ ▁ಅವ ಿದ ್ಯಾ ವಂತ ▁ಕುರು ಬ ನನ್ನು ▁ಮ
▁ಇಂಟರ್ನ್ಯಾಷನಲ್ ▁ಇನ್ಸ್ಟಿಟ್ಯೂಟ್ ▁ಆಫ್ ▁ಇನ್ ಫ ರ್ಮ ೇಶನ್ ▁ಟೆಕ್ನಾಲಜಿ ▁, ▁ಹೈದರಾಬಾದ್ ▁( ii it - h ), ▁ಹೈದರಾಬಾದ್ ▁ವಿಶ್ವವಿದ್ಯಾಲಯ ( ಹೈ ದ ರಾ ಬಾದ್ ▁ಕೇಂದ್ರೀಯ ▁ವಿಶ್ವವಿದ್ಯಾಲಯ ), ▁ಮತ್ತು ▁ಇಂಡಿಯನ್ ▁ಸ
25000 ▁ಕೆನ ರಾ ▁ಬ್ಯಾಂಕ್ ▁0000 ರಲ್ಲಿ ▁ಕೆನ ರಾ ▁ಬ್ಯಾಂಕ್ ▁ಹಿಂದೂ ▁ಶಾಶ್ವತ ▁ನಿಧಿ ▁ಹೆಸರಿನಿಂದ ▁ಮಂಗಳೂರಿನಲ್ಲಿ ▁ಸ್ಥಾಪಿತವಾಯಿತು . ▁ಅ ಮ್ಮೆ ಂಬಾ ಳ್ ▁ಸುಬ್ಬ ರಾವ್ ▁ಪೈ ▁ಇದರ ▁ಸ್ಥಾಪ ಕರು . ▁ಭಾರತದ ▁ಪ್ರಮುಖ ▁ವಾಣಿ ಜ
▁* ಮೊದಲ ನೆಯದು ▁ಇವನು ▁ಕುರು ಬ ನಾಗಿದ್ದು ▁ಕಾಳ ಿಕ ಾದೇವಿಯ ▁ವರ ದಿಂದ ▁ವರ ಕ ವಿಯ ಾದ ನೆಂದು , ▁ರಾಜ ಕುಮಾ ರಿಯ ೊಬ್ಬ ಳು ▁ತನ್ನ ▁ತಂದೆಯ ▁ಆ ಸ್ಥಾನದ ▁ಮಂತ್ರಿಯ ೊಬ್ಬನ ▁ಕು ಟಿಲ ತೆಯಿಂದ ▁ಈ ▁ಅವ ಿದ ್ಯಾ ವಂತ ▁ಕುರು ಬ ನನ್ನು ▁ಮ
▁ಇಂಟರ್ನ್ಯಾಷನಲ್ ▁ಇನ್ಸ್ಟಿಟ್ಯೂಟ್ ▁ಆಫ್ ▁ಇನ್ ಫರ್ಮ ೇಶನ್ ▁ಟೆಕ್ನಾಲಜಿ ▁, ▁ಹೈದರಾಬಾದ್ ▁( ii it - h ), ▁ಹೈದರಾಬಾದ್ ▁ವಿಶ್ವವಿದ್ಯಾಲಯ ( ಹೈ ದ ರಾ ಬಾದ್ ▁ಕೇಂದ್ರೀಯ ▁ವಿಶ್ವವಿದ್ಯಾಲಯ ), ▁ಮತ್ತು ▁ಇಂಡಿಯನ್ ▁ಸ
50000 ▁ಕೆನರಾ ▁ಬ್ಯಾಂಕ್ ▁0000 ರಲ್ಲಿ ▁ಕೆನರಾ ▁ಬ್ಯಾಂಕ್ ▁ಹಿಂದೂ ▁ಶಾಶ್ವತ ▁ನಿಧಿ ▁ಹೆಸರಿನಿಂದ ▁ಮಂಗಳೂರಿನಲ್ಲಿ ▁ಸ್ಥಾಪಿತವಾಯಿತು . ▁ಅ ಮ್ಮೆ ಂಬಾ ಳ್ ▁ಸುಬ್ಬ ರಾವ್ ▁ಪೈ ▁ಇದರ ▁ಸ್ಥಾಪಕರು . ▁ಭಾರತದ ▁ಪ್ರಮುಖ ▁ವಾಣಿ ಜ
▁* ಮೊದಲ ನೆಯದು ▁ಇವನು ▁ಕುರುಬ ನಾಗಿದ್ದು ▁ಕಾಳ ಿಕ ಾದೇವಿಯ ▁ವರ ದಿಂದ ▁ವರ ಕವಿಯ ಾದ ನೆಂದು , ▁ರಾಜಕುಮಾರಿಯ ೊಬ್ಬಳು ▁ತನ್ನ ▁ತಂದೆಯ ▁ಆಸ್ಥಾನದ ▁ಮಂತ್ರಿಯ ೊಬ್ಬನ ▁ಕುಟಿಲ ತೆಯಿಂದ ▁ಈ ▁ಅವಿದ ್ಯಾ ವಂತ ▁ಕುರುಬ ನನ್ನು ▁ಮ
▁ಇಂಟರ್ನ್ಯಾಷನಲ್ ▁ಇನ್ಸ್ಟಿಟ್ಯೂಟ್ ▁ಆಫ್ ▁ಇನ್ಫರ್ಮ ೇಶನ್ ▁ಟೆಕ್ನಾಲಜಿ ▁, ▁ಹೈದರಾಬಾದ್ ▁( ii it - h ), ▁ಹೈದರಾಬಾದ್ ▁ವಿಶ್ವವಿದ್ಯಾಲಯ ( ಹೈದರಾಬಾದ್ ▁ಕೇಂದ್ರೀಯ ▁ವಿಶ್ವವಿದ್ಯಾಲಯ ), ▁ಮತ್ತು ▁ಇಂಡಿಯನ್ ▁ಸ
100000 ▁ಕೆನರಾ ▁ಬ್ಯಾಂಕ್ ▁0000 ರಲ್ಲಿ ▁ಕೆನರಾ ▁ಬ್ಯಾಂಕ್ ▁ಹಿಂದೂ ▁ಶಾಶ್ವತ ▁ನಿಧಿ ▁ಹೆಸರಿನಿಂದ ▁ಮಂಗಳೂರಿನಲ್ಲಿ ▁ಸ್ಥಾಪಿತವಾಯಿತು . ▁ಅ ಮ್ಮೆ ಂಬಾ ಳ್ ▁ಸುಬ್ಬರಾವ್ ▁ಪೈ ▁ಇದರ ▁ಸ್ಥಾಪಕರು . ▁ಭಾರತದ ▁ಪ್ರಮುಖ ▁ವಾಣಿ ಜ
▁* ಮೊದಲ ನೆಯದು ▁ಇವನು ▁ಕುರುಬ ನಾಗಿದ್ದು ▁ಕಾಳ ಿಕ ಾದೇವಿಯ ▁ವರ ದಿಂದ ▁ವರ ಕವಿಯ ಾದ ನೆಂದು , ▁ರಾಜಕುಮಾರಿಯ ೊಬ್ಬಳು ▁ತನ್ನ ▁ತಂದೆಯ ▁ಆಸ್ಥಾನದ ▁ಮಂತ್ರಿಯ ೊಬ್ಬನ ▁ಕುಟಿಲ ತೆಯಿಂದ ▁ಈ ▁ಅವಿದ್ಯಾ ವಂತ ▁ಕುರುಬ ನನ್ನು ▁ಮ
▁ಇಂಟರ್ನ್ಯಾಷನಲ್ ▁ಇನ್ಸ್ಟಿಟ್ಯೂಟ್ ▁ಆಫ್ ▁ಇನ್ಫರ್ಮೇಶನ್ ▁ಟೆಕ್ನಾಲಜಿ ▁, ▁ಹೈದರಾಬಾದ್ ▁( ii it - h ), ▁ಹೈದರಾಬಾದ್ ▁ವಿಶ್ವವಿದ್ಯಾಲಯ ( ಹೈದರಾಬಾದ್ ▁ಕೇಂದ್ರೀಯ ▁ವಿಶ್ವವಿದ್ಯಾಲಯ ), ▁ಮತ್ತು ▁ಇಂಡಿಯನ್ ▁ಸ