Waray (Philippines) (war) subword embeddings

Vocab size vocab model 25 dim 50 dim 100 dim 200 dim 300 dim
1000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
3000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
5000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
10000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
25000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
50000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
100000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix

Training corpus sample, encoded with different BPE vocabulary sizes

Vocab sizewarwiki sample
original pilipinas. sumala han census han tuig 0000, mayda ini populasyon nga 00,000 ka tawo ha 0,000 nga mga panimalay.
nakarawat hit mga eroplano nga tikang ngan pakadto ha iba nga luparan biskan ha sulod ngan gawas hit nasod.
dida han polako nga gyera depensiba, ha pagtikang han gyera pankalibotan ii, han septyembre 0, 0000, an bungto ginbinombahan han aleman nga luftwaffe.
1000 ▁pi lip ina s . ▁s uma la ▁han ▁c ens us ▁han ▁t u ig ▁0000 , ▁ma y da ▁in i ▁p op ula sy on ▁nga ▁00 , 000 ▁ka ▁ta w o ▁ha ▁0 , 000 ▁nga ▁mga ▁p ani ma la y .
▁naka ra wa t ▁hi t ▁mga ▁ er op lan o ▁nga ▁ti k ang ▁ngan ▁pa ka d to ▁ha ▁i ba ▁nga ▁lu pa ran ▁b is k an ▁ha ▁s u lo d ▁ngan ▁ga wa s ▁hi t ▁na s od .
▁di da ▁han ▁po lak o ▁nga ▁g y era ▁de pen si ba , ▁ha ▁pag ti k ang ▁han ▁g y era ▁p an ka li bo tan ▁i i , ▁han ▁se p ty e mb re ▁0 , ▁0000 , ▁an ▁b ung to ▁gin b in om ba han ▁han ▁a le man ▁nga ▁lu f t wa ff e .
3000 ▁pilip inas . ▁sumala ▁han ▁c ens us ▁han ▁tu ig ▁0000, ▁mayda ▁ini ▁pop ula syon ▁nga ▁00 ,000 ▁ka ▁ta wo ▁ha ▁0 ,000 ▁nga ▁mga ▁pani mala y .
▁naka ra wa t ▁hi t ▁mga ▁er op lan o ▁nga ▁ti kang ▁ngan ▁pa ka d to ▁ha ▁i ba ▁nga ▁lu pa ran ▁bis k an ▁ha ▁su lo d ▁ngan ▁ga wa s ▁hi t ▁nasod .
▁di da ▁han ▁po lak o ▁nga ▁g y era ▁de pen si ba , ▁ha ▁pag ti kang ▁han ▁g y era ▁pan ka li bo tan ▁i i , ▁han ▁se p ty emb re ▁0 , ▁0000, ▁an ▁bungto ▁gin b in om ba han ▁han ▁ale man ▁nga ▁lu f t wa ff e .
5000 ▁pilipinas . ▁sumala ▁han ▁census ▁han ▁tuig ▁0000, ▁mayda ▁ini ▁populasyon ▁nga ▁00,000 ▁ka ▁tawo ▁ha ▁0,000 ▁nga ▁mga ▁panimalay .
▁naka ra wat ▁hi t ▁mga ▁er op lan o ▁nga ▁tikang ▁ngan ▁pa ka dto ▁ha ▁i ba ▁nga ▁lu paran ▁bis kan ▁ha ▁su lo d ▁ngan ▁ga wa s ▁hi t ▁nasod .
▁di da ▁han ▁po lak o ▁nga ▁gy era ▁de pen si ba , ▁ha ▁pag ti kang ▁han ▁gy era ▁pan ka li bo tan ▁ii , ▁han ▁se pty emb re ▁0 , ▁0000, ▁an ▁bungto ▁gin b in om ba han ▁han ▁aleman ▁nga ▁lu f t wa ff e .
10000 ▁pilipinas . ▁sumala ▁han ▁census ▁han ▁tuig ▁0000, ▁mayda ▁ini ▁populasyon ▁nga ▁00,000 ▁ka ▁tawo ▁ha ▁0,000 ▁nga ▁mga ▁panimalay .
▁naka ra wat ▁hit ▁mga ▁er op lan o ▁nga ▁tikang ▁ngan ▁pa ka dto ▁ha ▁iba ▁nga ▁lu paran ▁bis kan ▁ha ▁su lo d ▁ngan ▁ga was ▁hit ▁nasod .
▁dida ▁han ▁po lak o ▁nga ▁gy era ▁de pen si ba , ▁ha ▁pag ti kang ▁han ▁gy era ▁pan ka li botan ▁ii , ▁han ▁se pty embre ▁0, ▁0000, ▁an ▁bungto ▁gin bin om ba han ▁han ▁aleman ▁nga ▁lu f t wa ffe .
25000 ▁pilipinas . ▁sumala ▁han ▁census ▁han ▁tuig ▁0000, ▁mayda ▁ini ▁populasyon ▁nga ▁00,000 ▁ka ▁tawo ▁ha ▁0,000 ▁nga ▁mga ▁panimalay .
▁naka ra wat ▁hit ▁mga ▁er op lan o ▁nga ▁tikang ▁ngan ▁paka dto ▁ha ▁iba ▁nga ▁lu paran ▁bis kan ▁ha ▁su lod ▁ngan ▁ga was ▁hit ▁nasod .
▁dida ▁han ▁po lak o ▁nga ▁gyera ▁de pen si ba , ▁ha ▁pag tikang ▁han ▁gyera ▁pan kali botan ▁ii , ▁han ▁septyembre ▁0, ▁0000, ▁an ▁bungto ▁gin bin om bahan ▁han ▁aleman ▁nga ▁lu ft wa ffe .
50000 ▁pilipinas . ▁sumala ▁han ▁census ▁han ▁tuig ▁0000, ▁mayda ▁ini ▁populasyon ▁nga ▁00,000 ▁ka ▁tawo ▁ha ▁0,000 ▁nga ▁mga ▁panimalay .
▁naka ra wat ▁hit ▁mga ▁er op lano ▁nga ▁tikang ▁ngan ▁pakadto ▁ha ▁iba ▁nga ▁luparan ▁bis kan ▁ha ▁sulod ▁ngan ▁gawas ▁hit ▁nasod .
▁dida ▁han ▁po lak o ▁nga ▁gyera ▁de pen si ba , ▁ha ▁pagtikang ▁han ▁gyera ▁pan kali botan ▁ii , ▁han ▁septyembre ▁0, ▁0000, ▁an ▁bungto ▁gin bin om bahan ▁han ▁aleman ▁nga ▁lu ft wa ffe .
100000 ▁pilipinas . ▁sumala ▁han ▁census ▁han ▁tuig ▁0000, ▁mayda ▁ini ▁populasyon ▁nga ▁00,000 ▁ka ▁tawo ▁ha ▁0,000 ▁nga ▁mga ▁panimalay .
▁naka rawat ▁hit ▁mga ▁er op lano ▁nga ▁tikang ▁ngan ▁pakadto ▁ha ▁iba ▁nga ▁luparan ▁bis kan ▁ha ▁sulod ▁ngan ▁gawas ▁hit ▁nasod .
▁dida ▁han ▁polako ▁nga ▁gyera ▁de pensi ba , ▁ha ▁pagtikang ▁han ▁gyera ▁pankalibotan ▁ii , ▁han ▁septyembre ▁0, ▁0000, ▁an ▁bungto ▁gin bin om bahan ▁han ▁aleman ▁nga ▁lu ft wa ffe .