拼音输入法完善--数据扩充层面

目前拼音输入法的模型训练基于pku的语料数据训练得到，由于训练方式基于统计学原理和HMM，模型受数据集本身汉字语序的影响比较大。后续可以考虑加入口语化的语料进行训练（例如小说等等），提升整体效果。