Skip to content

拼音输入法完善--数据扩充层面 #3

@ERICMIAO0817

Description

@ERICMIAO0817

目前拼音输入法的模型训练基于pku的语料数据训练得到,由于训练方式基于统计学原理和HMM,模型受数据集本身汉字语序的影响比较大。后续可以考虑加入口语化的语料进行训练(例如小说等等),提升整体效果。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions