Skip to content

是否考虑构建一个“检索+阅读”的中文openQA数据集? #83

@BigHeartC

Description

@BigHeartC

openQA会根据问题,从知识库(百万量级以上的文本)中检索相关的文本,然后进行“阅读”以抽取出问题的答案。目前openQA的数据集主要都是英文的,如:NaturalQuestions、WebQuestions。

dureader其实可以在现有的基础上,整理出一版针对openQA任务的数据集,构建一个中文 openQA的榜单,这将对中文openQA的发展很有帮助。想问下有这个计划吗?谢谢~

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions