下載地址

論文地址

Crowdsourcing multiple choice science questions

數(shù)據(jù)集說明

簡要介紹

該數(shù)據(jù)集是一個(gè)高質(zhì)量的、科學(xué)領(lǐng)域的多項(xiàng)選擇數(shù)據(jù)集，由人工構(gòu)造，共包含13,679 個(gè)多項(xiàng)選擇題。

構(gòu)建方式

1.選擇該領(lǐng)域的教材作為原始資源
2.使用基于規(guī)則的方法，從教材中選擇適合生成合理問題的片段
3.提供3個(gè)過濾出的片段供每個(gè)參與者選擇/全不選擇
4.定義期望的和不期望的問題示例供參考
5.一個(gè)參與者根據(jù)提供的片段問問題，并提供正確答案
6.訓(xùn)練模型從一個(gè)大集合中預(yù)測出的6個(gè)干擾選項(xiàng)
7.另一個(gè)參與者從6個(gè)干擾選項(xiàng)中最多選擇2個(gè)使用
8.自己再想一個(gè)構(gòu)成最終的3個(gè)干擾選項(xiàng)

數(shù)據(jù)示例

其中，support為回答該問題所需的外部知識。

數(shù)據(jù)集使用方式

版本1：用作多項(xiàng)選擇題。（此時(shí)無需使用support，因?yàn)槿羰褂胹upport，對于問題來說答案就顯而易見了。）
我們也可以看到，該數(shù)據(jù)集中數(shù)據(jù)基本都是常識類問題，若有背景知識，無需support也可回答問題。
另，也有使用該數(shù)據(jù)集進(jìn)行外部知識使用研究的，如論文 What Does My QA Model Know? Devising Controlled Probes using Expert Knowledge
版本2：用作問答題。此時(shí)數(shù)據(jù)集僅包含support和question

數(shù)據(jù)質(zhì)量

論文中提出使用了盲測評估數(shù)據(jù)的質(zhì)量，隨機(jī)了100個(gè)人工問題和100個(gè)數(shù)據(jù)集中問題，人工區(qū)分，發(fā)現(xiàn)55%的數(shù)據(jù)集中問題被識別出來，說明該數(shù)據(jù)集的質(zhì)量接近純?nèi)斯?shù)據(jù)質(zhì)量。

有趣的結(jié)論

標(biāo)注數(shù)據(jù)中，干擾選項(xiàng)來自模型提供的6個(gè)候選的比例為36.1%（最高為66%，因?yàn)橄拗屏俗疃嘀荒苓x2個(gè)），在短答案上這個(gè)比例會更高、長答案上會更低一些，說明該模型產(chǎn)生的候選干擾選項(xiàng)效果還不錯，后續(xù)進(jìn)行干擾選項(xiàng)生成或評估可以參考該方法。

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

SciQ數(shù)據(jù)集

SciQ數(shù)據(jù)集

下載地址

論文地址

數(shù)據(jù)集說明

簡要介紹

構(gòu)建方式

數(shù)據(jù)示例

數(shù)據(jù)集使用方式

數(shù)據(jù)質(zhì)量

相關(guān)實(shí)驗(yàn)

有趣的結(jié)論

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

SciQ數(shù)據(jù)集

下載地址

論文地址

數(shù)據(jù)集說明

簡要介紹

構(gòu)建方式

數(shù)據(jù)示例

數(shù)據(jù)集使用方式

數(shù)據(jù)質(zhì)量

相關(guān)實(shí)驗(yàn)

有趣的結(jié)論

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av