XQA: A Cross-lingual Open-domain Question Answering Dataset

2021 ◽

Vol 9 ◽

pp. 1389-1406

Author(s):

Shayne Longpre ◽

Yi Lu ◽

Joachim Daiber

Keyword(s):

Question Answering ◽

State Of The Art ◽

Linguistically Diverse ◽

Data Representation ◽

Independent Data ◽

Open Domain ◽

Low Resource ◽

Art Methods ◽

Questions And Answers ◽

Cross Lingual

Abstract Progress in cross-lingual modeling depends on challenging, realistic, and diverse evaluation sets. We introduce Multilingual Knowledge Questions and Answers (MKQA), an open- domain question answering evaluation set comprising 10k question-answer pairs aligned across 26 typologically diverse languages (260k question-answer pairs in total). Answers are based on heavily curated, language- independent data representation, making results comparable across languages and independent of language-specific passages. With 26 languages, this dataset supplies the widest range of languages to-date for evaluating question answering. We benchmark a variety of state- of-the-art methods and baselines for generative and extractive question answering, trained on Natural Questions, in zero shot and translation settings. Results indicate this dataset is challenging even in English, but especially in low-resource languages.1

Download Full-text

A Cross-Lingual German-English Framework for Open-Domain Question Answering

Evaluation of Multilingual and Multi-modal Information Retrieval - Lecture Notes in Computer Science ◽

10.1007/978-3-540-74999-8_40 ◽

2007 ◽

pp. 328-338

Author(s):

Bogdan Sacaleanu ◽

Günter Neumann

Keyword(s):

Question Answering ◽

Open Domain ◽

Cross Lingual

Download Full-text

A multi-granularity semantic space learning approach for cross-lingual open domain question answering

World Wide Web ◽

10.1007/s11280-021-00879-2 ◽

2021 ◽

Author(s):

Lin Li ◽

Miao Kong ◽

Dong Li ◽

Dong Zhou

Keyword(s):

Question Answering ◽

Semantic Space ◽

Learning Approach ◽

Open Domain ◽

Cross Lingual

Download Full-text

Coarse-To-Careful: Seeking Semantic-Related Knowledge for Open-Domain Commonsense Question Answering

ICASSP 2021 - 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) ◽

10.1109/icassp39728.2021.9413878 ◽

2021 ◽

Author(s):

Luxi Xing ◽

Yue Hu ◽

Jing Yu ◽

Yuqiang Xie ◽

Wei Peng

Keyword(s):

Question Answering ◽

Open Domain

Download Full-text

An Open Domain Question Answering System Based on Improved System Similarity Model

2006 International Conference on Machine Learning and Cybernetics ◽

10.1109/icmlc.2006.259170 ◽

2006 ◽

Cited By ~ 4

Author(s):

Yu-ming Zhao ◽

Zhi-ming Xu ◽

Yi Guan ◽

Xiao-long Wang

Keyword(s):

Question Answering ◽

Open Domain ◽

Question Answering System ◽

Similarity Model

Download Full-text

Don’t Read Too Much Into It: Adaptive Computation for Open-Domain Question Answering

10.18653/v1/2020.sustainlp-1.9 ◽

2020 ◽

Author(s):

Yuxiang Wu ◽

Pasquale Minervini ◽

Pontus Stenetorp ◽

Sebastian Riedel

Keyword(s):

Question Answering ◽

Open Domain ◽

Adaptive Computation

Download Full-text

New Measures for Open-Domain Question Answering Evaluation Within a Time Constraint

Text, Speech and Dialogue - Lecture Notes in Computer Science ◽

10.1007/978-3-540-74628-7_70 ◽

2007 ◽

pp. 540-547

Author(s):

Elisa Noguera ◽

Fernando Llopis ◽

Antonio Ferrández ◽

Alberto Escapa

Keyword(s):

Question Answering ◽

Time Constraint ◽

Open Domain

Download Full-text

R2-D2: A Modular Baseline for Open-Domain Question Answering

10.18653/v1/2021.findings-emnlp.73 ◽

2021 ◽

Author(s):

Martin Fajcik ◽

Martin Docekal ◽

Karel Ondrej ◽

Pavel Smrz

Keyword(s):

Question Answering ◽

Open Domain

Download Full-text

Multi-Task Dense Retrieval via Model Uncertainty Fusion for Open-Domain Question Answering

10.18653/v1/2021.findings-emnlp.26 ◽

2021 ◽

Author(s):

Minghan Li ◽

Ming Li ◽

Kun Xiong ◽

Jimmy Lin

Keyword(s):

Model Uncertainty ◽

Question Answering ◽

Open Domain

Download Full-text

Relevance-guided Supervision for OpenQA with ColBERT

Transactions of the Association for Computational Linguistics ◽

10.1162/tacl_a_00405 ◽

2021 ◽

Vol 9 ◽

pp. 929-944

Author(s):

Omar Khattab ◽

Christopher Potts ◽

Matei Zaharia

Keyword(s):

Question Answering ◽

State Of The Art ◽

Training Data ◽

Coarse Grained ◽

Retrieval Model ◽

Open Domain ◽

Weak Supervision ◽

Fine Grained ◽

Vector Representations ◽

Large Corpus

Abstract Systems for Open-Domain Question Answering (OpenQA) generally depend on a retriever for finding candidate passages in a large corpus and a reader for extracting answers from those passages. In much recent work, the retriever is a learned component that uses coarse-grained vector representations of questions and passages. We argue that this modeling choice is insufficiently expressive for dealing with the complexity of natural language questions. To address this, we define ColBERT-QA, which adapts the scalable neural retrieval model ColBERT to OpenQA. ColBERT creates fine-grained interactions between questions and passages. We propose an efficient weak supervision strategy that iteratively uses ColBERT to create its own training data. This greatly improves OpenQA retrieval on Natural Questions, SQuAD, and TriviaQA, and the resulting system attains state-of-the-art extractive OpenQA performance on all three datasets.

Download Full-text

XQA: A Cross-lingual Open-domain Question Answering Dataset

MKQA: A Linguistically Diverse Benchmark for Multilingual Open Domain Question Answering

A Cross-Lingual German-English Framework for Open-Domain Question Answering

A multi-granularity semantic space learning approach for cross-lingual open domain question answering

Coarse-To-Careful: Seeking Semantic-Related Knowledge for Open-Domain Commonsense Question Answering

An Open Domain Question Answering System Based on Improved System Similarity Model

Don’t Read Too Much Into It: Adaptive Computation for Open-Domain Question Answering

New Measures for Open-Domain Question Answering Evaluation Within a Time Constraint

R2-D2: A Modular Baseline for Open-Domain Question Answering

Multi-Task Dense Retrieval via Model Uncertainty Fusion for Open-Domain Question Answering

Relevance-guided Supervision for OpenQA with ColBERT

Export Citation Format