AtlasNLP Website

This repository hosts the public website for AtlasNLP, a country-aware atlas of dataset representation in NLP.

Website: https://anonymous.4open.science/w/AtlasNLP-6D06/

AtlasNLP maps NLP datasets by the countries and populations they represent, the locations where datasets are produced, and the NLP tasks they cover. The project is designed to make geographic gaps in NLP dataset representation more visible and to support more transparent, country-aware dataset documentation and evaluation.

About AtlasNLP

NLP datasets are often organized by language, task, or benchmark, but this does not always reveal which countries or populations are represented. AtlasNLP addresses this gap by organizing datasets around country-level metadata.

The resource includes:

AtlasNLP-Core: a large-scale ACL-derived collection of over 18,000 NLP datasets constructed through automated extraction and validation.
AtlasNLP-Gold: a human-curated reference set used for validation and expanded coverage of underrepresented regions.
Country-aware metadata: content countries, producer countries, task categories, languages, modality, synthetic status, and related dataset properties.
Interactive visualizations: maps, country-task coverage, language concentration, producer-content relationships, and dataset summary statistics.

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
README.md		README.md
analysis.html		analysis.html
analysis.js		analysis.js
automated_full_set_with_audited_languages.csv		automated_full_set_with_audited_languages.csv
datasets.html		datasets.html
datasets.js		datasets.js
human_validated_set_with_audited_languages.csv		human_validated_set_with_audited_languages.csv
index.html		index.html
main.js		main.js
style.css		style.css
visualizations.html		visualizations.html
visualizations.js		visualizations.js
worldbench_country_task_expanded.csv		worldbench_country_task_expanded.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AtlasNLP Website

About AtlasNLP

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

AtlasNLP Website

About AtlasNLP

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages