AI2D-RST: A multimodal corpus of 1000 primary school science diagrams (deprecated)

View resource name in all available languages

AI2D-RST: multimodaalinen korpus peruskoulutason luonnontieteiden oppimateriaaleissa esiintyvistä diagrammeista (käytöstä poistunut)

AI2D-RST

Persistent Identifier of this resource:

http://urn.fi/urn:nbn:fi:lb-2019120407

This resource has been replaced with version 1.1: http://urn.fi/urn:nbn:fi:lb-2020060101

This version contains annotation errors in approximately 15 diagrams, which raise errors when loading the data. These errors have been corrected in version 1.1.

AI2D-RST is a multimodal corpus of 1000 English-language diagrams that represent topics in primary school natural science, such as food webs, life cycles, moon phases and human physiology. The corpus is based on the Allen Institute for Artificial Intelligence Diagrams (AI2D) dataset, a collection of diagrams with crowd-sourced descriptions.

Building on the layout segmentation in AI2D, the AI2D-RST corpus presents a multi-layer annotation schema that provides a rich, graph-based description of diagram structure. The annotation was performed by trained experts.

View resource description in all available languages

Tämä aineisto on korvattu versiolla 1.1: http://urn.fi/urn:nbn:fi:lb-2020060101

Tämä versio sisältää virheitä noin 15 diagrammin annotaatiossa, jotka aiheuttavat virheitä aineistoa ladattaessa. Nämä virheet on korjattu versiossa 1.1.

AI2D-RST on multimodaalinen korpus, joka koostuu tuhannesta diagrammista, jotka kuvaavat luonnontieteellisiä ilmiöitä peruskoulun taitotasolla. Aineisto pohjautuu Allen Institute for Artificial Intelligencen julkaisemaan Diagrams-datasettiin (AI2D), jonka annotaatiota AI2D-RST täydentää. Jokaista diagrammia kuvataan graafien avulla kolmella eri tasolla, jotka kuvaavat (1) diagrammin osien muodostamia kokonaisuuksia, (2) nuolien ja viivojen avulla ilmaistuja yhteyksiä sekä (3) diagrammin osien välisiä semanttisia suhteita. Diagrammien osien tunnisteet pysyvät samoina tasosta riippumatta. Annotaatio on tallennettu JSON-tiedostoihin, joita on yksi jokaista diagrammia kohti, eli yhteensä 1000 kappaletta.

You don’t have the permission to edit this resource.