AI2D-RST: A multimodal corpus of 1000 primary school science diagrams

View resource name in all available languages

AI2D-RST: multimodaalinen korpus peruskoulutason luonnontieteiden oppimateriaaleissa esiintyvistä diagrammeista

AI2D-RST

Persistent Identifier of this resource:

http://urn.fi/urn:nbn:fi:lb-2019120407

Access location:

AI2D-RST is a multimodal corpus of 1000 English-language diagrams that represent topics in primary school natural science, such as food webs, life cycles, moon phases and human physiology. The corpus is based on the Allen Institute for Artificial Intelligence Diagrams (AI2D) dataset, a collection of diagrams with crowd-sourced descriptions.

Building on the layout segmentation in AI2D, the AI2D-RST corpus presents a multi-layer annotation schema that provides a rich, graph-based description of diagram structure. The annotation was performed by trained experts.

View resource description in all available languages

AI2D-RST on multimodaalinen korpus, joka koostuu tuhannesta diagrammista, jotka kuvaavat luonnontieteellisiä ilmiöitä peruskoulun taitotasolla. Aineisto pohjautuu Allen Institute for Artificial Intelligencen julkaisemaan Diagrams-datasettiin (AI2D), jonka annotaatiota AI2D-RST täydentää. Jokaista diagrammia kuvataan graafien avulla kolmella eri tasolla, jotka kuvaavat (1) diagrammin osien muodostamia kokonaisuuksia, (2) nuolien ja viivojen avulla ilmaistuja yhteyksiä sekä (3) diagrammin osien välisiä semanttisia suhteita. Diagrammien osien tunnisteet pysyvät samoina tasosta riippumatta. Annotaatio on tallennettu JSON-tiedostoihin, joita on yksi jokaista diagrammia kohti, eli yhteensä 1000 kappaletta.

You don’t have the permission to edit this resource.