Tabellen Level 4 full table structure

Das Tabellen Level 4 full table structure dient vorrangig der Erkennung, dem Training und der Validierung der vollständigen Struktur und dem Inhalt von Tabellen. Die Struktur einer Tabelle definiert sich als Annotation von Zeilen, Spalten sowie der Annotation von sematischen Merkmalen der Tabellenzellen wie dem Tabellenkopf. Bei der Segmentierung wird die Tabellenregion (TableRegion) annotiert. Eine Rekursion der Annotation von TextRegion oder verschachtelte Regionen ist auszuschließen.

Abbildung 1. Tabellenannotation im Programm Aletheia. Die braun gekennzeichnete Region ist die TableRegion. Die als paragraph bezeichneten Regionen sind einzelne TextRegion. Die Annotationen der TableRegion werden nicht im Bild gezeigt. Dazu siehe den Codeblock. Zu erkennen ist, dass die Attribute @rows und @columns mit den jeweiligen Werten 8 Zeilen und 3 Spalten angeben. Die bei den Tabellen Zellen,am Kopf der Tabelle z.B. die TextRegion r3 wurde das Merkmal TableHeader mit dem Wert true annotiert. Desweiteren sind die GridPoints (Rasterpunkte) des Tabellennetzes angegeben.
Abbildung 2. Annotationsbeispiel im Tabellen Level 4. Diese Daten können Sie im Beispiel Repositorium gt-guideline-examples finden.

<TableRegion id="r2" rows="8" columns="3">
    <Coords points="50,328 50,588 639,588 639,328"/>
    <TextRegion id="r3" type="paragraph">
        <Coords points="53,331 444,331 444,359 53,359"/>
        <Roles>
            <TableCellRole rowIndex="0" columnIndex="0" header="true"/>
        </Roles>
        <TextLine id="l29">
            <Coords points="53,331 444,331 444,359 53,359"/>
            <TextEquiv>
                <Unicode/>
            </TextEquiv>
        </TextLine>
        <TextEquiv>
            <Unicode/>
        </TextEquiv>
    </TextRegion>
    <TextRegion id="r4" type="paragraph">
        <Coords points="448,331 535,331 535,359 448,359"/>
        <Roles>
            <TableCellRole rowIndex="0" columnIndex="1" header="true"/>
        </Roles>
        <TextLine id="l30">
            <Coords points="448,331 535,331 535,359 448,359"/>
            <TextEquiv>
                <Unicode>Perſonen.</Unicode>
            </TextEquiv>
        </TextLine>
        <TextEquiv>
            <Unicode>Perſonen.</Unicode>
        </TextEquiv>
    </TextRegion>
    <TextRegion id="r5" type="paragraph">
        <Coords points="539,331 637,331 637,359 539,359"/>
        <Roles>
            <TableCellRole rowIndex="0" columnIndex="2" header="true"/>
        </Roles>
        <TextLine id="l31">
            <Coords points="539,331 637,331 637,359 539,359"/>
            <TextEquiv>
                <Unicode>Prozent.</Unicode>
            </TextEquiv>
        </TextLine>
        <TextEquiv>
            <Unicode>Prozent.</Unicode>
        </TextEquiv>
    </TextRegion>
    <TextRegion id="r6" type="paragraph">
        <Coords points="53,363 444,363 444,391 53,391"/>
        <Roles>
            <TableCellRole rowIndex="1" columnIndex="0"/>
        </Roles>
        <TextLine id="l32">
            <Coords points="53,363 444,363 444,391 53,391"/>
            <TextEquiv>
                <Unicode>die Gewerbe im engeren Sinne</Unicode>
            </TextEquiv>
        </TextLine>
        <TextEquiv>
            <Unicode>die Gewerbe im engeren Sinne</Unicode>
        </TextEquiv>
    </TextRegion>
    <TextRegion id="r7" type="paragraph">
        <Coords points="448,363 535,363 535,391 448,391"/>
        <Roles>
            <TableCellRole rowIndex="1" columnIndex="1"/>
        </Roles>
        <TextLine id="l33">
            <Coords points="448,363 535,363 535,391 448,391"/>
            <TextEquiv>
                <Unicode>1050</Unicode>
            </TextEquiv>
        </TextLine>
        <TextEquiv>
            <Unicode>1050</Unicode>
        </TextEquiv>
    </TextRegion>
    <TextRegion id="r9" type="paragraph">
        <Coords points="539,363 637,363 637,391 539,391"/>
        <Roles>
            <TableCellRole rowIndex="1" columnIndex="2"/>
        </Roles>
        <TextLine id="l34">
            <Coords points="539,363 637,363 637,391 539,391"/>
            <TextEquiv>
                <Unicode>58,3</Unicode>
            </TextEquiv>
        </TextLine>
        <TextEquiv>
            <Unicode>58,3</Unicode>
        </TextEquiv>
    </TextRegion>
    <TextRegion id="r10" type="paragraph">
        <Coords points="53,395 444,395 444,424 53,424"/>
        <Roles>
            <TableCellRole rowIndex="2" columnIndex="0"/>
        </Roles>
        <TextLine id="l35">
            <Coords points="53,395 444,395 444,424 53,424"/>
            <TextEquiv>
                <Unicode>die Urproduktion</Unicode>
            </TextEquiv>
        </TextLine>
        <TextEquiv>
            <Unicode>die Urproduktion</Unicode>
        </TextEquiv>
    </TextRegion>
    <TextRegion id="r11" type="paragraph">
        <Coords points="448,395 535,395 535,424 448,424"/>
        <Roles>
            <TableCellRole rowIndex="2" columnIndex="1"/>
        </Roles>
        <TextLine id="l36">
            <Coords points="448,395 535,395 535,424 448,424"/>
            <TextEquiv>
                <Unicode>330</Unicode>
            </TextEquiv>
        </TextLine>
        <TextEquiv>
            <Unicode>330</Unicode>
        </TextEquiv>
    </TextRegion>
    <TextRegion id="r12" type="paragraph">
        <Coords points="539,395 637,395 637,424 539,424"/>
        <Roles>
            <TableCellRole rowIndex="2" columnIndex="2"/>
        </Roles>
        <TextLine id="l37">
            <Coords points="539,395 637,395 637,424 539,424"/>
            <TextEquiv>
                <Unicode>18,3</Unicode>
            </TextEquiv>
        </TextLine>
        <TextEquiv>
            <Unicode>18,3</Unicode>
        </TextEquiv>
    </TextRegion>
    <TextRegion id="r14" type="paragraph">
        <Coords points="53,428 444,428 444,456 53,456"/>
        <Roles>
            <TableCellRole rowIndex="3" columnIndex="0"/>
        </Roles>
        <TextLine id="l38">
            <Coords points="53,428 444,428 444,456 53,456"/>
            <TextEquiv>
                <Unicode>Handel, Verkehr und Gaſtwirtſchaft</Unicode>
            </TextEquiv>
        </TextLine>
        <TextEquiv>
            <Unicode>Handel, Verkehr und Gaſtwirtſchaft</Unicode>
        </TextEquiv>
    </TextRegion>
    <TextRegion id="r15" type="paragraph">
        <Coords points="448,428 535,428 535,456 448,456"/>
        <Roles>
            <TableCellRole rowIndex="3" columnIndex="1"/>
        </Roles>
        <TextLine id="l39">
            <Coords points="448,428 535,428 535,456 448,456"/>
            <TextEquiv>
                <Unicode>230</Unicode>
            </TextEquiv>
        </TextLine>
        <TextEquiv>
            <Unicode>230</Unicode>
        </TextEquiv>
    </TextRegion>
    <TextRegion id="r16" type="paragraph">
        <Coords points="539,428 637,428 637,456 539,456"/>
        <Roles>
            <TableCellRole rowIndex="3" columnIndex="2"/>
        </Roles>
        <TextLine id="l40">
            <Coords points="539,428 637,428 637,456 539,456"/>
            <TextEquiv>
                <Unicode>12,8</Unicode>
            </TextEquiv>
        </TextLine>
        <TextEquiv>
            <Unicode>12,8</Unicode>
        </TextEquiv>
    </TextRegion>
    <TextRegion id="r17" type="paragraph">
        <Coords points="53,460 444,460 444,488 53,488"/>
        <Roles>
            <TableCellRole rowIndex="4" columnIndex="0"/>
        </Roles>
        <TextLine id="l41">
            <Coords points="53,460 444,460 444,488 53,488"/>
            <TextEquiv>
                <Unicode>Lohnarbeit unbeſtimmter Art</Unicode>
            </TextEquiv>
        </TextLine>
        <TextEquiv>
            <Unicode>Lohnarbeit unbeſtimmter Art</Unicode>
        </TextEquiv>
    </TextRegion>
    <TextRegion id="r18" type="paragraph">
        <Coords points="448,460 535,460 535,488 448,488"/>
        <Roles>
            <TableCellRole rowIndex="4" columnIndex="1"/>
        </Roles>
        <TextLine id="l42">
            <Coords points="448,460 535,460 535,488 448,488"/>
            <TextEquiv>
                <Unicode>60</Unicode>
            </TextEquiv>
        </TextLine>
        <TextEquiv>
            <Unicode>60</Unicode>
        </TextEquiv>
    </TextRegion>
    <TextRegion id="r19" type="paragraph">
        <Coords points="539,460 637,460 637,488 539,488"/>
        <Roles>
            <TableCellRole rowIndex="4" columnIndex="2"/>
        </Roles>
        <TextLine id="l43">
            <Coords points="539,460 637,460 637,488 539,488"/>
            <TextEquiv>
                <Unicode>3,3</Unicode>
            </TextEquiv>
        </TextLine>
        <TextEquiv>
            <Unicode>3,3</Unicode>
        </TextEquiv>
    </TextRegion>
    <TextRegion id="r20" type="paragraph">
        <Coords points="53,492 444,492 444,521 53,521"/>
        <Roles>
            <TableCellRole rowIndex="5" columnIndex="0"/>
        </Roles>
        <TextLine id="l44">
            <Coords points="53,492 444,492 444,521 53,521"/>
            <TextEquiv>
                <Unicode>Oeffentlichen Dienſt</Unicode>
            </TextEquiv>
        </TextLine>
        <TextEquiv>
            <Unicode>Oeffentlichen Dienſt</Unicode>
        </TextEquiv>
    </TextRegion>
    <TextRegion id="r21" type="paragraph">
        <Coords points="448,492 535,492 535,521 448,521"/>
        <Roles>
            <TableCellRole rowIndex="5" columnIndex="1"/>
        </Roles>
        <TextLine id="l45">
            <Coords points="448,492 535,492 535,521 448,521"/>
            <TextEquiv>
                <Unicode>60</Unicode>
            </TextEquiv>
        </TextLine>
        <TextEquiv>
            <Unicode>60</Unicode>
        </TextEquiv>
    </TextRegion>
    <TextRegion id="r22" type="paragraph">
        <Coords points="539,492 637,492 637,521 539,521"/>
        <Roles>
            <TableCellRole rowIndex="5" columnIndex="2"/>
        </Roles>
        <TextLine id="l46">
            <Coords points="539,492 637,492 637,521 539,521"/>
            <TextEquiv>
                <Unicode>3,3</Unicode>
            </TextEquiv>
        </TextLine>
        <TextEquiv>
            <Unicode>3,3</Unicode>
        </TextEquiv>
    </TextRegion>
    <TextRegion id="r23" type="paragraph">
        <Coords points="53,525 444,525 444,553 53,553"/>
        <Roles>
            <TableCellRole rowIndex="6" columnIndex="0"/>
        </Roles>
        <TextLine id="l47">
            <Coords points="53,525 444,525 444,553 53,553"/>
            <TextEquiv>
                <Unicode>Liberale Berufsarten</Unicode>
            </TextEquiv>
        </TextLine>
        <TextEquiv>
            <Unicode>Liberale Berufsarten</Unicode>
        </TextEquiv>
    </TextRegion>
    <TextRegion id="r24" type="paragraph">
        <Coords points="448,525 535,525 535,553 448,553"/>
        <Roles>
            <TableCellRole rowIndex="6" columnIndex="1"/>
        </Roles>
        <TextLine id="l48">
            <Coords points="448,525 535,525 535,553 448,553"/>
            <TextEquiv>
                <Unicode>30</Unicode>
            </TextEquiv>
        </TextLine>
        <TextEquiv>
            <Unicode>30</Unicode>
        </TextEquiv>
    </TextRegion>
    <TextRegion id="r25" type="paragraph">
        <Coords points="539,525 637,525 637,553 539,553"/>
        <Roles>
            <TableCellRole rowIndex="6" columnIndex="2"/>
        </Roles>
        <TextLine id="l49">
            <Coords points="539,525 637,525 637,553 539,553"/>
            <TextEquiv>
                <Unicode>1,7</Unicode>
            </TextEquiv>
        </TextLine>
        <TextEquiv>
            <Unicode>1,7</Unicode>
        </TextEquiv>
    </TextRegion>
    <TextRegion id="r26" type="paragraph">
        <Coords points="53,557 444,557 444,586 53,586"/>
        <Roles>
            <TableCellRole rowIndex="7" columnIndex="0"/>
        </Roles>
        <TextLine id="l50">
            <Coords points="53,557 444,557 444,586 53,586"/>
            <TextEquiv>
                <Unicode>Verſchiedene</Unicode>
            </TextEquiv>
        </TextLine>
        <TextEquiv>
            <Unicode>Verſchiedene</Unicode>
        </TextEquiv>
    </TextRegion>
    <TextRegion id="r27" type="paragraph">
        <Coords points="448,557 535,557 535,586 448,586"/>
        <Roles>
            <TableCellRole rowIndex="7" columnIndex="1"/>
        </Roles>
        <TextLine id="l51">
            <Coords points="448,557 535,557 535,586 448,586"/>
            <TextEquiv>
                <Unicode>40</Unicode>
            </TextEquiv>
        </TextLine>
        <TextEquiv>
            <Unicode>40</Unicode>
        </TextEquiv>
    </TextRegion>
    <TextRegion id="r28" type="paragraph">
        <Coords points="539,557 637,557 637,586 539,586"/>
        <Roles>
            <TableCellRole rowIndex="7" columnIndex="2"/>
        </Roles>
        <TextLine id="l52">
            <Coords points="539,557 637,557 637,586 539,586"/>
            <TextEquiv>
                <Unicode>2,3</Unicode>
            </TextEquiv>
        </TextLine>
        <TextEquiv>
            <Unicode>2,3</Unicode>
        </TextEquiv>
    </TextRegion>
    <Grid>
        <GridPoints index="0" points="51,328 446,328 537,328 639,328"/>
        <GridPoints index="1" points="51,361 446,361 537,361 639,361"/>
        <GridPoints index="2" points="51,393 446,393 537,393 639,393"/>
        <GridPoints index="3" points="51,426 446,426 537,426 639,426"/>
        <GridPoints index="4" points="51,458 446,458 537,458 639,458"/>
        <GridPoints index="5" points="51,490 446,490 537,490 639,490"/>
        <GridPoints index="6" points="51,523 446,523 537,523 639,523"/>
        <GridPoints index="7" points="51,555 446,555 537,555 639,555"/>
        <GridPoints index="8" points="51,588 446,588 537,588 639,588"/>
    </Grid>
</TableRegion>